앞으로 생각 지능형 비서 : siri 이후에 오는 것은 무엇입니까?

지능형 비서 : siri 이후에 오는 것은 무엇입니까?

비디오: Hì i í ì i í i i ì í ì (십월 2024)

비디오: Hì i í ì i í i i ì í ì (십월 2024)
Anonim

인텔리전트 어시스턴트 (Siri, Google Now, Cortana 등)는 몇 년 전 호기심과 시술에서 많은 사람들이 일상 생활에서 사용하는 필수 도구로 전환했습니다. 지난 주, 저는 뉴욕의 인텔리전트 어시스턴트 컨퍼런스 (Optical Assistants Conference)에서 Opus Research가 발표했으며, 특정 에이전트 구축에있어 금융, 보험 및 의료 회사의 발전을 포함하여 다양한 산업에서 소프트웨어가 진행하고있는 과정에 깊은 인상을 받았습니다..

Opus Research의 설립자 인 Dan Miller는 음성 인식과 같은 많은 핵심 기술이 20 년 이상 사용되어 왔다고 설명했습니다. 그는 최근에 혁명이 아닌 몇 가지 큰 개선을 보았지만 다른 기능을 가진 연속체에 많은 제품이있는 "우리는 진화하는 길에있다"고 말했다. 그는 고정 된 데이터 세트를 사용하여 간단한 텍스트 기반 대화를 일반 영어로 사용하고 웹 사이트 탐색이나 FAQ와 같은 작업에 사용할 수있는 수백 개의 엔터프라이즈 인텔리전트 어시스턴트가 있다고 언급했습니다. 스펙트럼의 다른 쪽 끝에는 대화와 상황을 더 잘 인식하는 수십 개의 "동적 인간 느낌 앱"이있을 것입니다.

Miller는 컨퍼런스에서 수상한 애플리케이션을 지적했습니다. Amtrak의 Julie는 몇 년 전에 대화 형 음성 응답 전화 서비스 에이전트로 시작했지만 이제는 Next IT의 에이전트를 기반으로 Amtrak.com을 통해 여행자를 안내하기 위해 웹 사이트에서 작동하는 에이전트로 발전했습니다. Telefonica Mexico에는 아바타가있는 Nico라는 에이전트가 있으며 AgentBot의 플랫폼을 기반으로 Twitter와 Facebook을 통해 지원을 제공합니다. ING Netherlands에는 Nuance의 음성 생체 인식 기술을 사용하여 은행 계좌 잔고를 확인하거나 음성을 통해 돈을 이체하여 신원을 인증 할 수있는 앱이 있습니다.

건강 관리 계획을 선택하는 데 도움이되는 앱과 같은 건강 관리 응용 프로그램이 있습니다. 제가 쇼에서들은 다른 응용 프로그램으로는 도미노 피자 (Domino 's Pizza)가 있습니다.이 피자에는 돔을 사용하여 피자를 주문할 수있는 앱이 있습니다. Up2drive 자동 파이낸싱 암의 일부로 가상 에이전트를 보유한 BMW.

Nuance의 Brett Beraneck은 딥 러닝 신경망의 발전으로 음성 인식뿐만 아니라 자연어 이해와 같은 기능이 어떻게 개선되었으며, 현재이 분야에서 더 많은 관심을 가질 수 있도록 어떻게 통합되는지에 대해 이야기했습니다. Nuance의 Nina 어시스턴트는 초기 사례였으며 그 이후로 보험 회사의 대화 형 음성 응답 시스템에서 쇼핑 앱에 이르기까지 다양한 애플리케이션으로 성장했습니다. 이러한 각 응용 프로그램은 수행하려는 작업에 따라 다른 성격을 갖습니다.

그가 논의한 한 가지 큰 새로운 기능은 음성 생체 인식으로, 음성이 암호를 대체합니다. 그는 유럽의 ING과 같은 회사가 어떻게 음성 인식과 자연어 처리를 사용하고 발신자를 인식하기 위해 음성을 사용하는 에이전트를 개발하고 있는지에 대해 이야기했습니다. 그는 이것이 기존의 암호보다 안전하고 자연 스럽다고 말했다.

최근 연구에 따르면 음성 녹음이 그러한 시스템을 속일 수 있다고 걱정했지만 Nuance는 오늘날의 기술에는 녹음 된 음성에서 이상을 포착하고 다른 관점을 취하는 다른 연구를 지적하는 기능이 포함되어 있다고 지적했습니다. 또한 디자이너는 간단한 인식을 사용하여 계정 잔액을 확인하거나 상당한 금액의 이체를 위해 임의의 단어 시퀀스를 반복하도록 요구하는 등 다양한 기능에 대해 다른 수준의 음성 생체 인식을 사용할 수 있다고 말했다.

음성 생체 인식은 확실히 약간의 견인력을 얻고있는 것 같습니다. 지난 주 Gartner Symposium에서 금융 서비스의 "멋진 고객 사례"세션에는이 기능을 사용한 Citibank 앱이 포함되었습니다.

MyWave에는 Frank라는 비서가있어 여러 비즈니스에서 각 비즈니스를 자체 개발하지 않고보다 대화 방식으로 상호 작용할 수 있도록 지원합니다. 첫 번째 용도로는 뉴질랜드 은행과 전기 공급 업체 선택을 돕기 위해 설계된 Saveawatt라는 앱이 있습니다.

CEO Geraldine McBride는 회사가 기존 CRM 애플리케이션의 스핀 인 "고객 관리 관계"또는 CMR이라고하는 고객과 서비스 앱 간의 격차를 해소하는 조수를 만들려고 노력하고 있다고 설명했습니다. 그녀가 말한 큰 차이점은 고객이 비즈니스가 아닌 모든 데이터를 담당한다는 것입니다.

비교적 새로운 또 다른 회사 인 Expect Labs에는 기존 인터페이스를 대체하고 질문과 답변을 처리하기 위해 음성 인터페이스를 제공하려는 여러 회사의 백엔드로 작동하는 MindMeld라는 제품이 있습니다. 이름을 묻고 시스템이 여러 시스템을 쿼리하도록하여 TV 프로그램 시청과 같은 다양한 응용 프로그램에 사용할 수 있습니다. (Amazon의 Fire TV에는 이러한 기능 중 일부가 있지만 케이블 셋톱 박스와 통합되어 있지 않지만 Expect Labs의 투자자 중 하나는 케이블 회사 Liberty Global입니다.)

팀 터틀 (Tim Tuttle) CEO는 MindMeld가 대부분의 장치에서 이미 사용 가능한 음성 인식을 사용하는 경향이 있으며 대신 자연어 이해와 사용 가능한 정보에 대한 지식 그래프 작성에 중점을두고 있다고 설명했습니다. 그는 회사가 여러 소스의 더 많은 정보를 포함하도록 시스템을 확장하고 이러한 시스템의 일부인 다양한 범주의 정보 계층을 세분화하려고 노력하고 있다고 말했다. 실제로 질문을 이해한다는 것은 다양한 범주에서 의도를 이해할 수 있다는 것을 의미한다고 그는 말했다.

여러 참석자에게서 한 가지 소식은 모든 웹 검색의 약 10 %가 이제 정보 에이전트를 통해 수행되고 있다는 통계입니다. (AI의 선구자 앤드류 응 (Andrew Ng)은 작년 바이두 (Baidu)에서 음성 검색에 해당하는 것이 사실이며 일부 사람들은 이것이 구글에서도 사실이라고 말했지만 직접 확인을 듣지 못했다.)

Opus Research의 Miller는 앞으로도 아직 많은 작업이 진행될 것이라고 말했습니다. 시스템의 기본 정확도는 개선 할 여지가 충분합니다. 특히 말한 내용에서 결과로 수행 할 내용으로 이동하는 경우 특히 그렇습니다. 그는 회의에서 제록스 PARC CEO 스티븐 후버 (Stephen Hoover)의 발표를 언급했다. 시스템. Miller는 시스템이 대화 상대를 알고 있으면 더 나은 결과를 얻을 수 있기 때문에 더 나은 개인화의 여지가 있다고 말했다. 예를 들어, 그는 사용자가 로그인했기 때문에 Facebook이 시스템을 사용하는 사람을 알고 있다고 지적했습니다. 더 많은 에이전트와 함께이 작업을 원활하게 수행하는 것이 더 중요해질 것이라고 말했습니다.

그것은 확실히 매혹적인 범주이며, 우리 모두 전화와 컴퓨터와 대화하고 인간이 아닌 에이전트와 대화하는 데 더 많은 시간을 할애 할 것으로 기대합니다. 요즘 컴퓨팅에서 가장 흥미로운 트렌드 중 하나입니다.

지능형 비서 : siri 이후에 오는 것은 무엇입니까?