집 의견 alexa의 실수로부터 배우기

alexa의 실수로부터 배우기

2024

차례:

너무 많은 구름 의존
맥락과 의도
우리가해야 할 일
그동안…

Amazon Echo 디바이스는 최근에 사용자의 개인 대화를 녹음하여 지식과 동의없이 연락처 중 하나로 보냈습니다. 이로 인해 스마트 스피커의 보안 및 개인 정보 보호에 대한 우려가 제기됩니다. 그러나 나중에 알 수 있듯이 Alexa의 이상한 행동은 사악한 간첩 음모의 일부가 아니라 오히려 스마트 스피커의 작동 방식으로 인한 일련의 연결 실패로 인해 발생했습니다.

아마존에서 제공 한 계정에 따르면: "알렉사 (Alexa)"와 같은 배경 대화의 단어 때문에 에코가 일어났다. 이후 대화는 '메시지 보내기'요청으로 들렸는데, 어느 시점에서 Alexa는 '누구에게?' 어느 시점에서 배경 대화가 고객의 대화 상대 목록에있는 이름으로 해석 된 후 Alexa가 큰 소리로 물었습니다. Alexa는 배경 대화를 '올바른'것으로 해석했습니다. 이러한 일련의 사건과는 달리이 사건을 덜 가능성있게 만드는 옵션을 평가하고 있습니다."

시나리오는 매우 드물게 발생하는 사건의 경우입니다. 그러나 에코 및 기타 소위 "스마트"장치에 전원을 공급하는 인공 지능 기술의 한계에 대한 흥미로운 연구이기도합니다.

너무 많은 구름 의존

음성 명령을 이해하기 위해 Echo 및 Google Home과 같은 스마트 스피커는 광범위한 컴퓨팅 성능이 필요한 딥 러닝 알고리즘을 사용합니다. 로컬로 작업을 수행 할 컴퓨팅 리소스가 없으므로 AI 알고리즘이 음성 데이터를 텍스트로 변환하고 명령을 처리하는 제조업체의 클라우드 서버로 데이터를 보내야합니다.

그러나 스마트 스피커는 듣는 모든 것을 클라우드 서버로 전송할 수 없습니다. 제조업체가 서버에 과도한 양의 데이터를 저장해야하므로 대부분 쓸모가 없습니다. 사용자 가정에서 발생하는 개인 대화를 실수로 녹음하고 저장하면 개인 정보 보호 문제가 발생할 수 있으며, 특히 기술 회사가 데이터를 저장하고 사용하는 방법을 심각하게 제한하는 새로운 데이터 개인 정보 보호 규정으로 인해 제조업체에 문제가 발생할 수 있습니다.

그렇기 때문에 사용자가 "Alexa"또는 "Hey Google"과 같은 깨어 난 단어를 말한 후 스마트 스피커가 트리거되도록 설계되었습니다. 깨어 난 단어를들은 후에야 분석 및 처리를 위해 마이크의 오디오 입력을 클라우드로 보내기 시작합니다.

이 기능은 프라이버시를 향상 시키지만 최근 Alexa 사건이 강조되면서 자체적 인 과제를 제시합니다.

Conversocial의 CEO 인 Joshua March는 "단어 나 아주 비슷한 소리가 대화를 통해 반쯤 보내면 이전의 상황은 없을 것"이라고 말합니다. "이 시점에서 메시징 앱과 같이 설정 한 기술과 관련된 모든 명령을 듣지 못하고 있습니다. 대부분의 경우 Alexa가주의를 기울이는 컨텍스트를 제한하여 개인 정보 보호 기능이 크게 향상되었습니다. 이 경우 역효과를 겪었지만 정상적인 대화를 녹음하거나 듣지 않습니다."

엣지 컴퓨팅의 발전은이 문제를 완화하는 데 도움이 될 수 있습니다. AI와 딥 러닝이 점점 더 많은 장치와 응용 프로그램에 적용됨에 따라 일부 하드웨어 제조업체는 클라우드 리소스에 너무 의존하지 않고 AI 작업을 수행하는 데 특화된 프로세서를 만들었습니다. Edge AI 프로세서는 Echo와 같은 장치가 모든 데이터를 클라우드로 전송하여 사용자의 개인 정보를 침해하지 않으면 서 대화를 더 잘 이해하고 처리 할 수 있도록 도와줍니다.

맥락과 의도

아마존 AI는 이질적이고 단편적인 오디오를 수신하는 것 외에도 인간 대화의 뉘앙스를 이해하는 데 어려움을 겪고 있습니다.

"지난 몇 년 동안 딥 러닝이 크게 발전하면서 소프트웨어가 음성과 이미지를 그 어느 때보 다 더 잘 이해할 수있게했지만 여전히 많은 한계가 있습니다."라고 March은 말합니다. "보이스 어시스턴트는 당신이 말하는 단어를 인식 할 수 있지만, 그 의미 나 의도에 대한 실질적인 이해가 반드시 필요한 것은 아닙니다. 세계는 복잡한 곳이지만 오늘날의 모든 AI 시스템은 매우 잘 처리 할 수 있습니다. 구체적이고 좁은 사용 사례"

예를 들어, 우리 인간은 음성 톤 또는 시각적 신호를 따르는 것과 같이 문장이 우리를 향한 것인지 여부를 결정하는 많은 방법을 가지고 있습니다.

반대로 Alexa는 "A"단어가 포함 된 문장의 수신자라고 가정합니다. 그렇기 때문에 사용자가 실수로 실수하는 경우가 종종 있습니다.

문제의 일부는 우리가 현재 AI 응용 프로그램의 기능을 과장하여 종종 인간의 마음과 동등하거나 위에 놓고 너무 많은 신뢰를 얻는다는 것입니다. 그래서 우리는 그들이 실패 할 때 놀랐습니다.

Starmind의 신경 과학자이자 창립자 인 Pascal Kaufmann은“이 문제의 일부는 'AI'라는 용어가 너무 적극적으로 판매되어 소비자들이이 용어와 관련된 제품에 대해 과도하게 많은 믿음을 두었다는 것이다. "이 이야기는 Alexa가 많은 기능을 가지고 있으며, 언제 어떻게 적절하게 적용해야하는지에 대한 이해가 제한적임을 보여줍니다."

학습 된 데이터 및 시나리오에서 벗어난 설정에 직면 할 때 딥 러닝 알고리즘이 실패하기 쉽습니다. Kaufmann은“인간 AI의 특징 중 하나는 자급 자족 능력과 컨텐츠에 대한 진정한 이해가 될 것입니다. "이것은 진정으로 인공 지능 '지능형'으로 간주하고 개발에 필수적이라고 생각하는 중요한 부분입니다. 인간의 본성을 완전히 이해하는 자각 형 디지털 어시스턴트를 만들면 재미있는 참신함에서 진정한 것으로 변신 할 것입니다. 유용한 도구."

그러나 일반 AI라고도하는 인간 수준 AI를 만드는 것이 말보다 쉽습니다. 수십 년 동안, 우리는 기술 발전이 인간의 마음이 얼마나 복잡한지를 보여 주었을 때만 놀라게 될 것이라고 생각했습니다. 많은 전문가들은 일반적인 AI를 쫓는 것이 무의미하다고 생각합니다.

한편, 좁은 인공 지능 (현재의 인공 지능 기술이 설명되어 있음)은 여전히 많은 기회를 제공하며 반복되는 실수를 피하기 위해 고칠 수 있습니다. 명확하게, 딥 러닝과 머신 러닝은 아직 초기 단계이며, Amazon과 같은 회사는 AI 알고리즘을 지속적으로 업데이트하여 항상 발생할 때마다 최신 사례를 처리합니다.

우리가해야 할 일

아토믹 X의 CTO 인 에릭 몰러 (Eric Moller)는“이것은 젊고 신흥 분야이다. 자연어 이해는 특히 초기 단계에 있기 때문에 우리가 할 수있는 일은 많다.

Moller는 음성 분석 AI 알고리즘을 조정하여 억양과 변곡을 더 잘 이해할 수 있다고 생각합니다. Moller는 "광범위한 문장에서 'Alexa'라는 단어를 사용하는 것은 호출이나 명령과 다른 소리로 들린다. Alexa는 그 이름을 전달하면서 그 이름을 말했기 때문에 깨어나지 말아야한다." 충분한 훈련을 통해 AI는 스마트 스피커를 향한 특정 톤을 구별 할 수 있어야합니다.

또한 기술 회사는 AI와 직접 대화하는 대신 배경 소음을 수신 할 때 구별 할 수 있도록 훈련시킬 수 있습니다. 몰러는“백그라운드 채터는 인간이 선택하고 선택적으로 튜닝하는 데 매우 유용한 독특한 청각 적 '서명'을 가지고있다. 우리가 AI 모델을 훈련시킬 수없는 이유는 없다”고 말했다.

예방책으로 AI 보조원은 자신이 내리는 결정의 영향을 평가하고 잠재적으로 민감한 일을하려는 경우 사람의 결정을 포함해야합니다. 제조업체는 사용자의 명시적인 동의없이 민감한 정보가 전송되는 것을 방지하기 위해 기술에 더 많은 보호 조치를 취해야합니다.

Tonkean의 CEO 인 Sagi Eliyahi는 "Amazon이 Alexa가 해석 한 조치를 확인하려고 시도했다고보고했지만 일부 조치는보다 신중하게 관리하고 사용자의 의도에 대한 더 높은 수준의 확인을 유지해야합니다"라고 Tonkean의 CEO Sagi Eliyahi는 말합니다. "인간은 동일한 음성 인식 문제를 가지고 있으며 때로는 요청을 잘못 듣습니다. Alexa와 달리 인간은 명확하지 않은 요청을 이해하고 더 중요하게는 과거 요청과 비교하여 요청의 가능성을 측정 할 가능성이 높습니다."

그동안…

기술 회사는 AI 응용 프로그램을 미세 조정하여 실수를 줄이지 만 사용자는 AI 기반 장치로 인해 발생할 수있는 잠재적 오류에 얼마나 노출 될 것인지 결정해야합니다.

데이터 과학 전문가이자 AI와 소프트웨어에 관한 여러 권의 책을 쓴 Doug Rose는“이러한 이야기는 사람들이 새로운 AI 기술의 약속에 반하여 기꺼이 공유하고자하는 데이터의 양과 충돌하는 것을 보여줍니다. "당신은 시리를 느리게 놀릴 수 있습니다. 그러나 그녀가 더 큰 지능을 달성하는 가장 좋은 방법은 우리 개인 대화에 침입하는 것입니다. 따라서 향후 10 년 동안이 AI 요원들이 우리 행동에 얼마나 많은 관심을 가질 수 있을지에 대한 주요 질문은 ?"

"어떤 가족이 거실에 인간 조수를 배치하고 그 사람이 항상 어떤 종류의 대화를들을 수있게 할 것입니까?" Starmind의 신경 과학자 인 Kaufmann은 말합니다. "우리는 개인 정보 보호, 비밀 또는 신뢰성과 관련하여 인간의 지능에 적용되는 이른바 'AI'장치에 동일한 표준을 적용해야합니다.