의견 ai, ml가 음성을 텍스트로 변환하고 언어를 번역하는 방법 | 팀 바 하린

ai, ml가 음성을 텍스트로 변환하고 언어를 번역하는 방법 | 팀 바 하린

비디오: [다시보는 맥월드]스티브잡스 식(式) 프리젠테이션 ì‹ê³„ëª (십월 2024)

비디오: [다시보는 맥월드]스티브잡스 식(式) 프리젠테이션 ì‹ê³„ëª (십월 2024)
Anonim

Google I / O에서 가장 인상적인 데모 중 하나는 약속을 예약하기 위해 비즈니스 장소 (이 경우 미용실 및 식당)를 호출 한 인공 지능 인 Duplex였습니다. 라인의 다른 쪽 끝의 인간은 현명한 사람이 아니었고, 듀플렉스는 식당이 소규모 파티 예약을 수락하지 않았다고 말했을 때와 같이 쉽게 도전을 처리했습니다.

이 AI 발표는 Google I / O에서 많은 내용을 다루었지만 개발자 회의에서 보여준 모든 제품과 서비스에서 AI와 기계 학습이 널리 퍼졌습니다. I / O가 시작되기 전날 AI 중심 분석 이벤트에 Google이 표시 한이 차트를 살펴보십시오.

그 사건에서 내가 잠재적 인 게임 체인저를 고려한 다른 두 가지가 있었다.

첫 번째는 AI를 음성에서 텍스트로 변환하는 방법입니다. 목표는 향후 몇 년 동안 AI와 ML을 사용하여 99 %의 정확도를 달성하는 것입니다. 즉, 다양한 G-Suite 애플리케이션에 의견을 표시 한 데모는 이미 매우 정확했습니다. 또한 사람이 Gmail로 문장을 쓰고 Smart Compose가 첫 번째 문장의 맥락에 따라 다음 문장을 쓰는 Smart Compose에 대한보다 심층적 인 데모를 보았습니다.

Dragon Dictate와 같은 다양한 음성 인식 제품이 수년간 시장에 출시되었습니다. 그러나 이러한 프로그램은 현지화 된 소프트웨어를 사용했으며 각 릴리스 시점에 사용 가능한 현재 처리 능력을 활용했습니다. 이러한 프로그램은 수년에 걸쳐 향상되었지만 AI와 ML을 광고하면 정확도가 향상됩니다.

Google은 일상 생활과 관련된 음성 텍스트의 중요성을 이해합니다. 운전 중에 메시지에 응답 할 때 정확한 음성-텍스트 인터페이스가 중요합니다. 웨어러블 또는 스마트 폰에서 이메일 또는 문자 메시지에 응답하는 의미있는 방법입니다. 다양한 현실 유형의 AR 애플리케이션을 위해 내비게이션 프로세스의 일부로 음성을 사용하고 텍스트에 음성을 사용해야하는 혼합 현실 안경을 사용할 때 결국 귀중한 입력이 될 것입니다.

두 번째는 Google Translate에서 AI와 ML을 사용하는 방법으로, 실시간으로 번역이 이루어질 때 진정으로 변형됩니다. 영어 만 구사하는 국제 여행자로서 이런 유형의 번역은 신의 선물이 될 것입니다. 말한 내용을 현지 언어로 번역하려고 시도하는 일부 휴대용 장치가 있지만 현재 많은 제한이 있습니다.

Google은 이러한 유형의 번역을 주시하고 있으므로 Android 휴대 전화에서보다 정확한 언어 번역을 통해 실질적인 혁신을 볼 수 있다고 확신하는 것이 안전합니다. Apple은 또한 음성 및 텍스트 번역의 다양한 측면에 대한 AI 및 ML 연구를 진행하고 있으며 잠재적 파트너와 함께 언젠가 iOS에서 모바일 언어 번역 솔루션을 제공 할 수 있습니다.

AI와 ML은 음성을 텍스트로 변환하는 데 큰 영향을 미치며, 가장 두드러진 효과는 AR 및 VR UI 또는 혼합 현실 안경 UI의 일부일 수 있습니다. 개인적으로 언어 번역은 세상을 더 쉽게 여행 할 수있게 해주므로 가장 흥분됩니다.

ai, ml가 음성을 텍스트로 변환하고 언어를 번역하는 방법 | 팀 바 하린