의견 Ai는 또한 좋은 힘이다 | 벤 딕슨

Ai는 또한 좋은 힘이다 | 벤 딕슨

차례:

비디오: Whitney Houston - I Will Always Love You (Official 4K Video) (십월 2024)

비디오: Whitney Houston - I Will Always Love You (Official 4K Video) (십월 2024)
Anonim

2017 년, 치명적인 신경계 장애인 근 위축성 측삭 경화증 (ALS)은 유명한 Ice Bucket Challenge의 창시자 인 Pat Quinn의 말 능력을 빼앗 았습니다.

2018 년에 인공 지능이이를 회복시키는 데 도움이되었습니다.

기계 학습 및 딥 러닝의 발전 덕분에 인공 지능 알고리즘은 인간을 모방하는 데 매우 능숙 해졌습니다. 그러나 우주에서 눈에 띄는 많은 발전이 부정적이지만 AI의 모방 력은 Quinn에게 긍정적 인 변화의 힘이었습니다.

Quinn과 같은 ALS 환자를 돕기위한 이니셔티브 인 Project Revoice의 공동 창립자 인 Oskar Westerdal은 "운동 신경계 질환으로도 알려진 ALS를 가진 대부분의 사람들은 마비되고 인공적인 '컴퓨터'음성 이외의 다른 것과는 의사 소통 할 수 없다"고 말했다..

Quinn의 음성을 재현하기 위해 Project Revoice는 AI를 사용하여 개인의 음성을 복제하는 소수의 회사 중 하나 인 Lyrebird와 공동 작업했습니다.이 그룹에는 AI를 사용하여 합성 된 음성 녹음을 생성하는 Y Combinator 지원 스타트 업인 Google의 WaveNet 및 Voicery도 포함됩니다..

딥 러닝이 인간의 목소리를 생성하는 방법

이러한 응용 프로그램 뒤에는 기존의 규칙 기반 소프트웨어로는 캡처 할 수없는 통찰력과 패턴을 위해 많은 데이터 세트를 관장하는 딥 러닝 알고리즘이 있습니다. 충분한 음성 녹음을 통해 딥 러닝 음성 신디사이저를 학습하면 사람의 음성을 나타내는 디지털 모델이 만들어지고 새로운 음성 샘플을 생성 할 수 있습니다.

AI 기반 음성 합성 기술이 출현하기 전에 ALS 환자는 자신이 아닌 일반적인 디지털 음성을 사용해야했습니다. 다른 기술은 사전 녹음 된 문장을 환자의 목소리와 함께 묶을 수 있지만 결과는 너무 인공적이어서 최소한의 사용을 위해 수십 시간의 음성 녹음이 필요했습니다.

반면에 딥 러닝 응용 프로그램은 훨씬 적은 데이터를 요구하고 더 나은 결과를 제공합니다. Westerdal은 "Leebird가 단 두 시간의 오디오로 달성 할 수있는 것은 놀랍습니다. 사람들에게 완벽한 디지털 음성 클론을 제공하여 원하는대로 말할 수 있습니다"라고 Westerdal은 말합니다.

무성한 사람의 목소리를 재현

딥 러닝 어플리케이션의 한계 중 하나는 신경망을 훈련시키기 위해 고품질 데이터 샘플에 의존한다는 것입니다. ALS 환자의 문제점은 일단 음성을 잃으면 음성 샘플을 녹음 할 수 없다는 것입니다. 다행히 Quinn은 몇 시간 동안 기조 연설과 인터뷰를 기록했습니다.

"가장 큰 과제는 품질이었습니다.이 기술은 정확한 스크립트를 따르는 일관된 고품질 레코딩을 제공하는 데 전적으로 의존합니다. 따라서 우리는 찾을 수있는 모든 대화 라인을 수동으로 '리마스터링'하고 녹음하기 위해 사운드 스튜디오와 협력해야했습니다. Westerdal은 말합니다.

Lyrebird의 공동 창립자 인 Jose Sotelo는“Pat의 목소리를 내기 위해 훌륭한 음질을 제공 할 수 없을 까봐 두려웠습니다. "우리는 깨끗한 녹음을 얻을 수 없었기 때문에 인공 음성의 최종 품질이 완벽하지 않습니다. 깨끗한 녹음으로 훨씬 나은 작업을 수행 할 수 있다고 생각합니다."

결과는 여전히 부자연스럽고 합성 적으로 들립니다. 그러나 일반적인 음성을 사용하여 의사 소통을해온 Quinn에게는 그 차이가 극적으로 나타났습니다. "이 새로운 기술을 통해 내 목소리를들은 후, 나는 날아 갔다! ALS가 그것을 빼낸 후 환자들이 자신의 목소리를 가질 수 있다는 것을 알기 위해, 사람들이 ALS와 함께 사는 방식을 바꿀 것"이라고 그는 말했다.

Quinn은 ALS 환자가 너무 늦기 전에 자신의 목소리를 녹음 할 것을 권장합니다. "나 자신의 목소리를 다시들은 후에, ALS 환자는 그들의 목소리를 녹음하는 것이 매우 중요하다는 것을 알아야합니다."

AI 신시사이저의 부정적인 사용 균형

올해 초 AI 기반 얼굴 스와핑 응용 프로그램 인 FakeApp는 유명인과 정치인이 등장하는 가짜 포르노 비디오를 공격했습니다. FakeApp 및 Lyrebird와 같은 응용 프로그램이 새로운 시대의 가짜 뉴스, 사기 및 위조를 일으킬 우려가 있습니다.

Lyrebird 웹 사이트의 윤리 페이지는 이전에이 기술이 "오해의 소지가있는 외교관, 사기, 더 일반적으로 다른 사람의 신원을 도용하여 발생하는 다른 문제와 같은 위험한 결과를 초래할 수 있음"을 인정했습니다.

요컨대이 회사의 웹 사이트에는 Donald Trump와 Barack Obama의 목소리로 만든 여러 가지 합성 녹음이 있습니다.

Replying to @instiz https ᄏ ᄏ ᄏ ᄏ ᄏ ᄏ ᄏ

- Lyrebird AI (@LyrebirdAi) 2017 년 9 월 4 일

Quinn의 이야기는 잠재적으로 소름 끼치고 비 윤리적 인 응용 프로그램 사용으로 인해 불쾌한 산업의 긍정적 인 측면을 밝히는 데 도움이 될 수 있습니다. Lyrebird의 Sotelo는“사람들이이 기술의 밝은면을 인식하는 것이 중요합니다.

의료 용도 외에도 AI 합성기 응용 프로그램은 다른 생산 목표를 달성 할 수 있습니다. Voicery는 AI 알고리즘으로 구동되는 맞춤형 디지털 음성을 브랜드에 제공합니다. 또한 구글 어시스턴트 기반 기기 사용자에게보다 자연스러운 경험을 제공하기 위해 WaveNet을 실험하고있다. 이 기술이 유용한 다른 영역에는 오디오 북 자동화 또는 영화에서의 음성 더빙이 훨씬 쉬워집니다.

윤리적, 법적 장애물은 의심의 여지가 없으며 토론은 계속 될 것입니다. 그러나 Quinn에게 AI는 선을위한 힘입니다. 그는 "컴퓨터처럼 들리고 싶지 않다"고 말했다. "나처럼 들리고 싶어."

Ai는 또한 좋은 힘이다 | 벤 딕슨