집 의견 ai에게 게임을 가르치는 것이 중요한 이유 | 벤 딕슨

ai에게 게임을 가르치는 것이 중요한 이유 | 벤 딕슨

2024

차례:

AI의 진행 상황을 추적하는 게임
다른 분야에서 AI 개발을 돕는 게임

비디오: Bruno Mars - When I Was Your Man (Official Video) (십월 2024)

Sam Altman과 Elon Musk이 설립 한 인공 지능 연구소 인 OpenAI는 최근 유명한 온라인 전투 게임 Dota 2의 프로 토너먼트에 참여하기 위해 8 월에 팀을 밴쿠버에 파견 할 것이라고 선언했습니다. 그러나 다른 팀과 달리 수백만 달러의 상금을 놓고 경쟁하면서 OpenAI 팀은 적어도 직접적으로는 아니고 인간도 관여하지 않습니다.

OpenAI Five라고 불리는이 팀은 5 개의 인공 신경망으로 구성되어 있으며 Google 클라우드의 엄청난 컴퓨팅 성능을 통해 수백만 번 이상 게임을 연습하고 있습니다. OpenAI Five는 이미 Dota 2에서 세미 프로를 이겼으며 8 월에 올 수있는 상위 1 %에 대한 테스트를 진행할 것입니다.

에서 먼저 한눈에, 비싼 컴퓨팅 리소스를 소비하고 AI가 게임을하도록 가르치는 AI 인재가 부족한 것은 무책임한 것처럼 보일 수 있습니다. 뉴욕 타임즈 (New York Times) 에 따르면 OpenAI는 세계 최고의 AI 과학자 중 일부를 보유하고 있으며, 이 수치는 7 자리 연봉을 받는다. 결국 암과 싸우거나 자율 주행 차를 더 안전하게 만드는 인공 지능 개발과 같은 더 중요한 문제를 해결할 수 없습니까?

게임이 AI 연구의 중요한 부분 인 것으로 밝혀졌다 체스에서 도타 2까지 AI가 정복 한 모든 게임은 컴퓨터 과학 및 기타 분야에서 새로운 지평을 열었습니다.

AI의 진행 상황을 추적하는 게임

1950 년대 인공 지능에 대한 아이디어가 시작된 이래로 게임은 AI의 용량을 측정하는 효율적인 방법이었습니다. 새로운 AI의 용량을 테스트하는 데 특히 편리합니다 기법, 숫자 점수와 상실 결과로 AI의 성능을 수량화하고이를 사람이나 다른 AI와 비교할 수 있기 때문입니다.

연구자들이 AI를 통해 마스터하려고 시도한 첫 번째 게임은 체스였으며, 초기에는이 분야의 최첨단 테스트로 여겨졌습니다. 1996 년 IBM의 Deep Blue는 체스에서 세계 챔피언 (Garry Kasparov)을 물리 친 최초의 컴퓨터였습니다. Deep Blue의 AI는 이동하기 전에 수백만 개의 시퀀스를 분석하는 무차별 대입법을 사용했습니다.

이 방법을 통해 Deep Blue는 체스를 마스터 할 수 있었지만보다 복잡한 보드 게임을 다루기에 충분히 효과적이었습니다. 오늘날의 표준에 따르면 그것은 원유로 간주됩니다. 딥 블루가 카스파로프를 물리 치자 과학자는 AI가 고대 중국 게임 인 고 (Go) 게임을 정복하기까지 약 100 년이 걸릴 것이라고 말했다.

그러나 2016 년 Google 소유 AI 회사 인 DeepMind의 연구원들은 5 경기에서 4 대 1로 세계 챔피언 Lee Sedol을이기는 Go-playing AI 인 AlphaGo를 만들었습니다. AlphaGo는 Deep Blue의 무차별 대입 방법을 인간의 뇌가 작동하는 방식과 훨씬 유사한 방식으로 작동하는 AI 기술인 딥 러닝으로 대체했습니다. AlphaGo는 가능한 모든 조합을 조사하는 대신 인간이 Go를 플레이 한 방식을 조사한 다음 성공적인 게임 플레이 패턴을 파악하고 복제하려고했습니다.

DeepMind의 연구원들은 나중에 강화 된 학습을 사용하는 개선 된 AlphaGo 버전 인 AlphaGo Zero를 만들었습니다. AlphaGo Zero는 Go의 기본 규칙을 배우고 수많은 시간에 맞서 게임을 배웠습니다. 그리고 AlphaGo Zero는 이전의 100을 0으로 이겼습니다.

그러나 보드 게임에는 한계가 있습니다. 첫째, 턴제 방식이므로 AI는 끊임없이 변화하는 환경에서 결정을 내릴 수 없습니다. 둘째, AI는 환경의 모든 정보 (이 경우 보드)에 액세스 할 수 있으며 알 수없는 요인으로 추측하거나 위험을 감수 할 필요가 없습니다.

이를 고려할 때 Libratus라는 AI는 Texas Hold 'Em 포커에서 최고의 선수를 제치고 인공 지능 연구에서 다음 획기적인 발전을 이루었습니다. Carnegie Mellon의 연구자들에 의해 개발 된 Libratus는 AI가 부분 정보에 접근 할 수있는 상황에서 인간과 경쟁 할 수 있음을 보여주었습니다. Libratus는 인간의 적의 전술을 조사하면서 포커를 배우고 게임 플레이를 개선하기 위해 여러 가지 AI 기술을 사용했습니다.

실시간 비디오 게임은 AI의 차세대 영역이며 OpenAI만이이 분야의 유일한 조직은 아닙니다. 페이스 북은 실시간 전략 게임 스타 크래프트 (StarCraft)를 위해 AI를 가르치는 것을 테스트했으며, DeepMind는 1 인칭 슈팅 게임 인 Quake III를 플레이 할 수있는 AI를 개발했습니다. 각 게임은 고유 한 과제를 제시하지만 공통 분모는 모두 실시간으로 불완전한 정보를 바탕으로 의사 결정을해야하는 환경을 AI에 제공한다는 것입니다. 또한 AI는 적 팀과 비교하여 자신의 힘을 테스트하고 팀워크 자체를 배울 수있는 경기장을 제공합니다.

현재로서는 프로 선수를 이길 수있는 AI를 개발 한 사람이 없습니다. 그러나 AI가 복잡한 게임에서 인간과 경쟁한다는 사실은 우리가 얼마나 멀리 현장에 왔는지 보여줍니다.

다른 분야에서 AI 개발을 돕는 게임

과학자들은 새로운 AI 기술을 개발하기 위해 테스트 베드로 게임을 사용했지만 그들의 업적은 게임에만 국한되지 않았습니다. 실제로 게임 플레이 AI는 다른 분야의 혁신을위한 길을 열었습니다.

2011 년 IBM은 자연 언어 처리 및 생성 (NLG / NLP)이 가능한 슈퍼 컴퓨터를 출시했으며 회사의 전 CEO 인 Thomas J Watson의 이름을 따서 명명되었습니다. 컴퓨터는 세계 최고의 플레이어 두 명과 유명한 TV 쇼 퀴즈 게임 Jeopardy를 연주하고 이겼습니다. Watson은 나중에 건강 관리, 사이버 보안 및 일기 예보를 포함한 다양한 영역에서 IBM의 광범위한 AI 서비스의 기반이되었습니다.

DeepMind는 강화 학습이 도움이 될 수있는 다른 분야에서 AI를 사용하도록 AlphaGo를 개발 한 경험을 가지고 있습니다. 이 회사는 National Grid UK와 함께 프로젝트를 시작하여 알파 고 영국 전력망의 효율성을 향상시키는 스마트. DeepMind의 모회사 인 Google은 또한 다른 하드웨어의 소비 제어를 자동화하여 거대한 데이터 센터의 전력 비용을 절감하는 기술을 채택하고 있습니다. Google은 강화 학습을 사용하여 언젠가 공장에서 물체를 처리 할 로봇을 훈련시키고 있습니다.