앞으로 생각 2018 년 모바일 프로세서 : 기계 학습 기능의 부상

2018 년 모바일 프로세서 : 기계 학습 기능의 부상

차례:

비디오: [Engsub+Vietsub Tiktok Song] If - Từ Vi/徐薇《Cover Dingke/丁可》~And you know you saying to go~ (십월 2024)

비디오: [Engsub+Vietsub Tiktok Song] If - Từ Vi/徐薇《Cover Dingke/丁可》~And you know you saying to go~ (십월 2024)
Anonim

당연히 올해의 스마트 폰에는 작년에 비해 매년 더 빠른 프로세서가 탑재되어 있습니다. 그러나 올해 새로운 것은 모든 프로세서 공급 업체가 장치를 차별화하는 방법으로 선전하는 머신 러닝 기능의 우세입니다. 자체 칩을 설계하는 전화 공급 업체, 전화 공급 업체에 프로세서를 판매하는 독립 또는 판매자 칩 공급 업체, 프로세서 자체에 들어가는 코어를 설계하는 IP 제조업체까지도 마찬가지입니다.

배경

먼저 약간의 배경 지식: 모든 최신 응용 프로그램 프로세서에는 다른 회사, 특히 ARM, Imagination Technologies, MIPS 및 Ceva와 같은 회사의 설계 (종종 지적 재산권 또는 IP라고도 함)가 포함됩니다. 이러한 IP는 다양한 형태로 나타날 수 있습니다. 예를 들어 ARM은 32 비트 및 64 비트 아키텍처에 대한 기본 라이센스에서 CPU, 그래픽, 이미지 처리 등에 대한 특정 코어에 이르기까지 모든 것을 판매하여 칩 설계자가 사용할 수 있습니다. 프로세서를 만듭니다. 일반적으로 칩 설계자는 이러한 코어를 자체 설계와 혼합하고 맞추고 성능, 전력 요구 사항, 크기 및 비용과 성능의 균형을 맞추기 위해 메모리, 상호 연결 및 기타 기능과 관련하여 다양한 선택을합니다.

CPU 전면에서 대부분의 칩은 더 강력하고 더 빠르게 실행되는 더 큰 코어와 더 효율적인 더 작은 코어의 조합을 갖습니다. 일반적으로 전화는 대부분 더 작은 코어를 사용하지만 까다로운 작업의 경우 고성능 코어로 전환하고 코어와 GPU 및 기타 코어의 조합을 사용하여 성능 요구와 열 고려 사항을 가장 잘 관리합니다. 과열되어 일반적으로 필요하지 않기 때문에 고성능 코어를 매우 오랫동안 작동하십시오. 큰 코어의 가장 잘 알려진 예는 ARM의 Cortex-A75 및 A73 코어입니다. 일치하는 작은 코어는 A55 및 A53입니다. 오늘날의 고급형 휴대 전화에서는 일부 공급 업체가 다른 접근 방식을 취했지만 8 개 코어 레이아웃으로 알려진 4 가지를 종종 볼 수 있습니다.

그래픽의 경우 더 많은 다양성이 있으며, 일부 공급 업체는 ARM의 Mali 라인을 선택하고, 다른 공급 업체는 Imagination Technologies의 PowerVR을 선택하고, 다른 공급 업체는 자체 그래픽 코어를 설계하도록 선택합니다. 그리고 이미지 처리, 디지털 신호 처리 및 AI 기능과 같은 경우에는 더 많은 다양성이 있습니다.

사과

애플은 아이폰 X와 아이폰 8, 8 플러스에 사용 된 "A11 바이오닉"칩을 포함 해 가을 전화 발표에서 AI 기능을 강요하기 시작했다.

A11 Bionic은 6 개의 코어 아키텍처로, 2 개의 고성능 코어와 4 개의 효율 코어가 있습니다. Apple은 ARM 아키텍처 라이센스에 따라 자체 코어를 설계하고 전통적으로 단일 스레드 성능을 추진했습니다. 애플은 A11의 성능 코어가 A10보다 최대 25 % 빠르며 4 개의 효율 코어는 A10 Fusion 칩보다 최대 70 % 빠를 수 있다고 애플은 밝혔다.. 또한 그래픽 프로세서가 최대 30 % 빠릅니다.

애플은 카메라 앱의 장면 인식과 iPhone X의 Face ID 및 Animoji를 지원하는 듀얼 코어 "Neural Engine"을 가진 칩에 대해 이야기하고있다.이 회사는 CoreML이라는 API도 출시했다. 개발자는이를 활용하는 응용 프로그램을 만듭니다.

애플은 일반적으로 프로세서에 대한 많은 정보를 제공하지는 않지만 A11 바이오닉 신경 엔진은 실시간 처리를 위해 초당 최대 6 천억 건의 작업을 수행 할 수있는 듀얼 코어 디자인이라고 밝혔다.

대부분의 다른 프로세서 제조업체와 달리 Apple은 모뎀을 응용 프로그램 프로세서에 통합하지 않고 독립형 Qualcomm 또는 Intel 모뎀을 사용합니다. Apple이 인텔이 지원하는 Qualcomm 모뎀의 기능 만 지원하는지에 대한 논란이있었습니다. 실제로 이것은 iPhone이 3 방향 캐리어 통합을 지원하지만 일부 고급 기능은 지원하지 않음을 의미합니다.

화웨이

화웨이는 AI 추진 초기에 키린 970 (Kirin 970)이라고 불렀다. 지난 가을 IFA 쇼에서 발표 한 "세계 최초의 모바일 AI 처리 장치". Kirin 970은 현재 Huawei Mate 10에서 사용됩니다. 여기에는 ARM의 Mali G72 MP12 GPU와 함께 최대 2.4GHz에서 실행되는 4 개의 Cortex-A73 CPU 코어와 최대 1.8GHz에서 실행되는 4 개의 A53이 포함됩니다.

970에서 특히 새로운 것은 화웨이가 NPU 또는 신경 처리 장치라고하는 것입니다. 회사는이 프로세서로 오프로드 할 수있는 작업이 CPU 클러스터에서 실행되는 작업에 비해 성능의 25 배, 효율의 50 배를 볼 수 있다고 말했다. 이것은 특히 빠른 이미지 인식과 더 나은 사진 촬영을 목표로합니다. 화웨이는 이번 쇼에서 휴대 전화가 1.92 16 비트 TeraFLOP를 처리 할 수 ​​있다고 말했다.

Kirin 970에는 듀얼 이미지 신호 프로세서, 5 반송파 집계 기능이있는 카테고리 18 LTE 모뎀 및 최대 1.2Gbps의 다운로드 속도를 가능하게하는 4x4 MIMO가 있습니다.

화웨이는 Mobile World Congress에서 최초의 5G 모뎀 인 Balong 5G01을 발표했다. 미래의 일부 응용 프로그램 프로세서에서도이 모뎀을 채택 할 것으로 보이지만 아직 발표되지 않았습니다. 기술적으로 이러한 모든 제품은 회사의 HiSilicon 자회사가 만듭니다.

퀄컴

올해 미국에서 가장 인기있는 안드로이드 폰의 중심에있는이 칩은 Qualcomm의 Snapdragon 845입니다. 이것은 2017 년 프리미엄 Android 폰의 대부분에서 사용되고 이미 사용 된 Snapdragon 835의 업그레이드입니다. Galaxy S9의 북미 버전.

대부분의 다른 공급 업체와 마찬가지로 Qualcomm은 신경 칩과 AI를 올해 칩의 가장 큰 개선 영역 중 하나로 밀어 붙이고 있으며 "몰입"에 대한 초점이 높아져 본질적으로 더 나은 이미징을 의미합니다.

AI 분야에서 Qualcomm은 새로운 버전의 Hexagon DSP와 CPU 및 GPU를 사용하여 추론에 사용하는 멀티 코어 NPE (Neural Processing Engine)를 사용하는 것을 좋아합니다.

이 칩에는 Hexagon 685 DSP가 있으며, 이는 AI 처리 성능을 두 배 이상 향상시킬 수 있다고 Qualcomm은 말합니다. Kryo 385 CPU는 성능 코어 (최대 2.85GHz에서 실행되는 4 개의 ARM Cortex-A75 코어) 및 "효율 코어 (4 개)의 최대 15 % 성능 향상을 제공한다고합니다. 2MB L3 캐시를 모두 공유하는 Cortex-A55 코어) (최대 1.8GHz) 및 Qualcomm에 따르면 Adreno 630 GPU (30 % 성능 향상 또는 30 % 전력 감소, 최대 2.5 배 지원) 더 빠른 디스플레이.

AI 영역에서이 칩은 다양한 머신 러닝 프레임 워크를 지원하며, 이는 객체 분류, 얼굴 감지, 장면 분할, 스피커 인식 등과 같은 작업에 효과적이라고 강조했다. 배경이 흐릿한 인물 사진을 제작하는 경우) 및 깊이 감지 및 구조화 된 조명으로 얼굴 인식이 향상됩니다. Qualcomm은 추론을 클라우드에서 디바이스로 이동함으로써 짧은 대기 시간, 개인 정보 보호 및 향상된 안정성의 이점을 얻을 수 있다고 말합니다.

이미징 영역에서이 칩은 새로운 버전의 Qualcomm Spectra ISP, 다중 프레임 노이즈 감소로 개선 된 Ultra HD 비디오 캡처, 초당 60 프레임에서 16 메가 픽셀 비디오를 캡처하는 기능, 480에서 720p 슬로우 모션 비디오를 제공합니다. 초당 프레임. VR의 경우, 845는 초당 120 프레임에서 2Kx2K 해상도의 디스플레이를 지원하며, 835에서 지원하는 초당 60 프레임에서 1.5K x 1.5K보다 크게 향상되었습니다.

다른 기능으로는 자체 처리 코어를 사용하여 커널 외부에 보안 정보를 저장하고 CPU 및 Qualcomm의 TrustZone 기능과 함께 작동하는 보안 처리 장치가 있습니다.

845는 작년에 Qualcomm이 출시 한 X20 모뎀을 통합하여 LTE 카테고리 18 (최대 1.2Gbps), 최대 5 개의 캐리어 통합 및 4X4 MIMO를 지원할 수 있으며 Licensed-Assisted Access와 같은 기술을 사용하여 더 빠르게 더 많은 지역에서 가능한 속도.

이 칩은 삼성의 10nm 저전력 공정으로 제조됩니다.

또한 Qualcomm은 Oppo 및 Vivo를 포함한 많은 중국 공급 업체에서 사용하는 660이 이끄는 Snapdragon 600 애플리케이션 프로세서 제품군을 만듭니다. Mobile World Congress를 시작하면서 Hexagon DSP, Spectra ISP, Adreno 그래픽 및 Kryo CPU를 포함하여 800 제품군과 동일한 기능을 가진 Snapdragon 700 제품군을 출시했습니다. Qualcomm은 660과 비교하여 온 디바이스 AI 애플리케이션에서 2 배 향상된 성능과 30 % 향상된 전력 효율을 제공 할 것이라고 밝혔다.

삼성

삼성은 다른 많은 시장에서 대부분의 북미 전화에서 Qualcomm 프로세서를 사용하지만 자체 Exynos 프로세서를 사용하고 있으며 이러한 프로세서를 다른 전화 제조업체에서 사용할 수있게되었습니다.

새로운 최고급 제품은 Exynos 9810으로 삼성은 Galaxy S9 및 S9 +의 국제 버전에서 사용할 것입니다.

다시 한 번, 삼성은 "딥 러닝 기반 소프트웨어"의 새로운 기능을 추진하고 있는데, 이는 프로세서가 휴대 전화의 항목이나 사람을 정확하게 식별하고 얼굴 인식을위한 깊이 감각을 지원한다고 말합니다.

9810은 8 개의 코어 칩으로, 전력 효율을위한 4 개의 A55 코어와 성능을위한 4 개의 맞춤형 CPU 디자인을 갖추고 있습니다. 삼성은 최대 2.9GHz로 작동 할 수있는이 새로운 코어는 더 넓은 파이프 라인과 최적화 된 캐시 메모리를 가지고 있으며 작년 8895와 비교해 싱글 코어 성능의 두 배와 멀티 코어 성능의 40 % 더 높았다 고 밝혔다. 게시 된 벤치 마크는 실제 환경에서는 개선 된 것으로 보이지만 주장 된 만큼은 아닙니다.이 시점에서 모든 모바일 벤치 마크에 대해 회의적입니다.)

다른 기능으로는 Mali-G72 MP18 그래픽, 최대 3840 x 2400 디스플레이 및 4096 x 2160 디스플레이 지원, 이중 이미지 신호 프로세서 (ISP) 및 초당 120 프레임의 4K 캡처 지원이 있습니다. 9810에는 또한 최대 1.2Gbps의 다운 링크 속도와 200Mbs의 업로드로 6 개의 반송파 집성 및 다운 링크를위한 4x4 MIMO (업 링크의 경우 2CA)를 갖춘 카테고리 18 모뎀이 있습니다. 종이에, 이것은 Qualcomm과 Huawei가 현재 최고 칩에 보유하고있는 Category 18 모뎀과 일치합니다. Snapdragon 845와 마찬가지로 삼성의 2 세대 10nm FinFET 공정으로 제조됩니다.

미디어 텍

MediaTek은 미드 레인지 폰 이하에서 더 많은 플레이어로 활동했으며 지난 달에는 "New Premium"시장을 목표로하는 Helio P60이라는 새로운 칩을 출시했습니다. 고급형 전화기의 기본 기능. 이 칩을 사용할 것이라고 발표 한 첫 번째 전화는 Oppo R15입니다.

작년에 발표 된이 회사의 최고 프로세서는 프리미엄 전화를 겨냥한 데카 코어 프로세서 인 Helio X30입니다. 여기에는 최대 2.5GHz에서 실행되는 2 개의 ARM Cortex-A73 CPU 코어, 최대 2.2GHz에서 실행되는 4 개의 Cortex-A53 코어 및 최대 1.9GHz에서 실행할 수있는 A35 코어 4 개와 Imagination의 PowerVR Series 7XT Plus 그래픽이 포함됩니다. 다운 링크에서 3 반송파 집선이 가능한 800 GHz 및 LTE 카테고리 10 모뎀. 이 칩은 TSMC의 10nm 공정에서 생산 된 흥미로운 칩이며 더 많은 코어가 더 유연 할 수 있다는 아이디어를 제공합니다. 전화 중 듀얼 스크린이 장착 된 Meizu Pro 7 Plus와 Vernee Apollo 2 (8MP 전면 카메라, 16MP + 13MP 후면 카메라)를 사용한다고 발표했습니다.

작년에 MediaTek은 세계 시장과 중국을 겨냥한 2 개의 중형 프로세서 인 Helio P23과 P30을 발표했는데, 각각 2.53GHz에서 실행되는 8 개의 Cortex-A53 코어와 Mali G71 MP2 그래픽이 있습니다. P60이 대체하기 위해 설계된 칩으로 더 많은 전력을 제공하고 일련의 새로운 기능을 가능하게합니다.

P60은 더 많은 성능을 제공하며, 이전 몇 년 동안 추진 한 ARM 구성과 MediaTek의 최대 성능으로 다시 돌아옵니다. 가장 강력한 ARM Cortex-A73 4 개와 최대 2.0 GHz에서 4 개의 더 효율적인 Cortex-A53을 결합 2.0GHz의 코어. 이들은 최대 800MHz에서 ARM Mali G72 NMP3 GPU에 의해 결합되며 작업 실행 위치를 예약하기 위해 MediaTek의 CorePilot 기술의 네 번째 버전에 의해 모두 제어됩니다. MediaTek은 P23 및 P30과 비교하여 P60이 CPU 및 GPU 작업 모두에서 70 %의 성능 향상을 제공한다고 말합니다.

MediaTek도 신경망 하드웨어 가속을위한 NeuroPilot 플랫폼을 포함하는 P60과 함께 AI 악 대차에 올라 섰습니다. Google NN (Android Neural Network) 및 TensorFlow, TensorFlow Lite, Caffe 및 Caffe 2를 포함한 일반적인 AI 프레임 워크를 지원합니다. 이는 280 개의 GMAC (초당 수십억 번 누적 연산)가 가능한 특수 디지털 신호 프로세서입니다. 전화 잠금을 해제하기위한 얼굴 인식 (지금까지는 고급 전화에서는 보았지만 지금까지 중급 전화에서는 볼 수없는 것), 비디오에서도 초당 60 프레임의 객체 인식과 같은 객체 인식에 사용하도록 설계되었습니다.

또한 P60에는 16 및 20 MP 센서의 듀얼 카메라 구성 또는 최대 32 MP의 단일 카메라를 지원할 수있는 3 개의 이미지 센서 프로세서를 포함하여 여러 가지 새로운 이미지 기능이 있습니다. (나는 아직 메가 픽셀이 많은 카메라 센서를 사용하여 프로덕션에서 전화를 보지 못했지만 올 것이라고 생각합니다.)이 센서는 실시간 보케 (세로 모드에서 사용되는 배경 흐림)와 함께 노이즈 감소 기능을 추가합니다..

이 칩에는 범주 7 다운로드 (최대 300Mbps) 및 범주 13 업로드 (2 반송파 집계로 최대 150Mbps)를 지원하는 모뎀이 포함되어 있습니다. 이 회사는 TSMC의 12nm FinFet 공정으로 제조되었으며 게임과 같은 전력 집약적 인 애플리케이션에 25 %의 전력 절감 효과와 12 %의 전력 절감 효과를 제공한다고 밝혔다.

스프레드

중국 시장에서 주로 판매되는 모뎀을 만드는 Spreadtrum은 Intel의 5G 모뎀 및 ARM 호환 CPU를 사용할 파트너쉽을 발표했습니다. 아직 2 년이 남았으므로 아직 세부 정보를 확인할 수 없습니다.

Spreadtrum은 미국에서는 눈에 잘 띄지 않지만 애플리케이션 프로세서 시장에서는 Qualcomm과 MediaTek 만 뒤지지 않습니다. 대부분 ARM CPU 및 자체 4G 모뎀이있는 제품을 판매하지만 인텔이 소유하고 소수를 소유하고 있습니다. 이로 인해 Intel CPU 및 Spreadtrum의 모뎀 (새로운 발표와 반대)의 칩이 생겼습니다.

물론 AI를 차세대 빅 웨이브로 보는 것은 칩 제조업체뿐만 아니라 IP를 만드는 회사들도이 분야에서 큰 진전을 보이고 있습니다.

가장 성공적인 IP 제조업체 인 ARM은 지난달 하드웨어와 소프트웨어를 포함한 머신 러닝을위한 IP 제품군을 발표하고이를 Mobile World Congress에서 추진했다.

Dubed Project Trillium에는 머신 러닝 (ML) 및 객체 감지 (OD)를위한 프로세서 설계 (IP)와 새로운 소프트웨어 라이브러리가 포함됩니다.

ML 프로세서는 응용 프로세서 내에 설치되어 CPU, GPU 및 디스플레이 코어 옆에서 실행되도록 설계되었습니다. ARM NN (신경망)으로 알려진 소프트웨어 라이브러리는 TensorFlow, Caffe 및 Android NN과 같은 프레임 워크를 지원하도록 설계되었습니다. 이를 통해 이러한 응용 프로그램은 ARM CPU 및 그래픽이있는 기존 프로세서에서 소프트웨어를 단독으로 실행할 수 있습니다. 물론 ML 코어가 포함 된 프로세서에서 실행될 때 속도가 크게 향상됩니다. 타사 소프트웨어도 프로세서 코어에서 작동합니다. ARM은 ML 코어가 처음부터 신경망을 실행하도록 설계되었다고 말합니다. 8 비트와 16 비트 응용 프로그램을 모두 실행할 수 있지만 단순성을 위해 8 비트에 중점을 두는 경향이 있습니다.

OD 프로세서는 특히 얼굴 감지 및 추적 움직임과 같은 애플리케이션에 저전력 물체 감지 기능을 제공하기 위해 이미지 신호 처리 프로세서 (ISP)와 함께 배치되도록 설계되었습니다. 입체 카메라와 같은 새로운 센서 기술과 함께 사용하도록 설계된 전용 하드웨어 블록입니다.

ARM은 새로운 IP가 4 월에 개발자 프리뷰에 이용 가능하고 올해 말에 일반적으로 이용 가능할 것이라고 말했다. 그러나 전형적인 시간주기를 감안할 때 2019 년 이후까지 새로운 프로세서 코어가 칩에 나타날 가능성은 낮다. 물론 기존 코어에서 작동하는 소프트웨어를 훨씬 빨리 배포 할 수 있습니다.

ARM은 또한 오늘날의 실제 SIM 카드를 대체하기 위해 저전력 장치를 위해 SoC에 내장되도록 설계된 Kigen이라는 새로운 SIM 솔루션을 포함하여 사물 인터넷을위한 몇 가지 새로운 솔루션을 제공했습니다.

상상력 기술

PowerVR 그래픽으로 유명한 Imagination은 지난 가을 신경 네트워킹 IP 인 PowerVR 2NX 신경망 가속도 (NNA)를 발표했습니다. 이는 1-8 개의 코어가있는 유연한 아키텍처이며 각 코어에는 256 개의 8 비트 멀티 플레이 누적 장치 (MAC)가있을 수 있습니다. 상상은 초당 3.2 조 이상의 작업을 수행 할 수 있다고 말했다.

세바

다른 IP 벤더들도 시장에 진출하고 있습니다. DSP 코어로 유명한 세바 (Ceva)는 에지 디바이스를 위해 설계된 AI 프로세서 코어 제품군 인 NeuPro를 발표했다. 이들은 회사가 컴퓨터 비전 영역에서 판매 한 프로세서를 기반으로하며 다양한 "AI 프로세스"에 CDNN 프레임 워크를 사용합니다. 이것은 일반적인 머신 러닝 프레임 워크와 함께 작동하며 추론을 위해 모바일 프로세서에서 실행되도록 변환합니다. 이 회사는 소비자, 감시 및 ADAS 제품 (자율 주행 차량용)을 위해 설계된 2 ~ 12.5 테라 초 (TOPS) 범위의 프로세서를 계획합니다. Ceva는 한 주요 자동차 고객이 10 와트 미만의 전력을 사용하여 100 TOPS의 성능을 구현할 계획이라고 밝혔다. 라이센싱은 올해 하반기에 시작됩니다.

Ceva는 5G베이스 밴드 모뎀을위한 PentaG DSP 플랫폼도 발표했다. 이 회사는 현재 DSP가 전 세계 핸드셋의 40 %에 해당하며 연간 약 9 억 대의 전화를 사용하며 인텔, 삼성 및 스프레드 시트의 모뎀에 있다고 밝혔다. 새로운 플랫폼에는 특히 "링크 적응"에 사용되는 AI가 더 많습니다. 5G 세계에서 핸드셋은 기지국에 여러 개의 링크를 가질 수 있으며 Ceva는 자사의 하드웨어와 소프트웨어가 몇 밀리 초마다 최상의 링크를 결정하는 데 도움이된다고 밝혔다. 이것은 소프트웨어를 단독으로 사용하는 것에 비해 많은 전력을 절약 할 수 있습니다. 이것은 범용 DSP 또는 신경망 칩이 아니라 통신을 위해 특별히 설계된 칩입니다. 방금 발표되었으며 3 분기에 출시 될 예정이다.

Ceva는 또한 5G 기지국 시장에서 DSP를 크게 추진하고 있으며, 5G 새로운 무선 인프라의 50 % 정도가 Nokia 및 ZTE의 시스템을 포함하여 회사의 DSP IP를 사용할 것이라고 밝혔다.

PCMag.com을 추천 하시겠습니까?

2018 년 모바일 프로세서 : 기계 학습 기능의 부상