집 앞으로 생각 슈퍼 컴퓨터의 큰 변화는 마침내 수평선에있다

슈퍼 컴퓨터의 큰 변화는 마침내 수평선에있다

2024

비디오: 111014 ê¸ˆìš"ì¼ ë²„ë¼ì´ì ´í‹° ë¦¬í—ˆì„¤ ì†ë³´ gCm prese (십월 2024)

이번 주 ISC 17 슈퍼 컴퓨팅 컨퍼런스를 되돌아 보면, 슈퍼 컴퓨팅 세계가 향후 몇 년 동안 크게 업그레이드 될 것으로 보이지만, 세계에서 가장 빠른 슈퍼 컴퓨터 중 2 년에 한 번 상위 500 대 목록에 대한 업데이트는 크게 다르지 않았습니다. 이전 버전.

세계에서 가장 빠른 컴퓨터는 몇 년 동안이 목록에 오른 중국의 두 대 장비입니다. Wuxi의 중국 국가 슈퍼 컴퓨팅 센터 (National Supercomputing Center)의 Sunway TaihuLight 컴퓨터는 93 페타 플롭 (93 천조 부동 소수점) 이상의 Linpack 성능을 유지합니다. 초당 작업 수); 33.8 페타 플롭 이상의 성능을 유지 한 광저우의 중국 국가 슈퍼 컴퓨터 센터 (National Super Computer Center)의 Tianhe-2 컴퓨터. 이들은 가장 빠른 마진으로 가장 빠른 기계로 남아 있습니다.

새로운 3 위는 스위스 국립 슈퍼 컴퓨팅 센터의 Piz Daint 시스템으로 인텔을 사용하는 크레이 시스템입니다 제온 그리고 Nvidia Tesla P100s는 Linpack이 19.6 페타 플롭의 성능을 유지하도록 최근 업그레이드되었습니다. 그것은 목록에서 8 위로 올라갔습니다.

이는 오크 리지 국립 연구소의 타이탄 시스템 인 미국 최고의 시스템을 4 위로 떨어 뜨려 20 년 만에 처음으로 미국 시스템이없는 상위 3 개 시스템이되었습니다. 미국은 여전히 전체 상위 10 개 중 5 개, 일본은 2 개를 차지하며 나머지 목록은 변경되지 않았습니다.

가장 빠른 컴퓨터 목록이 많이 변경되지 않은 경우에도 다른 부분에는 큰 변화가 있습니다. 가장 전력 효율적인 시스템의 Green 500 목록에서 상위 10 개 중 9 개가 변경되었습니다. 맨 위에는 Teoname 3.0 시스템, Xeon E5-2680v4 14 코어, Omni-Path 상호 연결 및 Nvidia Tesla P100을 기반으로 도쿄 공과 대학의 수정 된 HPE ICE XA 시스템이 있으며 와트 당 14.1 기가 플롭이 가능합니다. 이는 회사의 DGX-1 플랫폼과 P100 칩을 기반으로 한 Nvidia의 DGX Saturn V에서 크게 도약 한 것입니다. P100 칩은 11 월 목록에서 1 위 였지만 이번에는 10 개로 9.5 기가 플랍 / 와트입니다. P100은 상위 10 대 Green500 시스템 중 9 개에 속합니다.

오늘날의 기술을 사용하여 구축 된 가상의 exaflop 시스템이 100MW 미만의 전력을 소비한다는 의미이므로 10 기가 플롭 / 와트를 깨는 것이 큰 문제입니다. 연구자들이 향후 5 년 정도 내내보고 싶어하는 엑 플롭 시스템의 목표는 여전히 20-30 MW이다. 그러나 여전히 큰 발전이다.

상위 500 대 목록과 마찬가지로, 기계가 이론적 최고 성능의 1 ~ 10 % 만 보이는 경향이있는 고성능 공액 그라디언트 (HPCG) 벤치 마크와 같이 벤치 마크가 다른 유사한 목록에서 사소한 변경 사항 만있었습니다. 시스템 (이 경우 Riken K 머신)은 여전히 1 페타 플롭 미만을 제공합니다. TaihuLight와 Piz Daint 시스템 모두이 목록에서 올라갔습니다. 연구자들이 exaflop 머신에 대해 이야기 할 때 Linpack 벤치 마크를 의미하는 경향이 있지만 HPCG는 실제 성능 측면에서보다 현실적 일 수 있습니다.

P100과 같은 Nvidia GPU 프로세서를 거의 항상 사용하는 가속기로서 GPU 컴퓨팅의 출현은 최근 몇 년 동안이 목록에서 가장 눈에 띄는 변화가되었으며, 인텔 자체 가속기 인 수많은 코어 Xeon Phi (최신 기사 방문 버전). 현재 상위 500 대 기업 목록에는 가속기 또는 보조 프로세서를 사용하는 91 개의 시스템이 포함됩니다. Nvidia GPU가있는 74 개와 Xeon Phi가있는 17 개 (둘 다 사용하는 다른 3 개); 하나는 가속기로 AMD Radeon GPU가 있고 다른 하나는 일본 공급 업체 인 PEZY Computing의 많은 코어 프로세서를 사용합니다. 추가 13 시스템은 이제 Xeon Phi (Knights Landing)를 기본 처리 장치로 사용합니다.

그러나 우리는 이러한 개념을 염두에두고 설계된 더 큰 시스템을보기 시작하면서 슈퍼 컴퓨터에 대한 더 큰 변화가 여전히 수평선에 있습니다. 바르셀로나 수퍼 컴퓨팅 센터의 새로운 MareNostrum 4가 그 예입니다 (13 위). 코어 프로세서). 여기서 흥미로운 점은 IBM Power 9 프로세서와 Nvidia GPU가 포함 된 하나의 클러스터를 포함하여 1.5 Petaflops의 최대 처리 능력을 갖도록 설계되어 향후 2 년 동안 계획된 "신흥 기술"의 3 가지 새로운 클러스터입니다. Xeon Phi의 Knights Hill 버전을 기반으로 한 두 번째; 그리고 Fujitsu가 설계 한 64 비트 ARMv8 프로세서를 기반으로하는 세 번째 제품.

이러한 개념은 오크 릿지, 아르곤 및 로렌스 리버모어 국립 연구소의 CORAL 공동 작업의 일환으로 미국 에너지 부가 후원하는 기타 주요 슈퍼 컴퓨팅 프로젝트에 사용되고 있습니다. 먼저 IBM Power 9 프로세서와 Nvidia Volta GPU를 사용하고 150 ~ 300 개 피크 페타 플롭을 제공 할 Oak Ridge에서 Summit이되어야합니다. Lawrence Livermore의 Sierra는 100 페타 이상의 페타 플롭을 제공 할 예정입니다.

우리는 Xeon Phi의 Knights Hill 버전을 기반으로하고 Cray가 제작 한 Argonne National Laboratory에서 Aurora 슈퍼 컴퓨터를 볼 수 있으며, 이는 180 피크 페타 플롭을 제공 할 예정입니다. CORAL 시스템이 작동하고 있어야합니다 달리는 내년.

한편 중국과 일본 그룹은 대부분 고유 한 아키텍처를 사용하여 업그레이드를 계획했습니다. 보는 것이 재미 있어야합니다.

더 큰 변화는 조금 더 멀리 떨어져있는 것 같습니다. 일반적으로 프로세서 자체의 대규모 병렬 처리 장치에서 기계 학습으로의 변화입니다. Linpack 번호는 64 비트 또는 배정 밀도 성능을 나타내지 만 많은 심층 신경망 기반 응용 프로그램을 포함하여 단정도 또는 반 정밀도 계산에서 더 잘 작동하는 응용 프로그램 클래스가 있습니다. Nvidia의 최근 Volta V100 발표 및 곧 출시 될 Knights Mill 버전의 Xeon Phi와 같은 새로운 프로세서가이를 활용하고 있습니다. 이번 전시회에서 인텔은 4 분기에 출시 될 예정인이 버전은 QFMA (Quad Fused Multiply Add) 및 QVNNI (Quad Virtual Neural Network Instruction)라는 "정밀 컴퓨팅"에 대한 새로운 명령어 세트를 가질 것이라고 밝혔다..

이러한 개념은 Google의 TPU 또는 인텔의 FPGA 및 네르바 나 칩과 같은 다른 아키텍처에도 적용될 수 있다고 가정합니다.

올해 큰 변화가 보이지 않더라도 내년에는 더 많은 변화가있을 것으로 예상됩니다. 엑사 스케일 (1000 테라 플롭) 기계의 개념은 여전히 눈에 띄지 만, 훨씬 더 큰 변화가 필요할 수 있습니다.