집 앞으로 생각 슈퍼 컴퓨팅 17은 미래를위한 힌트와 힌트를 제공합니다

슈퍼 컴퓨팅 17은 미래를위한 힌트와 힌트를 제공합니다

2024

비디오: Hì i í i i í i i ì (십월 2024)

이번 달 슈퍼 컴퓨팅 17 컨퍼런스에서 PEZY-SC2 액셀러레이터에 대한 훌륭한 공연과 인텔의 Xeon Phi 라인 방향 변경 등 몇 가지 놀라운 소식이있었습니다. 또한 인텔의 Xeon Scalable Processor (Skylake)를 기반으로 구축 된 최초의 시스템과 Nvidia의 Volta 가속기를 장착 한 최초의 시스템도 확인했습니다.

그러나 가장 주목할만한 것은 중국 시스템이 미국의 143 개에 비해 최신 500 대 슈퍼 컴퓨터 중 202 개를 최신 상위 500 대 목록에 포함 시킨다는 뉴스 일 것입니다. 미국 시스템은 25 년 전 처음 시작된 이래로 미국의 시스템을 지배했으며 몇 달 전만해도 미국의 시스템은 중국의 160 개에 169 개의 시스템을 가지고있었습니다. 중국 시스템의 35.4 %를 차지하는 성능을 집계 할 때도 마찬가지입니다. Top 500 시스템의 총 성능.

세계에서 가장 빠른 컴퓨터는 현재 몇 년 동안이 목록에 오른 중국의 두 대 장비입니다. 중국 무석 (Wuxi)의 국가 슈퍼 컴퓨팅 센터 (National Supercomputing Center)의 Sunway TaihuLight는 93 페타 플롭 (93 천조 부동 소수점) 이상의 Linpack 성능을 유지했습니다. 33.8 페타 플롭 이상의 성능을 유지하고있는 광저우의 중국 국가 슈퍼 컴퓨터 센터 (National Super Computer Center)의 톈허 -2 (Tianhe-2). 이것들은 가장 빠른 기계이며 엄청난 마진으로 남아 있습니다. Intel Xeon과 Nvidia Tesla P100을 사용하는 Cray 시스템 인 Swiss National Supercomputing Centre의 Piz Daint 시스템은 Linpack에서 19.6 페타 플롭의 성능을 유지하면서 3 위를 차지했습니다.

가장 큰 변화는 일본의 해양 지구 과학 기술국에 설치된 ZettaScaler-2.2 시스템 인 Gyoukou 슈퍼 컴퓨터의 업그레이드 버전 인 4 위의 새로운 시스템입니다. 이 머신은 PEZY-SC2 액셀러레이터, 2 세대 2048 코어 칩을 사용하여 배정 밀도에서 4.096 테라 플롭의 최고 성능과 기존 Intel Xeon 프로세서를 통해 총 19, 860, 000 개의 코어를 제공합니다. (PEZY-SC2가있는 이전 ZettaScaler 시스템은 6 월 버전에서 더 낮은 수준으로 목록을 만들었습니다). 이는 현재까지 가장 높은 수준의 동시성으로 알려진 최대 1, 600 만 개의 코어를 가진 TaihuLight를 능가하는 코어 수를 제공합니다. Gyoukou 기계는 Linpack의 지속적인 성능 19.14 페타 플롭을 달성했지만 흥미로운 것은 PizDaint의 2.27 메가 와트, Tinahe-2의 17.8 메가 와트, Taihulight의 15.4 메가 와트에 비해 1.35 메가 와트의 전력을 사용한다는 것입니다. 그것은 여전히 많은 전력이지만 다른 시스템에 비해 크게 줄어들며 세계에서 가장 빠른 기계조차도 전력 문제가 중요하다는 강력한 표시입니다. 또한 이것은 새로운 아키텍처가 어떻게 전력 소비를 극적으로 줄일 수 있는지 보여줍니다.

미국 최고의 시스템은 Nvidia K20x GPU 가속기를 사용하고 17.59 페타 플롭을 제공하는 5 살짜리 시스템 인 오크 리지 국립 연구소 (Oak Ridge National Laboratory)에 Titan 슈퍼 컴퓨터로 남아 있습니다.

가장 에너지 효율적인 슈퍼 컴퓨터의 최신 Green 500 목록에서 상위 3 개 슬롯을 포함하여 상위 5 개 슬롯 중 4 개 슬롯이 모두 새로 설치된 일본 시스템에 ZettaScaler-2.2 아키텍처 및 PEZY-SC2 가속기를 기반으로합니다. 이 중 가장 효율적인 것은 Shoubu System B이며 RIKEN의 컴퓨팅 및 커뮤니케이션을위한 고급 센터에 설치됩니다. Shoubu 시스템 B는 17.0 기가 플롭 / 와트를 달성했습니다. Shoubu System B와 각각 16.8 및 16.7 기가 플롭 / 와트를 사용하는 다음 두 시스템은 모두 상위 500 대 기업 목록의 아래쪽에 있습니다. Green 순위의 다섯 번째 시스템은 위에서 언급 한 Gyoukou 시스템으로, 상위 500 대 목록 중 14.2 기가 플롭 / 와트에서 4 위 시스템입니다.

이는 PEZY-SC2 액셀러레이터를위한 큰 혁신이며, 슈퍼 컴퓨팅 아키텍처의 향후 방향을 가리킬 수 있습니다.

네 번째로 가장 친환경적인 슈퍼 컴퓨터는 Nvidia의 내부 DGX SaturnV Volta 시스템으로, 15.1 기가 플롭 / 와트를 달성했으며 상위 500 대 기업 중 149 명입니다. 이 시스템은 22, 440 개의 볼타 코어를 가지고 있습니다 (다른 코어와는 다소 다른 방식으로 계산됩니다). 엔비디아는 가속기를 위해 아주 좋은 한 해를 보냈으며 볼타를 사용하는 더 많은 기계에 대한 높은 기대를 가지고 있습니다 GPU 아키텍처.

평소와 같이 주요 공급 업체는 목록에서 성공한 것에 대해 울부 짖었습니다. 인텔은 CPU가 상위 10 개 시스템 중 6 개에 있고 500 개 중 471 개에 달한다고 기록했습니다. 인텔은 또한 자사의 새로운 제온 확장 가능 프로세서가 25 페타 플롭 이상의 성능을 가진 18 대의 슈퍼 컴퓨터에 있다고 언급했다. 그러나 더 주목할만한 것은 인텔이 14nm Knights Landing Xeon Phi 프로세서의 10nm 후속 제품인 Knights Hill을 취소한다고 말했다. 이 회사는 현재 2021 년까지 엑사 스케일 시스템 (1, 000 페타 플롭)을위한 새로운 플랫폼을 계획하고 있지만 세부 사항은 밝히지 않았다고 밝혔다.

엔비디아는 액셀러레이터를 갖춘 34 개의 새로운 시스템이 목록에 올랐으며 회사 전체를 87 개로 늘렸다 고 강조했다. 엔비디아와 파트너 IBM은 6 월에 오크 릿지의 서밋 머신이 출시 될 가능성에 대해 울부 짖었다. 국립 실험실 (ORNL)은 목록의 맨 위에있는 기계 중 하나 여야합니다. 이 시스템에는 각각 2 개의 IBM Power 9 기본 CPU와 6 개의 Nvidia Volta 액셀러레이터가있는 4600 개의 노드가 있으며 예상 성능은 약 200 페타 플롭입니다. 이는 CPU와 GPU가 모두 OpenCAPI를 사용하여 캐시 일관성 방식으로 NVLink 2.0을 통해 통신하므로 GPU가 기본 시스템 RAM에 직접 액세스 할 수 있다는 점에서 Nvidia의 내부 솔루션과 다릅니다. 이번에는 Lawrence Livermore National Laboratory의 Sierra 시스템과 일본의 AI Bridging Cloud Infrastructure (ABCI) 시스템이 이어집니다.

저는 Cray가 64 비트 Armv8-A 아키텍처에서 Cavium ThunderX2 프로세서를 기반으로 한 "제작 가능"슈퍼 컴퓨터를 발표한다고 들었습니다. 이제 XC50 슈퍼 컴퓨터의 일부로 제공됩니다. ARM 기반 머신은 바르셀로나 슈퍼 컴퓨터 센터 (현재 Mare Nostrum 머신이 현재 상위 500 대 기업 중 16 위)와 영국의 "Post-K"슈퍼 컴퓨터 및 영국의 Isambard 슈퍼 컴퓨터에서 테스트되고 있습니다. Cavium은 ThunderX2에서 초기 벤치 마크를 받았는데, 14nm 칩은 인텔의 Skylake Xeon보다 멀티 스레드 또는 메모리 바인딩 응용 프로그램에서 더 나은 성능을 보였지만 인텔은 단일 스레드 및 원시 테라 플롭에서 선두를 유지하고 있습니다. Qualcomm은 Cavium 디자인 외에도 Centriq라는 ARM 기반 서버 칩을 발표했습니다.

다른 프로세서 뉴스에서 AMD는 Epyc 프로세서 생산이 급격히 증가했다고 발표했지만 아직 상위 500 대 시스템에는 없지만 NEC는 새로운 SX-Aurora TSUBASA 슈퍼 컴퓨터 시리즈 용 Vector Engine PCIe 가속기 카드 버전을 발표했습니다. 특히 빠른 메모리 대역폭을 갖습니다.

상호 연결 측면에서 Mellanox는 상위 500 대 목록에있는 새로운 시스템의 77 %가 InfiniBand를 사용하는 반면 인텔은 최근 Xeon Scalable Processor (Skylake) 시스템에 사용되는 Omni-Path Architecture를 통해 최근 성공을 거두었다고 말했다. 한편, 많은 공급 업체가 컴퓨팅 및 메모리 / 스토리지 장치 간의 초고속 연결을위한 지연 시간이 짧은 메모리 중심 접근 방식으로 설계된 Gen-Z를 찾고 있습니다.

또한 처음으로 상위 500 대의 모든 시스템이 이제 Linux를 실행하고 있다는 점에 주목해야합니다.

PEZY-SC2의 강력한 첫 인상 사이에, Knights Mill에 새로운 아키텍처, Nvidia 's Volta, AMD, ARM 공급 업체 및 NEC의 새로운 경쟁을위한 인텔의 결정은 슈퍼 컴퓨팅 세계에서 흥미로운시기입니다. 내년의 목록은 많은 벤더와 수퍼 컴퓨터 사이트가 서브 시스템을 갖춘 엑사 스케일 (1000 페타 플롭) 컴퓨터를 생산하기 위해 경쟁에 자신을 배치하려고 시도함에 따라 어떤 아키텍처가 실제로 수행되고 가장 효율적인지 알 수 있듯이 매우 흥미로울 것입니다. -20 메가 와트 전력 소비.

광대역 인터넷 속도가 궁금하십니까? 지금 테스트하십시오!