앞으로 생각 슈퍼 컴퓨팅 15 : 더 큰 변화

슈퍼 컴퓨팅 15 : 더 큰 변화

비디오: [다시보는 맥월드]스티브잡스 식(式) 프리젠테이션 ì‹ê³„ëª (십월 2024)

비디오: [다시보는 맥월드]스티브잡스 식(式) 프리젠테이션 ì‹ê³„ëª (십월 2024)
Anonim

지난달 오스틴에서 개최 된 슈퍼 컴퓨팅 15 (SC15) 컨퍼런스의 발표와 진행 과정을 살펴보면, 고성능 컴퓨팅은 다소 미미할 수 있지만, 올해의 큰 변화가있을 것으로 예상되는 시장 인 것으로 보입니다. 왔다.

세계에서 가장 빠른 컴퓨터의 연간 두 번 상장 된 상위 500 대 목록의 리더를 보면 6 년 연속 리더는 중국의 국방 기술 대학 (National University of Defense Technology)이 구축 한 슈퍼 컴퓨터 인 Tianhe-2입니다. 상위 500 대 목록에 따르면이 기계는 Linpack 벤치 마크에서 33.86 petaflop / s (초당 수십억 계산)의 성능과 54.9 petaflop / s의 이론적 최고 성능을 제공합니다. 이것은 Intel Xeon 및 Xeon Phi 프로세서를 기반으로합니다.

2 위는 Linpack 벤치 마크에서 17.59 petaflop / s의 성능으로 DOE의 Oak Ridge National Laboratory에 설치된 AMD Opteron CPU 및 Nvidia K20x GPU 기반의 Cray XK7 시스템 인 Titan으로 계속 이동합니다.

로렌스 리버모어 국립 연구소 (LLNL)의 Trinity 컴퓨터는 8.1 petaflop / s로 6 위, 독일의 Höchstleistungsrechenzentrum Stuttgart (HLRS)의 Hazel-Hen 시스템은 5.6 petaflop / s로 8 위를 차지했습니다. 두 제품 모두 Aries 인터커넥트가있는 Intel Xeon 프로세서를 기반으로하는 Cray XC 시스템입니다.

이전 목록의 37 개에 비해 109 개로 증가한 중국 시스템 수가 크게 증가함에 따라 목록에서 더 큰 변화가 발생합니다. 부분적으로 이것은 벤치 마크를 실행하고 목록에 대한 결과를 제출하는 더 많은 중국 시스템에서 비롯된 것 같습니다. 결과적으로 미국 시스템의 수는 231 개에서 200 개로 감소했으며 이는 1993 년에 목록이 시작된 이후 가장 낮은 숫자입니다. 유럽 ​​시스템의 수는 141에서 108로 감소했습니다.

한 가지 큰 추세는 가속기 또는 보조 프로세서를 사용하는 시스템 수가 증가한 것으로, 이 목록은 현재 목록에서 104 개 시스템으로 7 월 90 일보다 증가했습니다. 이러한 시스템의 대부분은 Nvidia Tesla GPU를 사용하고 그 뒤에 Intel Xeon Phi 코 프로세서가 있으며 그 중 일부는 조합을 사용합니다. 엔비디아는 목록에있는 24 개의 새로운 시스템 중 23 개를 포함하여이 시스템 중 70 개에 있다고 지적했다.

이번 전시회에서 엔비디아는 가속기의 성장, 특히 회사의 CUDA 아키텍처에 최적화 된 애플리케이션의 수를 강조했다. 이 회사는 상위 10 개 고성능 컴퓨팅 애플리케이션의 90 %와 상위 50 개 중 70 %가 가속화되고 있다고 말합니다. 흥미로운 예측 중 하나는 모든 종류의 정부에서 일기 예보를 생성하므로 고성능 컴퓨팅의 주요 응용 프로그램 인 날씨 시뮬레이션을 실행하는 시스템에 사용됩니다. 크레이는 이전에 스위스 기상청 (MeteoSwiss)에서 이러한 촉진제를 사용하는 것을 지적했으며 스위스의 연구원들과 많은 응용 프로그램을 재 작성하는 방법에 대해 이야기했습니다. 엔비디아는 현재 기상청 (National Oceanic and Atmospheric Administration, NOAA)이 일부 기상 예보를 위해 가속기를 사용하는 것을 지적하고있다.

다른 응용 분야 중에서도 Cray는 3D 지구 물리학을 사용하여 저수지를 시뮬레이션하는 것과 같은 석유 및 가스 응용 프로그램과 위험 평가와 같은 금융 서비스를 선전했습니다. 이러한 응용 프로그램은 세계에서 가장 빠른 시스템을 거의 구성하지 않지만 고성능 컴퓨팅이 더 많은 기업 응용 프로그램에서 더 광범위한 역할을 수행하고 있음을 나타냅니다. Cray는 모든 과학 및 엔지니어링 분야에서 더 크고 세부적인 모델을 실행하고 전통적인 워크로드와 분석을 결합하는 꾸준한 발전에 대해 이야기했습니다.

또한 HPC 세계에서 더 개방적인 표준을 만들도록 설계된 OpenHPC라는 새로운 노력에 대한 Linux Foundation의 발표에 관심이있었습니다. 흥미로운 아이디어이며, 많은 빅 플레이어가 사인하는 것 같습니다.

작품에 많은 새로운 시스템이 있습니다. IBM은 IBM Power 아키텍처 CPU, Nvidia Tesla GPU 및 Mellanox 인터커넥트를 기반으로 오크 리지 국립 연구소 (ORNL)에서 Summit이라는 새로운 머신과 로렌스 리버모어 국립 연구소 (LLNL)에서 Sierra라는 새로운 머신을 구축하고 있습니다. Summit은 150에서 300 피크 petaflop / s, Sierra는 100 petaflop / s 이상을 제공 할 것으로 예상됩니다.

또한 Intel과 Cray는 2018 년 150 페타 플롭을 목표로하는 Argonne Leadership Computing Facility (Argonne National Labs의 일부)의 Knights Hill Intel Xeon Phi 프로세서를 기반으로 Aurora라는 새로운 시스템을 구축하고 있습니다. 고성능 컴퓨팅, 특히 FastForward 2 프로젝트의 개발을 가속화하기 위해 오크 리지, 아르곤 및 로렌스 리버모어 국립 연구소 (CORAL)로 알려진 에너지 부 프로그램의 일원입니다.

아직도, 우리는 여전히 "엑사 스케일 컴퓨팅"을 향한 길을 갈 길이 멀다.

그 사이에, 미래에 잘 어울릴 수있는 몇 가지 프로세서 발표가있었습니다. 엔비디아는 특히 하이퍼 스케일 웹 애플리케이션, 특히 머신 러닝을위한 슈퍼 컴퓨터의 사용을 추진했다. 3072 CUDA 코어가 장착 된 Tesla M40 보드는 주로 "딥 러닝"교육을 목표로 한 최대 7 개의 단 정밀도 테라 플롭 및 M4, 1024 코어 및 2.2 단 정밀도 teraflop / s의 저전력 보드로 이미지 및 비디오 처리뿐만 아니라 딥 러닝 추론에 사용할 수 있습니다. 또한이 회사는 가장 큰 컴퓨팅 사이트를 대상으로하는 응용 프로그램이 포함 된 새로운 "하이퍼 스케일 제품군"을 발표했습니다. 새로운 하드웨어 제품은 모두 28nm 공정 기술과 회사의 Maxwell 아키텍처를 기반으로합니다.

이 회사는 내년에 파스칼로 알려진 두 가지 후속 아키텍처와 그에 따른 Volta를 발표했습니다. 인텔은 HPC가 과학에 미치는 영향에 중점을 두 었으며, 자체 상위 500 대 기업 중 99 위에 해당하는 자체 슈퍼 컴퓨터를 사용하여 자체 프로세서를 설계하는 방법에 대해 설명했습니다. 특히이 회사는 차세대 프로세서 용 포토 마스크를 설계하기 위해 백만 CPU 시간을 사용한다고 말했다.

인텔의 많은 활동은 Xeon Phi 칩의 다음 버전 인 Knights Landing에 중점을 두 었으며, 이는 가속기로 사용할 수 있지만 부팅 할 수도 있습니다. 그리고 Omni-Path 패브릭. 인텔은 현재 일반 가용성이 2016 년 상반기에 나올 것이라고 말하지만, 일부 고객은 Knights Landing에 일찍 액세스 할 수 있습니다. 현재 크레이 (Cray)는 내년 국가 에너지 연구 과학 컴퓨팅 센터 (NERSC)와 로스 알 라모스 국립 연구소 및 샌디 아 국립 연구소에 Cori라는 새로운 슈퍼 컴퓨터를 제공하기 위해 대규모 기사단 착륙 시스템을 테스트하고있다. 프랑스 시스템 통합 업체 인 아토스 (Atos)의 유닛 인 불 (Bull)은 프랑스 대안 에너지 및 원자력위원회를 위해 구축중인 테라 1000 시스템을 준비하기 위해 초기 버전의 나이츠 랜딩을 받았다. Argonne Leadership Computing Facility는 내년 배송 예정인 Theta라는 시스템에서 작업하고 있으며 Sandia National Laboratories는 이전 세대의 Xeon Phi 코 프로세서를 사용하는 여러 시스템을 업그레이드하기 위해 펭귄 컴퓨팅과 협력하고 있습니다.

인텔은 이전에 Knights Landing의 3 가지 버전 (기본 호스트 프로세서 (자체 부팅 가능), Omni-Path 패브릭이 통합 된 호스트 프로세서 및 PCIe 가속기 카드)이 있다고 밝혔다. 칩 자체는 각각 2 개의 CPU 코어 (총 72 코어), 4 개의 벡터 처리 장치 (코어 당 2 개), 1MB의 공유 L2 캐시 및 일관성 유지를위한 캐싱 에이전트가있는 36 개의 타일로 구성됩니다. 인텔은 Knights Corner CPU의 스칼라 성능을 약 3 배, 3 테라 플롭 / s의 배정도 및 6 테라 플롭 / s의 단 정밀도 피크 성능을 제공해야한다고 밝혔다. 또한 Intel과 Micron이 이야기 한 Hybrid Memory Cube 아키텍처의 변형으로 보이는 DDR4와 비교할 때 사용 가능한 대역폭이 3 배 이상인 MCDRAM이라는 새로운 메모리 시스템을 사용합니다. 쇼에서 Cray는 부팅 가능한 Knights Landing을 갖춘 프로토 타입 시스템을 가지고 있었고, 다른 많은 벤더들이 Knights Landing을 위해 설계된 시스템을 보여주었습니다. 이 버전의 Xeon Phi는 향후 10nm 공정에서 제작 될 Knights Hill이라는 버전으로 이어질 예정입니다.

또한 Fujitsu는 32 코어의 FX100이라는 새로운 칩을 기반으로 플래그십 2020 프로젝트에 대해 조금 더 이야기했습니다. 이는 현재 FX10에 비해 약 4 배의 부동 소수점 성능을 예상 할 수 있으며, Knights Landing과 마찬가지로 Fujitsu의 FX100도 하이브리드 메모리 큐브 아키텍처 버전을 사용합니다. 또한 NEC에는 SX-ACE 칩에 대한 후속 조치를 기반으로하지만 메모리 대역폭이 더 큰 프로젝트 코드 명 Aurora (CORAL 프로젝트와 무관)가 있습니다. 2017 년을 목표로합니다.

슈퍼 컴퓨팅 15 : 더 큰 변화