집 앞으로 생각 대체 아키텍처가 슈퍼 컴퓨팅을 지배합니까?

대체 아키텍처가 슈퍼 컴퓨팅을 지배합니까?

2024

비디오: [ì¤íì¸í°ë·°]'ê°ìí ì¤í ë¦¬ì§'(IP SAN)ì ê´í 5ê°ì§ ê¶ê¸ì¦ (십월 2024)

최근 몇 년간 우리는 고성능 컴퓨팅에 대한 흥미로운 새로운 접근 방식, 특히 전통적인 대형 프로세서에서 특정 유형의 계산 속도를 높이기 위해 가속기 또는 보조 프로세서가있는 x86 CPU 클러스터로의 전환을 보았습니다. 지난 주 슈퍼 컴퓨팅 쇼에서 나온 인텔은 Xeon Phi 코 프로세서와 기존의 Xeon 서버 프로세서를 통합하여 프로그래밍을보다 쉽게 만들었습니다. 엔비디아, 새로운 테슬라 GPU 가속기 출시 Micron은 훨씬 더 전문화 된 컴퓨팅을 위해 매우 다른 종류의 프로세서를 지원합니다. 그리고이 모든 것이 가속기와 보조 프로세서가 세계에서 가장 빠른 컴퓨터 중 상위 500 대 목록을 장악 할 때 일어나고 있었으며, 일부 전문가들은 기존 벤치 마크가 이러한 프로세서에 너무 많은 비중을 두도록 제안했습니다.

엔비디아는 인텔이나 AMD의 메인 프로세서에 연결된 대규모 GPU 클러스터 인 테슬라 가속기 보드로 성공을 거두었 다. 이러한 칩은 Oak Ridge National Laboratory의 Titan 시스템 및 Swiss National Supercomputing Computing Centre의 새로운 Piz Daint 시스템을 포함하여 다양한 시스템에 사용됩니다. 더 흥미롭게도, 테슬라 보드는 세계에서 가장 에너지 효율적인 슈퍼 컴퓨터의 최신 Green 500 목록에있는 상위 10 개 시스템 모두에 있다고 말합니다. 이 시스템들 모두 상위 500 대에서 세계에서 두 번째로 빠른 시스템이지만 Green 500 목록에서 훨씬 낮은 순위 인 AMD Opteron 기반 Titan을 제외하고 Intel Xeon을 사용합니다.

또한 Nvidia는 IBM Power 아키텍처 기반의 시스템에서 Tesla 액셀러레이터를 제공하기 위해 IBM과 파트너십을 발표했습니다. IBM은 오랫동안 직렬 성능을 선전했으며 Power 프로세서 기반의 BlueGene / Q 시스템은 Lawrence Livermore National Laboratory의 Sequoia 시스템과 Argonne National Laboratory의 Mira 시스템을 실행합니다. IBM과 Nvidia가 함께 작업하면 앞으로 흥미로운 시스템이 생길 것입니다.

이번 전시회에서이 회사는 차세대 GPU 가속기 보드 인 Tesla K40을 발표했습니다. 이 회사는 1.4 테라 플롭의 배정 밀도 성능, 12GB 메모리 (288GBps 대역폭) 및 GPU 부스트 기능을 제공하여 일부 상황에서 더 빠른 클럭 속도로 실행할 수 있다고 밝혔다. 28nm 기술로 제작 된 것과 동일한 기본 GPU 디자인을 사용하여 기존 Tesla K20 시리즈에서 업그레이드 한 것입니다.

다른 이니셔티브에는 이제 통합 메모리를 지원하는 CUDA 6을 포함하여 GPU 프로그래밍을보다 쉽게 만드는 방법이 포함되며, CPU와 GPU 메모리가 분리되어 있어도 개발자가 단일 풀로 메모리에 접근 할 수 있습니다. 이 회사는 또한 C / C ++ 및 Fortran으로 작성된 프로그램의 어떤 부분을 CPU에서 액셀러레이터로 오프로드하여 성능을 향상시킬 수 있는지 알려주는 표준 컴파일러 지시문 모음 인 OpenACC도 지원합니다.

MIC (Multiple Integrated Core) 아키텍처라고하는 인텔의 접근 방식은 매우 다릅니다. 여러 개의 작은 x86 코어를 Xeon Phi라는 단일 칩으로 결합합니다. 지난 몇 년 동안 인텔은 개발자가 아키텍처를 직접 대상으로 지정해야한다는 것은 분명하지만 프로그래밍이 쉬워 진 모든 x86이라는 사실을 선전했습니다. Knights Corner라고하는 Xeon Phi의 최신 버전은보다 전통적인 Xeon E 서버 칩과 함께 가속기로 사용되도록 설계되었으며 중국의 Tianhe-2 (현재 가장 빠른 시스템)를 포함한 다양한 최상위 시스템에서 사용됩니다. Texas University의 Advanced Computing Center에있는 Stampede 시스템과

이번 전시회에서 인텔은 코드 네임 Knights Landing이라는 새로운 버전을 발표했다.이 플랫폼은 표준 랙 아키텍처에 적합하고 호스트 CPU (예: Xeon E)없이 운영 체제를 직접 실행할 수있는 독립형 CPU로도 작동 할 것이다. 이는 특히 워크 스테이션 시장에서 Xeon Phi의 매력을 넓히는 데 매우 중요 할 수 있습니다. 이 역시 소프트웨어 개발자가 단일 CPU로 쉽게 볼 수 있도록 설계되었습니다. Knights Landing은 Knights Corner에서 업그레이드 할 때 기존 시스템에 맞는 독립 실행 형 CPU 및 PCI Express 보드로 사용할 수 있습니다.

Knights Landing에는 CPU와 함께 패키지에 제공되는 DRAM과 같은 DRAM을 효과적으로 포함하여 Knights Landing에 대한 다른 중요한 변경 사항도 있습니다. 따라서 기존 DDR 메모리보다 훨씬 높은 대역폭을 제공 할 수 있습니다. 버스. (이 또한 점점 빨라지지만 그다지 많지는 않습니다.) 이것은이 방향으로의 첫 번째 움직임이 아닙니다. IBM은 수년간 전력 아키텍처에서 임베디드 DRAM을 선전했으며 인텔 자체는 Haswell Core 제품군의 Iris Pro 버전에 그래픽 용 임베디드 DRAM을 배치하고 있습니다. 아직도, 내 생각에 우리는 앞으로 몇 년 동안이 방향으로 더 많은 노력을 기울일 것입니다.

한편, 가장 흥미로운 새로운 접근 방법 중 하나는 Micron에서 비롯된 것으로서, 복잡한 구조화되지 않은 데이터 문제를 해결하기 위해 설계된 Automata Processor라는 새로운 가속기를 발표했습니다.

Micron은이를 특정 작업을 해결하기 위해 연결된 수만에서 수백만 개의 프로세싱 요소로 구성된 패브릭을 제공한다고 설명했습니다. DRAM 및 NAND 메모리의 최대 제조업체 중 하나 인이 회사는 메모리 기반 처리를 사용하여 네트워크 보안, 생물 정보학, 이미지 처리 및 분석과 같은 영역에서 복잡한 컴퓨팅 문제를 해결할 것이라고 밝혔다. Micron은 처음에 Automata 프로세서를 PCI-Express 보드에 배포하여 개발자와 함께 작업 할 수있게했지만 회사는 프로세서를 표준 메모리 모듈 (DIMM) 또는 임베디드 시스템 용 개별 칩으로 판매 할 계획입니다. 어떤면에서, 이것은 FPGA (field-programmable gate array)와 유사하게 들리는데, 이는 패턴 매칭과 관련된 특정 애플리케이션을 해결하도록 조정된다.

이 회사는 조지아 기술, 미주리 대학교 및 버지니아 대학교와 협력하여 오토마타를위한 새로운 응용 프로그램을 개발하고 있다고 밝혔다. 이 회사는 최종 제품에 대한 날짜를 발표하지 않았지만 소프트웨어 개발 키트는 내년에 시뮬레이션 도구와 함께 출시 될 예정입니다.

Automata는 진행중인 작업처럼 들리며 응용 프로그램이 얼마나 넓은 지 알기에는 너무 이르지만 흥미로운 방법입니다.

전반적으로, 우리는 고성능 컴퓨팅의 진화를보고 있습니다. 몇 년 전만해도 가장 빠른 컴퓨터는 대부분 표준 서버 프로세서의 수에 불과했습니다. 실제로 IBM Blue Gene 시스템과 Sparc (Fujitsu Sparc 프로세서를 사용하는 일본 RIKEN Advanced Institute for Computational Science의 K 컴퓨터) 기반 시스템은 여전히 10 대 중 5 대를 포함하여 시장의 많은 부분을 차지합니다. 세계의 시스템. 그러나 최근 몇 년 동안 테슬라를 사용하는 시스템과 더 최근에는 더 많은 최신 시스템을 구성하는 Xeon Phi 액셀러레이터를 사용하여 추진력이 코 프로세서로 바뀌 었습니다. 이러한 시스템, 새로운 파트너십, 더 나은 소프트웨어 및 일부 새로운 접근 방식의 개선으로 인해 슈퍼 컴퓨팅 시장은 미래에 매우 다를 수 있습니다.