20cm × 22cm라는 크기를 자랑하는 세계 최대의 칩 'Wafer Scale Engine'을 탑재한 데이터센터용 모듈 'Cerebras CS-1'에 의한 시뮬레이션 속도의 검증 결과가 발표되었습니다. 연구팀의 발표에 의하면, '마침내 현실의 물리법칙을 뛰어넘는 속도로 시뮬레이션 기반 예측이 가능하게 되었다'고 합니다.

[2010.03660] Fast Stencil-Code Computation on a Wafer-Scale Processor
https://arxiv.org/abs/2010.03660


Wafer scale Cerebras CS-1 flexes its muscles in scientific tasks - CPU - News - HEXUS.net
https://hexus.net/tech/news/cpu/146986-wafer-scale-cerebras-cs-1-flexes-muscles-scientific-tasks/

Wafer scale Cerebras CS-1 flexes its muscles in scientific tasks

The single 462cm2 chip is 200x faster than the NETL Joule 2.0 (84k core) supercomputer.

hexus.net


Trillion-transistor chip breaks speed record
https://techxplore.com/news/2020-11-trillion-transistor-chip.html

Trillion-transistor chip breaks speed record

The biggest computer chip in the world is so fast and powerful it can predict future actions "faster than the laws of physics produce the same result."

techxplore.com


2019년 신생 기업 Cerebras Systems는 미국국립에너지기술연구소와 협력하여 거대한 칩 'Wafer Scale Engine'을 개발했습니다. 이 Wafer Scale Engine은 TSMC의 16nm 프로세스 노드를 채용하고 있으며, 1조 2000억 개의 트랜지스터를 탑재해, 약 40만 개의 스파스 선형대수학 계산코어를 탑재한 사상 최대의 컴퓨터 칩이라고 화제가 되었습니다.


그리고 이 Wafer Scale Engine을 탑재한 냉장고만 한 크기의 딥러닝 시스템이 'Cerebras CS-1'입니다.


Wafer Scale Engine의 코어에 탑재되는 18GB의 SRAM은 메모리 대역폭이 9.6PB/s이고 100Pbps로 작동하는 'Swarm'이라는 네트워크 패브릭에 연결되어 있습니다. Cerebras System은 "CS-1은 세계에서 가장 강력한 AI 계산시스템"이라고 어필합니다.


그리고 Cerebras Systems와 에너지기술연구소의 공동연구팀이 CS-1로 발전소의 연소공정 시뮬레이션을 실시한 결과, 총 1만 6000코어 Intel Xeon 칩을 탑재한 HP 정품 슈퍼컴퓨터 'Joule 2.0'이 6밀리초 걸리는 계산을 CS-1은 불과 28마이크로초에 해내어, 약 200배 이상의 속도로 계산해냈다고 보고했습니다. 또한 "탑재 CPU와 GPU의 수에 관계없이 현재의 슈퍼컴퓨터 중 CS-1의 성능에 필적하는 것은 없다"고 연구팀은 주장합니다.

어떻게 Joule의 200배 이상의 속도로 계산할 수 있었는지에 대해 연구팀은 "Joule에 사용되는 Intel Xeon 캐시는 SRAM의 성능을 끌어내는 효과가 낮고, Intel Xeon가 Wafer Scale Engine의 코어에 비해 40%의 성능밖에 내지 못하는 것이 원인이 아닐까"라고 추측합니다.


Cerebras Systems는 "CS-1의 작업은 과학 계산의 성능에 큰 진보의 문을 엽니다. CS-1은 100만 개 이상의 유체셀을 실시간보다 고속으로 시뮬레이션하기에 충분한 성능을 처음으로 실증해 보였습니다. CS-1을 사용하는 것으로, 예를 들어 화력발전소에서 현재의 동작 조건에 관한 데이터에 따라 실시간으로 시뮬레이션을 할 수 있습니다. 즉 CS-1은 물리법칙이 동일한 결과를 실현하는 것보다 빨리 어떻게 될지를 예측할 수 있다는 것입니다."라고 말합니다.


또한 Cerebras Systems는 차세대 Wafer Scale Engine을 탑재한 CS-2의 개발에 착수하고 있다고 합니다. IT계 뉴스사이트 Hexus에 따르면, TSMC의 7nm 공정 노드를 채용하여 트랜지스터 수는 2조 6000억, AI코어는 85만 개로 늘려 CS-1의 두 배 이상의 성능을 목표로 하고 있다고 합니다.

Posted by 말총머리
,