(+)분류 : 가져온 문서/넥스32 위키

Xeon Phi
인텔 제온 Phi(파이)는 인텔에서 내놓은 병렬연산을 위한 보조 프로세싱 장치(Co-Processer)로, PCI-Express를 통해 컴퓨터에 연결, 엔비디아의 엔비디아 테슬라와 유사한 목적성을 지니는 장비이다. 인텔에서 개발하던 인텔 라라비프로젝트의 계승자로서, 그래픽처리를 보조 연산장치로 방향을 전환한 것이 특징이라고 할 수 있다. OpenCL 및 CUDA가 그 입지를 키워나가는 상황에 대응하기 위해서 만든 장치라고 할 수 있다.
그래픽카드 기반의 병렬연산 처리 유닛과 달리 인텔의 강점인 x86 코드를 지원하며 자체적으로 OS를 내장, 강력한 연산능력을 좀 더 편리한 개발환경을 이용해서 사용할 수 있다는 것을 강점으로 내세웠다. 그러나 시장 경쟁 심화와 전략적 변화로 인해 인텔은 제온 파이 제품 라인을 단종시켰다.
1. 상세 ✎ ⊖
인텔은 하드웨어 한계 및 그래픽 처리를 CPU하나로 처리할 수 있도록 하기 위한 다중 프로세서 컴퓨팅 시스템(MIC, Many Integrated Core) 구축을 위한 연구를 오랫동안 해왔다. 인텔 라라비는 그 방향성의 하나로서 오래동안 개발이 진행되었으나 원하던 만큼의 퍼포먼스가 나오지 않아 실제로 빛을 보지 못하고 말았다. 그러나 라라비에서 구축된 지식은 사라지지 않고 개량되어 제온 Phi로 다시 태어나게 되었다.
라라비의 기반 위에 2012년 초 인수한 QLogic의 기술을 접목하고 디스플레이 포트를 비롯한 영상 출력부와 그래픽처리 유닛을 삭제, 철저하게 다시 만들어졌다. 제온 Phi는 22nm 공정의 ‘나이트 코너(Knights Corner)‘라는 코어를 장착하고 있으며, 이 코어는 x86명령어를 사용하되 고성능 컴퓨팅(High-performance computing)을 위한 다수의 코어에서 분산 처리하는데 특화된 개량된 명령어처리 방식을 지니고 있다. 때문에 x86명령어를 이용하는 프로그램을 만들어 제온 Phi에 처리를 담당시킬 경우 해당 명령어를 디코딩하여 다수의 코어에서 분산처리하도록 자체 처리를 해준다.
때문에 OpenCL 및 CUDA에 비해서 프로그래밍 분야에서 접근 장벽이 낮으며, 작동 범위 또한 훨씬 유연하다. 2012년 가을에 첫 선을 보일 계획이다.
현재는 인텔의 제온 프로세서와 세트로서 작동하는 것을 전제로 두고 제작중이기 때문에 다른 장치와의 페어링에 대해서는 보장을 하지 않고 있다. 실제 제품이 나와서 호환성 테스트가 이뤄져야 확실해질만한 부분이다.
라라비의 기반 위에 2012년 초 인수한 QLogic의 기술을 접목하고 디스플레이 포트를 비롯한 영상 출력부와 그래픽처리 유닛을 삭제, 철저하게 다시 만들어졌다. 제온 Phi는 22nm 공정의 ‘나이트 코너(Knights Corner)‘라는 코어를 장착하고 있으며, 이 코어는 x86명령어를 사용하되 고성능 컴퓨팅(High-performance computing)을 위한 다수의 코어에서 분산 처리하는데 특화된 개량된 명령어처리 방식을 지니고 있다. 때문에 x86명령어를 이용하는 프로그램을 만들어 제온 Phi에 처리를 담당시킬 경우 해당 명령어를 디코딩하여 다수의 코어에서 분산처리하도록 자체 처리를 해준다.
때문에 OpenCL 및 CUDA에 비해서 프로그래밍 분야에서 접근 장벽이 낮으며, 작동 범위 또한 훨씬 유연하다. 2012년 가을에 첫 선을 보일 계획이다.
현재는 인텔의 제온 프로세서와 세트로서 작동하는 것을 전제로 두고 제작중이기 때문에 다른 장치와의 페어링에 대해서는 보장을 하지 않고 있다. 실제 제품이 나와서 호환성 테스트가 이뤄져야 확실해질만한 부분이다.
2. 성능 ✎ ⊖
제온 Phi는 50개 이상의 프로세서 코어와 8GB 이상의 GDDR3 메모리를 내장하고 있으며 512비트 SIMD 기능 지원(인텔의 SSE4는 256비트)으로 우수한 병렬연산 처리를 지원한다.
인텔의 발표자료에 따르면 DGEMM(Double General Matrix Multiply, 배정밀 행렬 곱셈) 측정시 1테라플롭스(TFLOPS)를 넘는 결과를 보였다고 한다. 2012년 하반기 선보일 클러스터 시스템은 이미 테스트 기동을 하고 있으며, 총 118 테라플롭스를 돌파해 슈퍼컴퓨터 순위의 149위에 랭크되는 수준이라고 한다.
Bull, 클레이, 델, HP, IBM, NEC 등의 40개 이상의 HPC 업체들을 지원하며, 2013년에 정식 발표될 예정인 텍사스 대학의 TACC(Texas Advanced Computing Center)에 도입중인 슈퍼컴퓨터 ‘스탬피드(Stampede)‘는 제온 Phi 장비를 장착한 슈퍼컴퓨터는 단독으로 1페타플롭스(PFLOPS)의 성능을 낼 예정이라고 한다. 또한 스탬피드는 피크 퍼포먼스로 10페타플롭스를 기대하고 있다고.
인텔의 발표자료에 따르면 DGEMM(Double General Matrix Multiply, 배정밀 행렬 곱셈) 측정시 1테라플롭스(TFLOPS)를 넘는 결과를 보였다고 한다. 2012년 하반기 선보일 클러스터 시스템은 이미 테스트 기동을 하고 있으며, 총 118 테라플롭스를 돌파해 슈퍼컴퓨터 순위의 149위에 랭크되는 수준이라고 한다.
Bull, 클레이, 델, HP, IBM, NEC 등의 40개 이상의 HPC 업체들을 지원하며, 2013년에 정식 발표될 예정인 텍사스 대학의 TACC(Texas Advanced Computing Center)에 도입중인 슈퍼컴퓨터 ‘스탬피드(Stampede)‘는 제온 Phi 장비를 장착한 슈퍼컴퓨터는 단독으로 1페타플롭스(PFLOPS)의 성능을 낼 예정이라고 한다. 또한 스탬피드는 피크 퍼포먼스로 10페타플롭스를 기대하고 있다고.
3. 유산 ✎ ⊖
제온 파이는 비록 상업적으로 큰 성공을 거두지는 못했지만, 인텔의 MIC 아키텍처 연구와 대규모 병렬 컴퓨팅 기술 발전에 기여했다. 특히 제온 파이를 통해 개발되고 검증된 AVX-512 명령어셋은 이후 인텔 제온 스케일러블 프로세서 라인업의 핵심 기술 중 하나로 자리 잡았다는 점에서 중요한 기술적 유산을 남겼다고 평가할 수 있다.
이 문서의 내용 중 전체 또는 일부는 넥스32 위키에서 가져왔으며 GNU Free Documentation License 1.3에 따라 이용할 수 있습니다.
본 문서의 원본은 링크에서 확인할 수 있습니다.
본 문서의 원본은 링크에서 확인할 수 있습니다.