클라우드에서의 HPC 워크로드 실행
HPC 클라우드 컴퓨팅은 성능 수준과 가용성 측면에서 상당한 발전을 이루었습니다. HPC 워크로드를 실행해야 하는 조직은 클라우드 서비스를 활용하여 가장 복잡하고 까다로운 컴퓨팅 및 스토리지 집약적 요구사항을 처리할 수 있습니다. 또한, 클라우드에서의 HPC는 결과 도출 시간을 단축하므로 연구자는 작업 대기열을 기다리지 않고 연구에 시간을 할애할 수 있습니다. 온프레미스 HPC 구축을 지원하는 많은 인텔® 기술을 HPC 클라우드에서도 찾을 수 있습니다. 인텔은 주요 툴킷과 하드웨어 기반 보안 및 가속화를 사용하여 인텔® 아키텍처에서 HPC 워크로드를 최적화함으로써 CSP와 긴밀하게 협력하고 있습니다.
클라우드 HPC 아키텍처 고려 사항
클라우드에서는 고객이 시간 단위로 비용을 지불하며 결과 발생 시간에 따라 예산의 우선 순위를 정합니다. 아키텍처는 원하는 시간 내에 HPC 워크로드를 처리할 수 있는 성능을 제공하는 데 핵심적인 역할을 하며 궁극적으로 고객의 수익에 기여합니다. 인텔은 CSP와 협력하여 HPC 클라우드 인스턴스에 가장 영향력 있는 성능 기준에 맞는 아키텍처를 구축하기 위한 방법을 선도하고 있습니다. 주요 프레임워크와 기술은 다음과 같습니다:
- 인텔® 제온® 스케일러블 프로세서는 가장 컴퓨팅 집약적인 워크로드를 위한 성능과 메모리 용량을 제공하는 HPC 클라우드 서버의 핵심입니다. 또한, 인텔® 제온® 스케일러블 프로세서 플랫폼은 AI 컨버전스를 비롯한 특정 HPC 사용 사례를 지원하는 다음과 같은 몇 가지 핵심 기술을 지원합니다. 3세대 인텔® 제온® 스케일러블 프로세서는 곧 CSP HPC 클라우드 제공에 배포될 수 있도록 더 많은 메모리 대역폭과 1 이전 세대 프로세서보다 더 높은 클럭당 명령 수2 를 제공할 것입니다. 인텔® 제온® 스케일러블 프로세서에 탑재된 Intel® Speed Select Technolog를 통해 하나의 서버에서 다양한 워크로드의 요구 사항을 충족하도록 다양하게 구성할 수 있습니다. 이러한 개선 사항을 통해 고객은 비용 대비 더 우수한 성능을 확보하고 결과 도출 시간을 단축할 수 있습니다.
- 일부 인텔® 제온® 스케일러블 프로세서에 탑재된 인텔® Software Guard Extensions(인텔® SGX)는 클라우드에서 HPC 워크로드를 실행하고 보호하는 데 매우 유용한 기능입니다. 많은 보안 기술이 유휴 상태의 데이터를 보호하는 데 중점을 두지만 인텔® SGX는 데이터가 처리되는 중요한 순간에 데이터를 보호합니다. 또한 인텔® SGX는 다중 테넌트 HPC 클라우드 환경에서 메모리 엔클레이브를 사용하여 전송 중인 암호화 키와 데이터를 격리함으로써 컨테이너와 VM을 보호합니다.
- 인텔® Advanced Vector Extensions 512(인텔® AVX-512)는 벡터 중심 컴퓨팅 워크로드 성능을 향상시키는 프로세서 명령어 집합입니다. 인텔® AVX-512는 특히 대용량 데이터 세트의 벡터/매트릭스 작업에 적합하며 인텔® 제온® 스케일러블 프로세서의 경쟁 차별화 요소입니다. 연구자와 데이터 과학자는 인텔® AVX-512를 사용하여 AI/DL 워크로드, DNA 염기서열분석, 시뮬레이션, 재무 분석 및 3D 모델링의 성능을 향상시킬 수 있습니다.
- 인텔® 제온® 스케일러블 프로세서의 인텔® Deep Learning Boost(인텔® DL Boost)에는 인텔® AVX-512를 확장하는 새로운 Vector Neural Network Instructions(VNNI) 세트가 포함되어 있습니다. 또한 VNNI는 AI 추론에 필요한 콘볼루션 연산의 수와 복잡성을 줄여 HPC 클라우드 시스템의 전력 및 메모리 요구 사항을 낮출 수 있습니다.3 인텔® DL Boost는 3.4배 향상된 성능을 통해 콘볼루션 신경망 루프를 가속화하고 HPC 클라우드 인스턴스에서 AI 연산을 증가시킬 수 있습니다.3
- 인텔® oneAPI는 이기종 HPC 인프라에 맞게 특별히 설계된 통합 프로그래밍 모델입니다. 이 모델에는 인텔 아키텍처에서 HPC 워크로드를 최적화하고 가속화할 수 있는 Python용 인텔® Distribution 및 인텔® MKL과 같은 주요 성능 라이브러리가 포함되어 있습니다. 인텔® MPI는 여러 CSP 시장에 제공되는 차별화된 솔루션으로, 개발자가 복잡한 응용 프로그램을 여러 클러스터에 쉽게 배포하고, 높은 성능을 위해 코드를 최적화하며, 자동 튜닝을 사용하여 짧은 대기 시간과 넓은 대역폭을 달성할 수 있도록 지원합니다. 고객과 CSP는 HPC 투자에서 최대한의 효과를 얻기 위해 이러한 프레임워크를 사용합니다.
- 인텔® HPC 플랫폼 사양은 컴퓨팅, 메모리, 스토리지, 패브릭 및 HPC 인프라용 호환 응용 프로그램에 대한 최소 요구사항의 집합입니다. 고객과 기업은 이 사양을 통해 HPC 클라우드 서비스 공급업체가 HPC 워크로드의 높은 품질 기준을 충족하는 서비스를 제공한다는 것을 확신할 수 있습니다.
인텔 기반 HPC 클라우드 서비스 공급업체
인텔은 AWS, Google Cloud Platform, Microsoft Azure, Oracle 등 선도적인 HPC 클라우드 서비스 공급업체와 긴밀하게 협력하고 있습니다. 각 CSP는 인텔® MPI에 최적화되어 있고 내장 인텔® DL Boost를 제공하는, 인텔® 제온® 스케일러블 프로세서의 강력한 기반을 가진 자체 클라우드 인스턴스를 제공합니다. 또한 각 CSP는 기업이 인텔 기반 HPC 인스턴스에서 빠르게 시작할 수 있도록 지원하는 자체적인 인텔 및 타사 솔루션 시장을 갖추고 있습니다.
- 인텔 기반 Amazon Web Services 인스턴스는 인텔® 제온® 스케일러블 프로세서를 사용하고 HPC 요구사항에 맞게 용량을 조정할 수 있는 다양한 구성 옵션을 제공합니다. AWS ParallelCluster는 고객이 여러 AWS 클러스터를 통합 HPC 클라우드 솔루션으로 오케스트레이션할 수 있도록 지원하는 또 다른 서비스 오퍼링이며. 또한 인텔은 AWS를 사용하는 HPC 클라우드 솔루션에 대한 인텔의 심도 있는 전문성을 보여주는 자격인 AWS HPC 역량 지위를 획득했습니다.
인텔과 AWS의 파트너십에 대해 자세히 알아보기 ›
AWS 전자 설계 자동화 사례 연구 읽기 ›
인텔 지원 Amazon EC2 인스턴스에 대해 자세히 알아보기 ›
비디오: 클라우드에서 HPC 시뮬레이션 효율성 개선하기 › - Google Cloud Platform N2 및 C2 머신 유형은 인텔® 제온® 스케일러블 프로세서와 인텔® AVX-512를 사용하여 클라우드에서의 집중적인 HPC 워크로드를 지원합니다. N2 인스턴스는 인텔® DL Boost를 사용하여 N1 인스턴스에 비해 2.82배 더 높은 AI 추론 성능을 제공합니다4 Google Cloud는 2021년부터 클러스터에서 사용하기 위한 사전 조정된 HPC VM 이미지를 발표했는데 인텔® MPI 라이브러리를 핵심 최적화로 포함하고 있습니다.
인텔과 Google Cloud의 파트너십에 대해 자세히 알아보기 ›
Google Cloud Platform으로 유전체학 분석을 시작하십시오 ›
인텔이 어떻게 Google Cloud를 지원하는지 알아보기 › - Microsoft Azure HC-시리즈 가상 머신에는 최대 44개의 인텔® 제온® 스케일러블 프로세서 코어와 인텔® AVX-512 및 인텔® MKL과 같은 기능이 탑재됩니다. 또한 Azure는 인텔® Arria® 10 FPGA를 사용하여 HPC 워크로드에 대한 AI 및 머신 러닝 모델 교육을 가속화합니다. Microsoft는 최근 HPC 및 AI 모범 사례를 전파하기 위해 인텔을 핵심 파트너로 하는 Azure HPC and AI Collaboration Center를 출범시켰습니다.
블로그: Azure에서 유전체학 파이프라인 평가하기: 인텔 기반 가상 머신 ›
비디오: Microsoft Azure HPC, EDA 워크로드를 위해 설계한 새로운 FX 서비스 가상 머신 발표 ›
인텔과 Microsoft Azure의 파트너십에 대한 자세한 내용 ›
인텔 및 Microsoft Azure HPC 가이드 읽어 보기 ›
Azure의 비즈니스 이점에 대해 알아 보기 › - 인텔이 지원하는 Oracle의 HPC 클라우드 서비스는 클라우드 경제성과 온디맨드 리소스의 추가적인 이점을 통해 온프레미스 솔루션에 필적하는 성능을 제공합니다. Oracle X9 세대 인스턴스의 3세대 인텔® 제온® 스케일러블 프로세서는 기존 X7 세대 인스턴스에 비해 42% 향상된 성능을 제공합니다.5
Oracle X9 보도 자료 읽기 ›
Nissan의 엔지니어링 시뮬레이션 사례 연구 읽어 보기 ›
인텔 기반 CSP 온보딩 간소화
기업에서 인텔 지원 CSP 사용을 고려할 때 올바른 HPC 클라우드 제품을 선택하는 것은 복잡하고 어려운 작업이 될 수 있습니다. 다행히 기업이 최적의 제품을 선택하고 온보딩 프로세스를 간소화할 수 있도록 타사 클라우드 서비스 통합 파트너가 제공됩니다. 이러한 파트너는 일반적으로 워크로드 설정, 비표준 기능 활성화, 풍부한 UI 대시보드를 통한 고유한 인사이트 제공, 또는 심지어 온프레미스 사용 모델과 일관된 워크로드 처리 방식을 복제하는 방법을 모색하는 것을 지원하는 소규모 조직입니다. 이러한 유형의 주요 기술 파트너로는 RONIN, Six Nines 및 OnScale 등이 있습니다. 클라우드 HPC는 서비스 오퍼링에 있어서 엄청난 선택과 다양성을 제공하지만 이러한 선택은 상반된 결과를 불러올 수 있고 올바른 솔루션을 선택하는 데 어려움을 가중시킬 수 있습니다. 파트너가 지침, 전문 지식 및 전문성을 제공하여 도움을 줄 수 있습니다.
HPC 클라우드 사례 연구
이들 사용 사례는 질문에 답하고 큰 문제를 해결하기 위해 클라우드의 유연성 및 민첩성과 함께 필요한 컴퓨팅 리소스를 제공하는 데 클라우드 내의 HPC 워크로드가 어떻게 도움이 되는지 보여줍니다:
HPC Cloud의 미래를 선도
많은 IT 의사 결정자들은 인텔이 온프레미스 HPC 아키텍처 설계를 위한 전문 지식을 제공하는 데 어떤 역할을 하는지 잘 알고 있습니다. 그러나 인텔은 클라우드 HPC의 신뢰할 수 있는 조언자로서 동일한 역할을 수행할 수 있습니다. 진입 지점을 찾는 모든 조직은 인텔과 함께 시작하여 CSP와 기술 파트너로 구성된 글로벌 에코시스템의 이점을 누릴 수 있습니다.