광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[1조 트랜지스터 GPU에 도달하는 방법 반도체의 발전으로 AI 붐이 불고 있다] 반도체 기술의 혁신적 발전이 인공지능(AI) 분야의 급속한 성장을 견인하고 있는 가운데, 최근 1조 트랜지스터를 탑재한 GPU가 등장

박민제 | 기사입력 2024/04/20 [13:30]

[1조 트랜지스터 GPU에 도달하는 방법 반도체의 발전으로 AI 붐이 불고 있다] 반도체 기술의 혁신적 발전이 인공지능(AI) 분야의 급속한 성장을 견인하고 있는 가운데, 최근 1조 트랜지스터를 탑재한 GPU가 등장

박민제 | 입력 : 2024/04/20 [13:30]

 

1조 트랜지스터 GPU: AI 혁신을 주도하는 반도체 기술의 미래

 

반도체 기술의 혁신적 발전이 인공지능(AI) 분야의 급속한 성장을 견인하고 있는 가운데, 최근 1조 트랜지스터를 탑재한 GPU가 등장하면서 그 가능성이 더욱 확장되었다. 이러한 초고성능 GPU는 복잡한 AI 알고리즘과 데이터 집약적인 태스크를 효율적으로 처리할 능력을 제공함으로써, 다양한 산업에서 혁신의 가속화를 가능케 한다.

반도체의 진화와 AI

반도체 기술은 지난 수십 년 동안 눈부신 발전을 이루었다. 특히, 고성능 컴퓨팅과 AI의 필수 구성 요소인 GPU는 Moore의 법칙이 예측한 것처럼 계속해서 더 작고, 빠르며, 효율적으로 진화해 왔다. 최근에는 아키텍처의 혁신과 제조 기술의 발달이 1조 트랜지스터를 담은 GPU의 개발을 가능하게 했다. 이러한 GPU는 기존 모델보다 더 많은 연산을 더 빠르게 처리할 수 있으며, AI 연구와 응용에 필요한 복잡한 계산을 수행할 수 있는 엄청난 능력을 가지고 있다.

AI 및 데이터 처리에 미치는 영향

1조 트랜지스터 GPU의 출현은 AI 분야에 획기적인 변화를 가져오고 있다. 이러한 GPU는 머신 러닝 모델의 훈련 시간을 대폭 단축시키며, 더 정교하고 복잡한 네트워크를 실시간으로 처리할 수 있는 능력을 제공한다. 예를 들어, 자연어 처리, 이미지 인식, 자율 주행 차량 등의 분야에서 기존의 기술 한계를 뛰어넘는 성능 향상이 가능해졌다.

산업에 미치는 파급 효과

고성능 GPU의 발전은 헬스케어, 금융, 자동차, 엔터테인먼트 등 거의 모든 산업에 긍정적인 영향을 미치고 있다. 특히, 의료 분야에서는 AI를 활용한 진단 및 치료 방법이 개선되어 환자 맞춤형 의료 서비스가 가능해졌다. 자동차 산업에서는 자율 주행 기술의 안전성과 효율성이 향상되어, 해당 기술의 상용화에 한걸음 더 다가설 수 있게 되었다.

결론

1조 트랜지스터 GPU는 AI 기술의 새로운 지평을 열었으며, 반도체 기술의 지속적인 발전이 AI의 미래를 어떻게 형성할지에 대한 기대를 모으고 있다. 이러한 기술적 혁신은 더욱 지능화된 시스템의 구현을 가능하게 하며, 우리 일상생활은 물론 산업 전반에 걸쳐 심오한 변화를 가져올 것이다. 지금 이 순간에도 과학자들과 엔지니어들은 이 경계를 넓히기 위해 끊임없이 노력하고 있으며, 그 결과는 우리 모두의 삶을 더욱 풍요롭게 만들 것이다.

 

1조 트랜지스터 GPU 도달: 반도체 발전이 불러일으키는 AI 붐

반도체 기술의 끊임없는 발전은 인공지능(AI) 분야에 혁명을 일으키고 있다. 최근에는 1조 개의 트랜지스터를 탑재한 GPU(그래픽 처리장치)의 출시가 예정되어 있으며, 이는 AI 컴퓨팅 성능을 크게 향상시키고 새로운 가능성을 열어줄 것으로 기대된다.

1조 트랜지스터 GPU는 과거에는 상상도 할 수 없었던 수준의 처리 능력을 제공한다. 이는 이전 세대 GPU보다 훨씬 더 빠르고 효율적으로 AI 모델을 학습하고 실행할 수 있음을 의미한다.

이러한 발전은 다양한 AI 분야에 긍정적인 영향을 미칠 것으로 예상된다. 예를 들어, 이미지 및 영상 인식, 자연어 처리, 로봇 제어 등의 분야에서 더욱 정확하고 효율적인 AI 모델을 개발할 수 있게 될 것이다. 또한, 더욱 복잡하고 까다로운 AI 애플리케이션을 개발하고 실행할 수 있게 될 것이다.

2030년, 반도체 패키지 당 1조 개 트랜지스터 집적 가능할 것 < IT·산업 < 뉴스 < 기사본문 - 지티티코리아

1조 트랜지스터 GPU의 출시는 AI 컴퓨팅의 새로운 시대를 열 것으로 기대된다. 이는 더욱 빠르고 효율적인 AI 모델 개발, 새로운 AI 애플리케이션 개발, 다양한 분야에서 AI의 활용 확대 등을 가능하게 할 것이다.

하지만 1조 트랜지스터 GPU의 출시와 더불어 해결해야 할 과제도 존재한다.

  • 에너지 소비: 1조 트랜지스터 GPU는 이전 세대 GPU보다 훨씬 더 많은 전력을 소비한다. 이는 에너지 효율성을 개선하고 전력 소비를 줄이는 노력이 필요하다는 것을 의미한다.
  • 가격: 1조 트랜지스터 GPU는 초기에는 매우 비쌀 것으로 예상된다. 이는 일반 사용자들이 쉽게 접근할 수 없다는 문제를 야기할 수 있다.
  • 윤리적 문제: 1조 트랜지스터 GPU의 강력한 처리 능력은 새로운 윤리적 문제를 야기할 수 있다. 예를 들어, 더욱 정교한 가짜 뉴스나 딥페이크를 만드는 데 사용될 수 있다는 우려가 제기된다.

이러한 과제에도 불구하고, 1조 트랜지스터 GPU의 출시는 AI 분야에 획기적인 발전을 가져올 것으로 기대된다. 앞으로 몇 년 동안 AI 기술이 어떻게 발전하고 사회에 어떤 영향을 미칠지 지켜봐야 할 것이다.

1조 트랜지스터 GPU 출시가 예상되는 영향:

  • AI 모델 학습 및 실행 속도 향상
  • 더욱 정확하고 효율적인 AI 모델 개발 가능
  • 새로운 AI 애플리케이션 개발 가능
  • 다양한 분야에서 AI 활용 확대
  • 에너지 소비 증가
  • GPU 가격 상승
  • 새로운 윤리적 문제 발생 가능성

1조 트랜지스터 GPU는 AI 컴퓨팅의 새로운 시대를 열 것으로 기대된다. 이는 AI 기술 발전에 큰 힘이 될 것이며, 다양한 분야에 긍정적인 영향을 미칠 것으로 예상된다.

 

 

아래 기사 참조

 

1997년 IBM 딥블루(Deep Blue) 슈퍼컴퓨터가 세계 체스 챔피언 가리 카스파로프(Garry Kasparov)를 물리쳤습니다. 이는 슈퍼컴퓨터 기술의 획기적인 시연이자 고성능 컴퓨팅이 언젠가 인간 수준의 지능을 어떻게 추월 할 수 있는지 를 처음으로 엿볼 수 있는 기회였습니다 . 그 후 10년 동안 우리는 얼굴 인식, 언어 번역, 영화 및 상품 추천 등 많은 실용적인 작업에 인공 지능을 사용하기 시작했습니다.

15년이 더 흘러 인공지능은 '지식을 종합'할 수 있는 수준으로 발전했습니다. ChatGPT 및 Stable Diffusion 과 같은 생성적 AI는 시를 쓰고, 예술 작품을 만들고, 질병을 진단하고 , 요약 보고서 및 컴퓨터 코드를 작성 하고, 인간이 만든 것과 경쟁할 수 있는 집적 회로를 설계할 수도 있습니다.

인공지능이 모든 인간 활동의 디지털 보조자가 될 수 있는 엄청난 기회가 앞에 놓여 있습니다. ChatGPT는 AI가 어떻게 고성능 컴퓨팅 사용을 민주화하여 사회의 모든 개인에게 혜택을 제공하는지 보여주는 좋은 예입니다.

이 모든 놀라운 AI ​​애플리케이션은 세 가지 요인, 즉 효율적인 기계 학습 알고리즘의 혁신, 신경망 훈련을 위한 방대한 양의 데이터 가용성, 반도체 기술 발전을 통한 에너지 효율적인 컴퓨팅의 발전에 기인합니다. 생성적 AI 혁명에 대한 이 마지막 기여는 편재성에도 불구하고 정당한 공로를 인정받지 못했습니다.

지난 30년 동안 AI의 주요 이정표는 모두 당시의 최첨단 반도체 기술에 의해 가능해졌으며, 그것이 없었다면 불가능했을 것입니다. Deep Blue는 0.6 및 0.35 마이크로미터 노드 칩 제조 기술을 혼합하여 구현되었습니다. 이미지넷 대회에서 우승해 현 머신러닝 시대를 연 심층신경망은 40나노미터 기술로 구현 됐다 . AlphaGo는 28nm 기술을 사용하여 바둑 게임을 정복했으며 ChatGPT의 초기 버전은 5nm 기술로 제작된 컴퓨터에서 훈련되었습니다. ChatGPT의 최신 버전은 더욱 발전된 4nm 기술을 사용하는 서버로 구동됩니다 . 소프트웨어와 알고리즘부터 아키텍처, 회로 설계, 장치 기술에 이르기까지 관련된 컴퓨터 시스템의 각 계층은 AI 성능의 승수 역할을 합니다. 그러나 기본 트랜지스터 장치 기술이 상위 계층의 발전을 가능하게 했다고 말하는 것이 타당합니다.

AI 혁명이 지금의 속도로 계속되려면 반도체 산업에 더 많은 인력이 필요할 것이다. 10년 안에 1조 개의 트랜지스터 GPU, 즉 오늘날 일반적인 것보다 10배 많은 장치를 탑재한 GPU가 필요할 것입니다.

 

신소재, 리소그래피의 발전, 새로운 유형의 트랜지스터, 첨단 패키징 등 반도체 기술의 발전[상위]은 더욱 유능한 AI 시스템의 개발을 주도했습니다.[하위]

 

AI 모델 크기의 끊임없는 성장

AI 교육에 필요한 계산 및 메모리 액세스는 지난 5년 동안 엄청나게 증가했습니다. 예를 들어, GPT-3 교육에는 하루 동안 초당 50억 개가 넘는 연산 작업(5,000페타플롭스에 해당)과 3조 바이트(3테라바이트)의 메모리 용량이 필요합니다.

새로운 생성 AI 애플리케이션에 필요한 컴퓨팅 성능과 메모리 액세스는 계속해서 빠르게 증가하고 있습니다. 이제 우리는 다음과 같은 긴급한 질문에 대답해야 합니다. 반도체 기술이 어떻게 보조를 맞출 수 있습니까?

통합 장치에서 통합 칩렛으로

집적 회로가 발명된 이후 반도체 기술은 더 많은 트랜지스터를 썸네일 크기의 칩에 담을 수 있도록 피처 크기를 축소해 왔습니다. 오늘날 통합은 한 단계 더 높아졌습니다. 우리는 2D 스케일링을 넘어 3D 시스템 통합 으로 나아가고 있습니다 . 우리는 이제 많은 칩을 긴밀하게 통합되고 대규모로 상호 연결된 시스템에 통합하고 있습니다. 이는 반도체 기술 통합의 패러다임 전환입니다.

AI 시대에 시스템의 성능은 해당 시스템에 통합된 트랜지스터 수 에 정비례합니다 . 주요 제한 사항 중 하나는 리소그래피 칩 제조 도구가 레티클 한계라고 불리는 약 800평방 밀리미터 이하의 IC를 만들도록 설계되었다는 것입니다. 그러나 이제 우리는 리소그래피의 레티클 한계를 넘어 통합 시스템의 크기를 확장할 수 있습니다. 여러 개의 칩을 더 큰 인터포저(인터커넥트가 내장된 실리콘 조각)에 부착함으로써 단일 칩에서 가능한 것보다 훨씬 더 많은 수의 장치를 포함하는 시스템을 통합할 수 있습니다. 예를 들어, TSMC의 CoWoS(칩 ​​온 웨이퍼 온 기판 ) 기술은 12개의 고대역폭 메모리(HBM) 칩과 함께 최대 6개의 레티클 필드 상당의 컴퓨팅 칩을 수용할 수 있습니다.

 

Nvidia가 CoWoS 고급 패키징을 사용하는 방법

TSMC의 칩-온-웨이퍼-온-실리콘 고급 패키징 기술인 CoWoS는 이미 제품에 적용되었습니다. 예로는 Nvidia Ampere 및 Hopper GPU가 있습니다. 각각은 실리콘 인터포저에 있는 6개의 고대역폭 메모리 큐브가 있는 하나의 GPU 다이로 구성됩니다. 컴퓨팅 GPU 다이는 현재 칩 제조 도구가 허용하는 크기만큼 큽니다. 암페어에는 540억 개의 트랜지스터가 있고 호퍼에는 800억 개의 트랜지스터가 있습니다. 7nm 기술에서 밀도가 더 높은 4nm 기술로 전환함으로써 본질적으로 동일한 영역에 50% 더 많은 트랜지스터를 넣을 수 있게 되었습니다. Ampere와 Hopper는 오늘날의 LLM (대형 언어 모델 ) 교육을 위한 주력 도구입니다. ChatGPT를 훈련하려면 수만 개의 프로세서가 필요합니다.

HBM은 AI에서 점점 더 중요해지고 있는 또 다른 주요 반도체 기술의 한 예입니다. 칩을 서로 쌓아 시스템을 통합하는 기능인 TSMC에서는 시스템 온 통합 칩(SoIC) 이라고 부릅니다 . HBM은 제어 로직 IC 위에 수직으로 상호 연결된 DRAM 칩 스택으로 구성됩니다 . TSV ( Through Siliconvias ) 라는 수직 상호 연결을 사용하여 각 칩 을 통해 신호를 얻고 솔더 범프를 통해 메모리 칩 간의 연결을 형성합니다. 오늘날 고성능 GPU는 HBM을 광범위하게 사용합니다 .

앞으로 3D SoIC 기술은 오늘날의 기존 HBM 기술에 대한 "무충돌 대안"을 제공하여 적층된 칩 사이에 훨씬 더 조밀한 수직 상호 연결을 제공할 수 있습니다. 최근 기술 발전을 통해 솔더 범프가 제공할 수 있는 것보다 밀도가 더 높은 구리-구리 연결인 하이브리드 본딩을 사용하여 적층된 12층의 칩을 갖춘 HBM 테스트 구조가 나타났습니다 . 더 큰 기본 논리 칩 위에 저온에서 결합된 이 메모리 시스템의 총 두께는 600μm에 불과합니다.

대규모 AI 모델을 실행하는 다수의 다이로 구성된 고성능 컴퓨팅 시스템에서는 고속 유선 통신으로 인해 계산 속도가 빠르게 제한될 수 있습니다. 오늘날 광학 상호 연결은 이미 데이터 센터의 서버 랙을 연결하는 데 사용되고 있습니다. GPU 및 CPU와 함께 패키지되는 실리콘 포토닉스 기반의 광학 인터페이스가 곧 필요하게 될 것입니다 . 이를 통해 직접 광학 GPU 간 통신을 위한 에너지 및 공간 효율적인 대역폭을 확장할 수 있어 수백 대의 서버가 통합 메모리를 갖춘 단일 거대한 GPU처럼 작동할 수 있습니다. AI 애플리케이션의 수요로 인해 실리콘 포토닉스는 반도체 산업의 가장 중요한 구현 기술 중 하나가 될 것입니다.

수조 개의 트랜지스터 GPU를 향하여

AMD가 3D 기술을 사용하는 방법

AMD MI300A 가속 프로세서 유닛은 CoWoS뿐만 아니라 TSMC의 3D 기술인 SoIC(실리콘 온 통합 회로)도 활용합니다 . MI300A 는 가장 큰 AI 워크로드를 처리하도록 설계된 GPU와 CPU 코어를 결합합니다 . GPU는 AI를 위한 집중적인 행렬 곱셈 연산을 수행하고, CPU는 전체 시스템의 연산을 제어하며, 고대역폭 메모리(HBM)는 이 두 가지를 모두 지원하도록 통합됐다. 5nm 기술로 제작된 9개의 컴퓨팅 다이는 캐시 및 I/O 트래픽 전용인 6nm 기술의 기본 다이 4개 위에 쌓여 있습니다. 베이스 다이와 HBM은 실리콘 인터포저 위에 위치합니다. 프로세서의 컴퓨팅 부분은 1,500억 개의 트랜지스터로 구성됩니다.

이미 언급했듯이 AI 훈련에 사용되는 일반적인 GPU 칩은 이미 레티클 필드 한계에 도달했습니다. 그리고 트랜지스터 수는 약 1000억 개의 장치입니다. 트랜지스터 수가 증가하는 추세가 계속되면 계산을 수행하기 위해 2.5D 또는 3D 통합으로 상호 연결된 여러 칩이 필요합니다. CoWoS 또는 SoIC 및 관련 고급 패키징 기술을 통해 여러 칩을 통합하면 단일 칩에 넣을 수 있는 것보다 시스템당 총 트랜지스터 수가 훨씬 더 많아집니다. 우리는 10년 내에 멀티칩렛 GPU가 1조 개 이상의 트랜지스터를 갖게 될 것으로 예상합니다.

우리는 이러한 모든 칩렛을 3D 스택으로 함께 연결해야 하지만 다행히도 업계에서는 수직 상호 연결의 피치를 빠르게 축소하여 연결 밀도를 높일 수 있었습니다. 그리고 더 많은 공간이 있습니다. 인터커넥트 밀도가 한 단계 또는 그 이상으로 증가할 수 없는 이유는 없습니다.

수조 개의 트랜지스터를 향하여

3D 칩의 수직 연결 밀도는 GPU의 트랜지스터 수와 거의 같은 속도로 증가했습니다.

GPU의 에너지 효율적인 성능 동향

그렇다면 이러한 모든 혁신적인 하드웨어 기술이 시스템 성능에 어떻게 기여합니까?

에너지 효율적인 성능이라는 지표의 꾸준한 개선을 보면 서버 GPU에서 이미 이러한 추세를 볼 수 있습니다. EEP는 시스템의 에너지 효율성과 속도를 결합한 측정값입니다. 지난 15년 동안 반도체 산업은 2년마다 에너지 효율 성능을 약 3배 향상시켰습니다. 우리는 이러한 추세가 역사적 비율로 계속될 것이라고 믿습니다. 이는 무엇보다도 신소재, 장치 및 통합 기술, 극자외선(EUV) 리소그래피 , 회로 설계, 시스템 아키텍처 설계 및 이러한 모든 기술 요소의 공동 최적화를 포함한 다양한 소스의 혁신에 의해 주도될 것입니다.

주로 반도체 기술의 발전 덕분에 에너지 효율 성능이라는 측정값이 2년마다 3배로 증가하고 있습니다(EEP 단위는 1/펨토줄-피코초).

 

특히 EEP 증가는 우리가 여기서 논의한 고급 패키징 기술을 통해 가능해집니다. 또한 GPU의 다양한 기능적 부분을 자체 칩렛으로 분리하고 각각에 대해 최고 성능과 가장 경제적인 기술을 사용하여 구축하는 시스템 기술 공동 최적화(STCO) 와 같은 개념이 점점 더 중요해질 것입니다.

3D 집적 회로를 위한 Mead-Conway 순간

1978년에 캘리포니아 공과대학의 교수인 Carver Mead와 Xerox PARC의 Lynn Conway는 집적 회로를 위한 컴퓨터 지원 설계 방법을 발명했습니다 . 그들은 엔지니어가 공정 기술에 대한 많은 지식 없이도 VLSI(Very Large Scale Integration) 회로를 쉽게 설계할 수 있도록 일련의 설계 규칙을 사용하여 칩 스케일링을 설명했습니다.

3D 칩 설계에도 이와 동일한 기능이 필요합니다. 오늘날 설계자는 칩 설계, 시스템 아키텍처 설계, 하드웨어 및 소프트웨어 최적화를 알아야 합니다. 제조업체는 칩 기술, 3D IC 기술, 고급 패키징 기술을 알아야 합니다. 1978년에 그랬던 것처럼, 전자 설계 도구가 이해할 수 있는 방식으로 이러한 기술을 설명하기 위한 공통 언어가 다시 필요합니다. 이러한 하드웨어 설명 언어를 사용하면 설계자는 기본 기술에 관계없이 3D IC 시스템 설계 작업을 자유롭게 수행할 수 있습니다. 진행 중입니다. 3Dblox 라는 오픈 소스 표준 은 오늘날 대부분의 기술 회사와 전자 설계 자동화(EDA) 회사에서 이미 채택되었습니다.

터널 너머의 미래

인공지능 시대에 반도체 기술은 새로운 AI 기능과 애플리케이션을 구현하는 핵심 요소입니다. 새로운 GPU는 더 이상 과거의 표준 크기와 폼 팩터에 의해 제한되지 않습니다. 새로운 반도체 기술은 더 이상 차세대 트랜지스터를 2차원 평면에서 축소하는 데 국한되지 않습니다. 통합 AI 시스템은 가능한 한 많은 에너지 효율적인 트랜지스터, 특수 컴퓨팅 워크로드를 위한 효율적인 시스템 아키텍처, 소프트웨어와 하드웨어 간의 최적화된 관계로 구성될 수 있습니다.

지난 50년 동안 반도체 기술의 발전은 마치 터널 속을 걷는 듯한 느낌이었습니다. 길이 잘 정해져 있어서 앞길이 깨끗했습니다. 그리고 모두가 무엇을 해야 하는지 알고 있었습니다. 즉, 트랜지스터를 축소하는 것입니다 .

이제 우리는 터널의 끝에 도달했습니다. 여기서부터 반도체 기술의 발전은 더욱 어려워질 것이다. 하지만 터널 너머에는 더 많은 가능성이 놓여 있습니다. 우리는 더 이상 과거의 틀에 얽매이지 않습니다.

 
광고
광고
광고
광고
광고
광고
많이 본 기사