오픈 이슈 갤러리 같이 보고 싶은 유머 글이나 이미지를 올려보세요!

오픈 이슈 갤러리

지난 화제보기 이슈 화제보기

ㅇㅇㄱ 지금 뜨는 글

오픈이슈갤러리

전승지기초

2026-05-17 12:06

조회: 2,680 추천: 2

[이슈]

목록 | 댓글(13)

GPU가 저물고 메모리가 ai능력의 상한이 된 이유

AI는 더 똑똑해진 게 아니라 더 잘 기억하게 됐다

― ‘GPU 시대’가 저물고 메모리가 AI 능력의 상한이 된 이유
ChatGPT가 처음 등장했을 때 우리는 “이 친구는 한 번에 책 한 권 분량의 글도 읽을 수 있을까?” 같은 질문을 던졌다. 3년이 지난 지금, AI는 책 수십 권 분량을 한 번에 읽고 그 사이의 모순을 찾아낸다. 무엇이 달라진 걸까? 흔히 ‘GPU가 더 빨라졌기 때문’이라고들 답한다. 절반만 맞는 말이다. 더 정확히 말하면, AI 산업의 진짜 병목은 더 이상 연산이 아니라 메모리다. 그리고 이 사실이 최근 1~2년 사이 산업 전체를 뒤흔든 거의 모든 현상 ― 토큰맥싱 열풍, 한국 SK하이닉스의 부상, 빅테크의 천문학적 인프라 투자 ― 을 한 줄로 꿰뚫는다.

텐서코어는 놀고, HBM은 헐떡인다
AI가 한 단어를 생성하는 과정을 생각해 보자. 모델은 매번 자신이 가진 수천억 개의 파라미터(가중치)와, 지금까지 나눈 대화 전체를 한 번씩 들춰 봐야 다음 단어를 정할 수 있다. 그런데 이 ‘들춰 보는’ 작업이 문제다. GPU 내부의 텐서코어는 어마어마한 속도로 계산을 할 수 있지만, 정작 계산할 데이터가 메모리에서 도착하기를 기다리느라 대부분의 시간을 놀고 있다.

비유하자면 이렇다. 8차로 고속도로(텐서코어)가 뚫려 있어도, 거기로 들어가는 진입로(메모리 대역폭)가 좁으면 차들은 진입로에서 꼼짝없이 정체한다. GPU 안에서 벌어지는 일이 정확히 이렇다. 한 연구는 AI가 답변을 생성하는 단계에서 GPU의 연산 강도가 평소의 12분의 1로 떨어진다고 측정했다. 텐서코어 입장에서 보면 91%의 시간은 그냥 노는 셈이다.

엔비디아가 2024년 내놓은 H200 칩이 이를 가장 노골적으로 증명한다. H200은 직전 세대 H100과 완전히 동일한 반도체 다이를 쓴다. 연산 회로는 한 글자도 바뀌지 않았다. 바뀐 건 딱 하나, 메모리(HBM)를 80GB에서 141GB로 키우고 대역폭을 1.4배 늘렸다. 그게 전부다. 그런데 이 ‘메모리만 늘린’ 칩이 추론 속도를 45% 끌어올렸다. 자동차 엔진은 그대로 두고 연료 호스만 두 배 굵게 만들었더니 차가 훨씬 빨라진 격이다. 이쯤 되면 ‘GPU의 가치 대부분이 사실 HBM에 있었다’는 업계의 농담은 농담이 아니다.

의도를 이해한다는 것 = 더 많이 기억한다는 것
여기서 한 단계 더 들어가야 한다. AI가 “이 일 좀 해 줘”라는 한마디를 제대로 처리하려면 단어 몇 개를 분석하는 걸로는 부족하다. 사용자가 누구인지, 지난주에 어떤 작업을 했는지, 회사 코드베이스는 어떤 구조인지, 방금 호출한 외부 도구는 무엇을 돌려줬는지 ― 이 모든 정보가 모델 앞에 동시에 놓여 있어야 한다. 그래야 의도를 추론할 수 있다.

그런데 이 모든 정보는 결국 토큰이라는 단위로 모델의 작업 책상 위에 올라가야 한다. AI 기업 Anthropic은 최근 발표한 엔지니어링 글에서 이를 “유한한 어텐션 예산(attention budget)“이라고 표현했다. 모델이 한 번에 집중할 수 있는 토큰의 양에는 물리적 한계가 있고, 그 한정된 책상 위에 가장 신호가 강한 정보를 큐레이션해 올려놓는 것이 좋은 AI 시스템의 핵심이라는 것이다. 이걸 업계에서는 ‘컨텍스트 엔지니어링’이라 부르는데, 한마디로 기억 관리 기술이다.

즉, “AI가 내 의도를 잘 이해해야 일을 잘한다”는 명제는 기술적으로 풀어 쓰면 “AI가 나에 관한 더 많은 토큰을 효율적으로 들고 다닐 수 있어야 한다”가 된다. 그리고 토큰은 메모리에 쌓인다. 의도 이해는 결국 메모리 문제로 환원된다.

토큰을 더 쓰는 AI가 더 잘하는 AI다
이 단순한 사실이 ‘GPT-4의 8천 토큰’에서 ‘Gemini 3의 2백만 토큰’까지, 3년 만에 컨텍스트 창을 500배 확장시킨 군비 경쟁의 동력이다. 같은 기간 GPU의 연산 성능은 10배 정도 늘었을 뿐이다. 무엇이 진짜 폭발적으로 자라났는지가 분명하다.

2024년 9월 OpenAI의 o1 모델이 등장하면서 한 발 더 나갔다. 이 모델은 답을 내놓기 전에 스스로 생각하는 토큰을 먼저 생성한다. 그리고 이상한 일이 벌어졌다 ― 생각을 길게 할수록 답이 더 정확해졌다. 같은 모델이라도 토큰을 5배, 20배 더 쓰면 수학 올림피아드 정답률이 껑충 뛴다. 이제 AI는 ‘얼마나 똑똑하게 태어났느냐’보다 ‘답하기 전에 얼마나 오래 생각할 수 있느냐’로 평가된다. 생각의 단위는 토큰이고, 토큰은 메모리에 쌓인다.
여기에 ‘AI 에이전트’까지 가세하면 토큰 소비는 폭주한다. 코드를 검토하는 AI 에이전트 하나가 한 번 일하는 데 보통 10만~50만 개의 토큰을 쓴다. 여러 에이전트가 팀으로 협업하면 한 사람 분량의 7배를 쓴다는 보고도 있다. 이게 바로 ‘토큰맥싱(token-maxing)’ ― 더 긴 컨텍스트, 더 많은 사고 토큰, 더 많은 도구 호출로 토큰 소비를 최대화하면 AI가 더 똑똑해진다는 ― 추세가 멈추지 않는 이유다.

누가 청구서를 받는가
여기서 마지막 퍼즐 조각이 맞춰진다. 토큰이 많이 쓰일수록 어딘가의 메모리가 더 많이, 더 빠르게 읽혀야 한다. 그 메모리는 데이터센터에 있다. 데이터센터는 AWS·구글·마이크로소프트가 갖고 있다. 그리고 그 데이터센터에 들어가는 HBM의 약 80%는 한국이 만든다.
빅테크 5개 사가 2026년 한 해 동안 AI 인프라에 쓸 돈은 약 7,500억 달러로 추정된다. 우리 돈 1,000조 원이 넘는다. 작년보다 67% 증가한 액수다. 이 자금의 큰 갈래는 결국 HBM을 사는 데 흘러간다. SK하이닉스는 글로벌 HBM 시장의 62%를 차지하며 메모리 시장에서 사상 처음 삼성전자를 앞질러 1위에 올랐다. 삼성도 차세대 HBM4에서 반격을 준비 중이다. NVIDIA의 최신 시스템 GB200 NVL72는 마케팅을 들여다보면 결국 72개 GPU의 메모리를 하나로 묶어주는 장치다. 본질은 연산이 아니라 메모리 풀링이다. AWS, 구글, 마이크로소프트가 자체 개발한 AI 칩(Trainium, TPU, Maia)도 발표 자료의 첫머리는 모두 메모리 사양으로 시작한다.

GPU가 ‘AI 골드러시 시대의 곡괭이’라면, HBM은 그 곡괭이의 강철 날이다. 그리고 한국은 사실상 강철의 독점 공급자다. 사용자가 ChatGPT에 질문 하나를 던질 때마다, 어딘가의 HBM이 한 번 더 읽힌다. 그 HBM 4장 중 3장은 십중팔구 SK하이닉스나 삼성전자가 만든 것이다.

그래서 무엇이 바뀌었나
물론 ‘GPU가 무의미해졌다’고 말하는 건 과장이다. GPU는 여전히 중요하다. 다만 같은 GPU 안에서도 가치가 HBM 쪽으로 응축되고 있다는 것이 정확한 표현이다. 컨텍스트 창이 무한정 늘어난다고 모델이 비례해서 똑똑해지지도 않는다. 100만 토큰을 줘도 AI는 중간에 묻힌 정보를 자주 놓친다(‘lost in the middle’ 현상). 알고리즘 효율화로 메모리 부담이 어느 정도 줄어들 가능성도 있다.

그러나 큰 그림은 분명하다. AI의 능력은 이제 ‘얼마나 큰 모델을 훈련했느냐’가 아니라 ‘얼마나 많은 토큰을 한 번에 다루느냐’로 결정된다. 그리고 토큰을 다루는 일은 메모리를 다루는 일이다. AI 경제의 다음 10년을 결정하는 질문은 누가 가장 큰 모델을 만드느냐가 아니라, 누가 가장 많은 메모리 대역폭을 지배하느냐다.
이 질문 앞에서 한국 반도체 산업은, 적어도 지금 이 순간에는, 가장 좋은 자리에 앉아 있다.

참고 자료
Anthropic Engineering, “Effective context engineering for AI agents” (2025. 9. 29), https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
“AI의 능력은 모델의 유한한 어텐션 예산 안에서 가장 신호 강한 토큰을 큐레이션하는 능력에 좌우된다”

목록 | 댓글(13)

신고하기

스팸신고

지금 뜨는 핫벤

더보기+

지금 뜨는 팟벤

더보기+

오픈이슈갤러리 게시판

목록 글쓰기

10추글 즐겨찾기

전체 이슈 제외 연예 제외 유머 이슈 연예 게임 지식 사진 계층 감동 기타

오픈이슈갤러리
제목	글쓴이	등록일	조회	추천
[유머] 인도의 길거리 바텐더 사진	육감극대화	13:13	76	0
[이슈] 현역병 성형수술 휴가 [4] 비디오	고도비만	13:00	548	0
[연예] ㅇㅎㅂ? 라잇썸 초원 근황 [5] 사진	풀소유	12:54	1,188	0
[유머] 달리기보다 느린 한강버스 [11] 사진	레이키얀	12:53	1,113	4
[이슈] 이재용 아부지가 보이네 [2] 사진	드라고노브	12:52	752	0
[유머] 상대적 박탈감이 금지된 세상 [8] 사진	돌체콜드부르	12:52	1,143	3
[유머] 유튜브 프리미엄 광고문구 근황 [10] 사진	풀소유	12:52	966	2
[유머] 내 집 사고 한달 살아본 후기 [2] 사진	풀소유	12:50	1,098	0
[기타] 추억의 영화 [4] 사진	알카드소마	12:50	542	0
[기타] 유튜버 수탉 4시간동안 납치, 폭행한남성 징역 30년 [9] 사진	제르만크록	12:49	975	0
[유머] 와이프가 놀라고 했어요^^ [4] 사진	로프꾼오징어	12:48	944	0
[계층] UFC 최두호 vs산토스 경기결과 [1] 사진	풀소유	12:48	615	0
[연예] 아일릿 it's me는 만능곡이네 ㅋㅋㅋ [8] 사진	돌체콜드부르	12:40	1,032	5
[연예] 아이브 레이 [6] 사진	케를로스	12:39	461	1
[이슈] [속보] 30년 사실혼 남성 33회 찔러 살해한 60대…징역 25년 [10] 사진	파인더1	12:39	1,023	0
[이슈] ACL2 결승전에서 패배하자 시상식 불참한 호날두 [3] 사진	슬기로움	12:35	701	0
[기타] 오도방구는 얌전히탑시다 [7] 사진	제르만크록	12:34	1,041	0
[계층] ㅇㅎ) 멀리뛰기 쩌는 선수 누나 [10] 사진	Layne	12:31	1,867	0
[연예] 원영이 [1] 사진	케를로스	12:29	620	1
[유머] 한눈에 쉽게 보는 2026 윈도우 필수 유틸리티 최종 구성 [34] 사진	풀소유	12:26	1,572	2
[연예] 설윤 [2] 사진	케를로스	12:25	613	2
[이슈] 한국 여성/남성들이 사귀고 싶은 나라의 이성 조사 [21] 사진	세드엘프	12:14	1,867	1
[유머] 설악산 오픈런 근황 [7] 사진	풀소유	12:08	2,076	1
[이슈] GPU가 저물고 메모리가 ai능력의 상한이 된 이유 [13] 사진	전승지기초	12:06	2,681	2
[유머] 여자들이 좋아하는 근육, 싫어하는 근육 [2] 사진	옆사마	12:00	1,987	1
[계층] 프란시스 은가누 MMA 복귀 경기 결과 [19] 사진	부엔까미노	11:57	2,328	1
[기타] 돌과 사는 남자, 프로젝트 헤일메리 [10] 비디오 사진	노인시대	11:50	1,091	2
[이슈] 가짜뉴스가 아니면 살아갈 수가 없는 사람들 [17] 사진	Kokkoro	11:49	1,915	1
[이슈] 2026년 5월 17일 일요일 간추린 뉴스 [4] 사진	달섭지롱	11:49	481	3
[이슈] 정청래 암살단??? [14] 비디오 사진	Destroy	11:47	973	4
[이슈] 대구에 모인 2찍들 [25] 사진	명량거북	11:42	2,107	3
[감동] 아이랑 같이 자고 싶었던 냥이 [9] 사진	신라	11:38	2,098	10
[연예] 모솔이해 못하는 서인영 [7] 사진	Nozdormu	11:36	2,979	3
[지식] 5월 17일 오늘의 역사 [2] 사진	달섭지롱	11:34	513	1
[계층] ㅆ계층) 숏츠의 시대가 가고 요즘 롱츠가 대세라는 유튜브 근황 [9] 사진	Kokkoro	11:33	2,505	0
[계층] UFC 최두호 경기결과 [5] 사진	부엔까미노	11:33	2,452	3
[이슈] 정원오) 오세훈 후보에게 묻겠습니다. 삼성역 부실시공 [7] 사진	안녕하신가영	11:32	1,373	4
[연예] 아이유 [3] 사진	케를로스	11:24	890	2
[계층] 미드) 밴드 오브 브라더스 vs 더 퍼시픽 [24] 사진 투표	낭만블루스	11:19	1,498	0
[이슈] 오세훈 서울 사장님의 위대한 업적 - 정원오 후보를 쫓기게 만들다. [11] 사진	Destroy	11:19	1,599	2
[연예] 김채원 [6] 사진	케를로스	11:19	899	2
[감동] 험한 거 가지고 옴 [2] 비디오	랜슬롯	11:17	988	0
[계층] 미국보다 더 지랄맞은 측정법 쓰는 나라 [12] 사진	신라	11:17	2,778	1
[이슈] 박균택이 차기 법무부장관 후보자? [4] 비디오	익하	11:16	906	0
[연예] 키스오브라이프 나띠 [7] 사진	입사	11:10	1,655	1
[연예] 민소매 츄 [3] 사진	입사	11:08	1,473	2
[연예] 호피에 빨간 입술 프로미스나인 이채영 [9] 사진	입사	11:07	1,245	0
[연예] 하늘색 오프숄더 배꼽 오드유스 써머 [3] 사진	입사	11:02	1,088	0
[연예] 트와이스 사나 [2] 사진	입사	10:58	909	0
[기타] 연애하고 싶은 만화.jyp [10] 사진	언데드	10:56	1,779	0