오픈 이슈 갤러리 같이 보고 싶은 유머 글이나 이미지를 올려보세요!

오픈 이슈 갤러리

지난 화제보기 이슈 화제보기

ㅇㅇㄱ 지금 뜨는 글

오픈이슈갤러리

전승지기초

2026-05-15 09:01

조회: 979 추천: 0

[이슈]

목록 | 댓글(1)

클로드 미토스, 탐지능력 입증했지만 한계도 확인됨

XBOW의 독립 벤치마크 결과, Mythos Preview는 소스코드 감사·네이티브 코드 분석·리버스 엔지니어링에서 기존 모든 모델을 압도하며 Anthropic의 핵심 주장을 입증했지만, 익스플로잇 검증력은 한 단계 떨어지고, 판단력은 오탐 제거에는 강하면서도 진짜 취약점까지 보수적으로 누락하는 양면성을 보였으며, Opus 대비 5배 비싼 비용을 고려해 토큰당 효율로 정규화하면 GPT 5.5에 밀리는 등 “취약점 발견 특화 최강 모델이지 만능 보안 도구는 아니다”라는 평가다.

Mythos는 취약점 발견 — 특히 라이브 시스템+소스코드 병행 테스트 — 에서 경쟁 모델들을 압도했지만, 판단력(judgment), 익스플로잇 검증, 실용적 효율성 면에서는 한계를 드러냈다.

Anthropic의 Mythos AI 모델은 4월 초 발표 이후 업계에 큰 파장을 일으켰다. 주된 이유는 다른 어떤 AI 모델보다 훨씬 많은 취약점을 발굴하는 능력 때문이다. 자율 공격 보안 기업 XBOW가 자체 AI 테스트 체계를 동원해 Mythos Preview의 성능을 검증했다.
Anthropic의 핵심 주장은 확인됐다. XBOW는 “Mythos Preview는 제공 업체를 불문하고 기존의 모든 모델 대비 유의미한 도약을 보여준다”고 보고했다.

20년 전 Gary McGraw가 지적했듯, 운영상의 결함은 소스코드 버그와 아키텍처 설계 결함 사이의 상호작용에서 발생하며, “코드만 들여다봐서는 설계 결함을 발견할 수 없다 — 더 높은 수준의 이해가 필요하다”는 것이다.

XBOW의 주요 평가 결과
소스코드 감사에서는 극도로 강력하다. 익스플로잇 검증에서는 우수하지만 소스코드 감사만큼은 아니다. 판단력은 혼재된 평가를 받았다 — 지나치게 문자 그대로 해석하고 보수적인 경향이 있으면서도, 발견 사항의 실질적 중요성을 과장하는 경향도 동시에 보인다.

판단력 면에서 Mythos는 이전 모델보다 오탐(false positive)을 더 잘 걸러냈지만, “증거가 자신의 기준을 형식적으로 충족하지 못할 경우 진짜 취약점(true positive)까지 놓치는 경우가 있었다.” 최적의 결과를 얻으려면 정밀한 프롬프트가 필요하다.

네이티브 코드 취약점 발견과 리버스 엔지니어링 양쪽에서 상당한 강점을 보였다. 리버스 엔지니어링 테스트에서 XBOW는 Mythos가 “자체 결과물뿐 아니라 경쟁 모델의 발견 사항까지 트리아지(분류·우선순위 결정)할 수 있다”고 결론 내렸으며, 비일반적인 펌웨어 및 임베디드 시스템 환경에서도 추론이 가능했다.
XBOW의 시각적 정확도(visual acuity) 테스트는 모델이 브라우저 인터페이스를 통해 라이브 웹사이트와 상호작용하는 능력 — 즉 올바른 UI 요소를 식별하고 정확한 위치를 클릭하는 능력 — 을 측정한다. “정확한 좌표를 요구받았을 때 완벽한 픽셀 정확도를 보이지는 않았지만, 올바른 브라우저 동작을 선택하는 데는 실용적으로 효과적이었다”고 XBOW는 기술했다.

비용 대비 효율성 — 간과하기 쉬운 통계
현 시점에서 구체적인 비용은 공개되지 않았지만, Anthropic은 Opus 모델 대비 5배 비싸다고 밝혔다. 이에 XBOW는 더 저렴한 모델에 더 많은 시간을 부여하면 더 낮은 비용으로 더 높은 정확도를 얻을 수 있는지 검토했고, 결론은 “그렇다”였다.

“추정 실행 비용으로 정규화하면, 그림은 꽤 명확하다: Mythos Preview가 극단적으로 비효율적이진 않지만 — 최소한 높은 정확도를 원한다면 — 우리 벤치마크에서 가성비 최고도 아니다.” 고정 토큰 예산 기준으로 웹 취약점 발견 시, Mythos는 Opus 4.6을 능가하지만 GPT 5.5에는 뒤진다.
다만 이러한 발견들이 근본적인 핵심 주장을 훼손하지는 않는다. Mythos는 코드에서 취약점을 찾는 능력에서 다른 모델보다 뛰어나다.

XBOW의 최종 결론
“Mythos Preview는 취약점 후보를 찾는 데 — 특히 소스코드로부터 — 강력하며, 웹·네이티브 코드·리버스 엔지니어링 과제 전반에 걸쳐 인상적인 능력을 보여준다”고 XBOW는 결론지었다

https://www.securityweek.com/mythos-proves-potent-in-vulnerability-discovery-less-convincing-elsewhere/

목록 | 댓글(1)

신고하기

스팸신고

지금 뜨는 핫벤

더보기+

지금 뜨는 팟벤

더보기+

오픈이슈갤러리 게시판

목록 글쓰기

10추글 즐겨찾기

전체 이슈 제외 연예 제외 유머 이슈 연예 게임 지식 사진 계층 감동 기타

오픈이슈갤러리
제목	글쓴이	등록일	조회	추천
[기타] 트젠 남성화장실로 안내했다가 해고당한 청소부 [4] 사진	니카이도후미	10:11	259	0
[유머] 오직 남자만이 할 수 있는 동아리 [1] 사진	부엔까미노	10:10	262	0
[이슈] 5월 15일, 금요일 헤드라인 뉴스 [1] 비디오 사진	달섭지롱	10:09	108	1
[이슈] 폭망한 등산복 ‘네파’ 근황 [7] 사진	미뉴에뜨	10:08	668	2
[기타] 해외여행 가는데 50만원 더 주는 친구 [1] 사진	꿻뻵뗗	10:05	637	0
[기타] 오픈 이슈 재벌 갤러리 [5] 사진	니카이도후미	10:02	637	0
[계층] 요즘 말 많이 나오는 호랑이 [8] 사진	부엔까미노	10:01	841	0
[계층] 삼성ONE UI 9 업데이트 대상 기기 [3] 사진	로프꾼오징어	09:57	908	0
[연예] 민소매 원피스 트리플에스 김나경 사진	입사	09:56	551	0
[지식] 5월 15일 금요일 날씨 + 운세 [3] 사진	달섭지롱	09:54	323	2
[계층] 화성에서 발견된 인공적인 물체 [2] 사진	작두콩차	09:53	1,439	0
[연예] 카리나 핫팬츠 검스 (에스파) [3] 사진	입사	09:48	1,031	1
[연예] 단추가 풀린? 사나 (트와이스) [5] 사진	입사	09:46	785	3
[연예] 한혜진, '왕사남' 못 본 이유…"한명회 후손이라 못 봐" [13] 사진	두부두꺼비	09:46	1,668	0
[연예] 권은비 상지대 축제 [10] 사진	입사	09:43	1,492	2
[유머] 소리On) 여자에게 카톡이 안온다면 포기하십쇼 [2] 사진	풀소유	09:43	841	0
[이슈] 바이든 아들 중국사업 때리더니…트럼프 방중길엔 아들·며느리 동행 [4] 사진	작두콩차	09:43	597	0
[이슈] 2026년 국회의원 재보궐선거 여론M 근황 [5] 사진	부엔까미노	09:43	638	2
[유머] 여자는 정말 쉽게 야스하네요 [13] 사진	풀소유	09:39	2,282	1
[연예] 김채연 (트리플에스) [1] 사진	입사	09:38	681	1
[이슈] 제 9회 지방선거 광역단체장 여론M 근황 [6] 사진	부엔까미노	09:36	732	2
[유머] 징역갤 네임드의 취미 [4] 사진	풀소유	09:36	1,165	0
[이슈] 100원 짜리 주식 [9] 사진	Nozdormu	09:35	1,685	1
[연예] 어느 잘생긴 남자 배우의 20년 후 근황 [8] 사진	미뉴에뜨	09:32	1,775	0
[유머] 횡단보도 건너다 경찰에게 경례하는 아이 [11] 사진	육감극대화	09:27	1,459	7
[연예] 폐섬유증 투병했던 가수 유열 근황 [1] 비디오 사진	스티브승준유	09:26	1,127	1
[이슈] [속보]☆코스피 8000시대 개막 한국 증시 새 역사☆ [4] 사진	왜구김당	09:22	1,455	4
[이슈] 코스피 8천피 등극! [13] 사진	Destroy	09:20	1,272	4
[이슈] 아무도 이해를 못 하고 있는 주식 [27] 사진	히스파니에	09:19	2,489	1
[이슈] ai 챗봇 사용자들이 현실감각을 잃고있다고 연구자들이 경고 [10] 사진	전승지기초	09:18	1,179	0
[이슈] 학부모 갑질이 계속 도를 넘는 이유 [13] 사진	카피캣	09:17	1,551	0
[연예] 윙크하는 장원영 (아이브) 사진	입사	09:17	598	0
[이슈] 삼전 직원들이 hbm 복구하고 받은 것 [11] 사진	히스파니에	09:17	2,067	2
[이슈] 2년전 벌어진 동탄경찰서 무고 사건 결말 [7] 사진	나의그대들과	09:13	1,659	2
[이슈] 코스피 8000 돌파 [9] 사진	V60	09:13	1,211	3
[이슈] 양향자....이대통령도 나의 당선을 바랄것 [15] 사진	왜구김당	09:11	1,130	0
[이슈] 5분사이에 서킷 3번발동 [4] 사진	캔사이	09:09	1,921	1
[연예] 후덜덜한 장원영 팬티 가격 [7] 사진	Nozdormu	09:09	2,278	1
[계층] 배그 "시한부아내" 사연 주인공 혜빈씨 별세 [12] 사진	부엔까미노	09:08	1,447	8
[이슈] 장동혁 대표.'현재 반도체 호황.국힘 노력 덕분' [14] 사진	세드엘프	09:07	899	0
[계층] 올해 연령별 수익률 뉴스 [3] 사진	Nozdormu	09:05	1,027	1
[계층] ㅇㅎ) 떡툰 회사별 최고의 떡툰 [11] 사진	부엔까미노	09:03	2,476	0
[연예] 아래 각도에서 본 엉덩이 살랑거리는 미나 [2] 사진	Ecstasis	09:03	1,727	2
[이슈] 클로드 미토스, 탐지능력 입증했지만 한계도 확인됨 [1] 사진	전승지기초	09:01	980	0
[유머] 여친을 실수로 와이프라고 불러보았다 [20] 사진	풀소유	09:01	2,597	1
[이슈] 장동혁대표.정부/여당에 원색적 비난. [6] 사진	세드엘프	08:59	676	1
[계층] ㅎㅂ) 오렌지 땡기는 짤 [11] 사진	부엔까미노	08:55	2,138	2
[계층] 참다랑어 가장 비싼 부위 [1] 사진	부엔까미노	08:52	2,100	1
[계층] 콜드플레이가 소개하는 한국가수 [3] 사진	부엔까미노	08:51	2,130	2
[유머] 일상의 소소한 행복 [6] 사진	부엔까미노	08:50	911	1