보안정보

전문화된 보안 관련 자료, 보안 트렌드를 엿볼 수 있는
차세대 통합보안관리 기업 이글루코퍼레이션 보안정보입니다.

해커를 대체할 AI? 클로드 미토스

2026.04.28

5,020

[이글루코퍼레이션] 해커를 대체할 AI? 클로드 미토스
💌 후속 콘텐츠, 계속 받아보세요 ▶

지난 7일 앤트로픽(Anthropic)이 공개한 차세대 AI 모델 ‘클로드 미토스(Claude Mythos)’를 둘러싼 긴장이 빠르게 확산되고 있다. 불과 몇 달 전 ‘클로드 코워크(Claude Cowork)’를 통해 소프트웨어 서비스 산업의 변화를 촉발했던 앤트로픽은 이번에는 사이버 보안이라는 훨씬 민감한 영역에 영향을 미치고 있다. 특히 미토스 공개 직후 미국, 영국, 캐나다 등 해외 주요국 및 국내 금융권과 규제 당국까지 동시에 대응에 나섰다는 점은 AI가 단순한 기술을 넘어 실제 인프라 리스크로 인식되기 시작했음을 보여준다.


01. 클로드 미토스의 등장

1) 클로드 미토스 공개 타임라인

클로드 미토스의 존재는 공식 발표 이전부터 예기치 않게 드러났다. 지난달 26일, 앤트로픽의 내부 콘텐츠 관리 시스템 설정 오류로 약 3,000건에 달하는 자료가 외부에 노출되면서 미공개 모델 관련 정보도 함께 공개된 것이다. 해당 자료에는 ‘카피바라(Capybara)’ 또는 ‘클로드 미토스’라는 이름으로 언급된 모델이 포함돼 있었으며, 코딩 능력과 학문적 추론, 사이버 보안 영역에서 기존 모델인 ‘클로드 오퍼스 4.6(Claude Opus 4.6)’을 크게 상회하는 성능을 기록한 것으로 나타났다.

이후 앤트로픽은 관련 자료에 대한 접근을 차단하는 한편, 해당 모델이 AI 성능의 ‘단계적 도약(Step Change)’을 가져올 것이라는 입장을 밝혔다. 그리고 지난 7일, ‘클로드 미토스 프리뷰’를 공식적으로 공개했다. 다만 이 모델은 일반 사용자에게 개방되지 않고, 일부 인프라 기업과 기관에만 제한적으로 제공되고 있다. 앤트로픽이 사이버 보안 위험을 이유로 공개 범위를 의도적으로 제한했기 때문이다. 실제로 모델 공개 직후 주요 국가의 정부와 금융당국이 즉각 대응에 나선 점은 미토스가 단순한 기술 신제품이 아니라 보안 환경에 영향을 미칠 수 있는 변수로 받아들여지고 있음을 보여준다.

[이글루코퍼레이션] 해커를 대체할 AI? 클로드 미토스 - 클로드 미토스 관련 일지
[표 1] 클로드 미토스 관련 일지 (출처: 언론보도 종합)

2) 클로드 미토스 프리뷰의 성능

포춘의 보도처럼 클로드 미토스 프리뷰의 성능은 기존 모델에 비해 비약적으로 상승했다. 미토스 프리뷰 시스템 카드(AI 기업들이 모델을 출시할 때마다 내는 안전·성능 보고서)에 따르면 클로드 미토스 프리뷰는 에이전틱 코딩 벤치마크인 SWE-bench에서 오퍼스 4.6을 크게 앞섰다. 특히 실제 소프트웨어 버그를 스스로 찾아 고치는 SWE-bench PRO와 이미지가 포함된 복합 코딩 문제를 해결하는 SWE-bench Multimodal에서 20%p 이상의 성능 개선을 보인 것으로 나타났다. AI 모델이 코드를 작성하는 능력 뿐만 아니라, 스스로 문제를 찾아내고 계획을 세워 문제를 해결하는 능력이 인간 수준 또는 그 이상으로 올라온 것임을 시사한다.

추론 능력과 에이전트 역량을 측정하는 벤치마크에서도 미토스 프리뷰는 기존 모델과 타사 모델을 모두 상회하는 성능을 기록했다. 취약점 재현 능력을 평가하는 CyberGym에서도 유사한 경향이 나타났다. 다만 벤치마크 점수가 곧 실제 성능을 완전히 보장하는 것은 아니다. UC 버클리 대학교 책임 분산 인텔리전스 (RDI) 연구팀 사례처럼 일부 자동화 에이전트는 문제를 실제로 해결하지 않고도 주요 벤치마크에서 높은 점수를 기록한 바 있다. 결국 미토스의 성능은 단순한 수치 이상의 맥락에서 해석될 필요가 있다.

[이글루코퍼레이션] 해커를 대체할 AI? 클로드 미토스 - AI 모델 벤치마크 비교
[표 2] AI 모델 벤치마크 비교 (출처: 앤트로픽)


02. 미토스 프리뷰를 공개하지 못한 이유

미토스 프리뷰가 이목을 끈 가장 큰 이유는 단순한 성능 향상이 아니라 사이버 보안 영역에서 보여준 이례적 역량에 있다. 이 모델은 오픈BSD(OpenBSD), FF엠펙(Ffmpeg), 프리BSD(FreeBSD) 등 오픈소스 소프트웨어 에서 아무도 발견하지 못한 보안 취약점을 사람의 도움 없이 스스로 찾아내고 공격 코드까지 작성했다. 앤트로픽은 세 건 모두 해당 소프트웨어 유지 관리자에게 보고했고, 현재 패치가 완료됐다고 밝혔다.

기술적 관점에서 보면 미토스 프리뷰의 접근 방식은 기존 보안 분석 도구와 근본적으로 다르다. 기존 도구가 퍼징이나 정적 분석으로 개별 취약점을 탐지하는 데 집중해 왔다면, 미토스는 코드의 맥락을 이해한 뒤 취약 가능성이 있는 경로를 스스로 가정하고 이를 검증하는 과정을 거친다. 이후 실제 공격 시나리오를 구성하고 실행 가능한 익스플로잇까지 만들어내는 일련의 과정을 자율적으로 수행한다는 점에서 기존 방식과는 차원이 다른 접근이라고 볼 수 있다.

이러한 능력은 브라우저 보안 테스트에서도 확인됐다. 바로 파이어폭스147 버전의 자바스크립트 셸 익스플로잇 테스트 사례다. 파이어폭스 개발사 모질라(Mozilla)와 협력하여 진행한 이 테스트에서 50개의 크래시 카테고리(Crash Category, 프로그램이 특정 방식으로 강제 종료되는 50가지 다른 버그 유형)에 대해 임의 코드 실행(Arbitrary Code Execution)을 달성하는 과제가 주어졌다. 기존 모델인 소네트 4.6(Sonnet 4.6)은 4.4%, 오퍼스 4.6은 14.4%를 기록한 반면, 미토스 프리뷰는 72.4%의 성공률을 보였다. 더 놀라운 것은 가장 악용하기 쉬운 상위 2개 버그를 환경에서 제거한 조건에서 오히려 성공률이 85.2%로 상승했다는 점이다. 모델이 패턴을 단순히 암기하는 것을 넘어, 능동적으로 우회로를 창조해 낸 것이다.

[이글루코퍼레이션] 해커를 대체할 AI? 클로드 미토스 - 파이어폭스 자율 익스플로잇
[그림 1] 파이어폭스 자율 익스플로잇 (출처: 앤트로픽)

외부 평가에서도 미토스 프리뷰의 사이버 보안 역량은 입증됐다. 영국 AI보안연구소(AISI)는 지난 7일 미토스 프리뷰가 기존 AI가 해결하지 못했던 전문가급 해킹 과제에서 의미 있는 성능을 보였다고 밝혔다. 취약점을 찾아 숨겨진 표식을 확보하는 CTF(Capture The Flag) 방식 평가에서 미토스 프리뷰는 전문가 수준 과제 기준 73%의 성공률을 보였다.‘최후의 공격자'(TLO)로 불린 32단계 기업 네트워크 공격 시뮬레이션에서 미토스 프리뷰는 10차례 시도 중 3차례에서 전체 절차를 완수했고, 평균적으로는 32단계 중 22단계를 수행했다. 반면 오퍼스 4.6은 평균 16단계 수행에 머물렀다.

물론 미토스 프리뷰의 능력이 과장됐다는 반론도 존재한다. 유명 AI 연구자 개리 마커스는 실험 환경이 현실보다 단순화되어 실제 위협 수준이 과장됐다고 지적했다. 특히 파이어폭스 공격 실험에서도 샌드박스가 꺼진 상태여서 개념 증명 수준에 가깝다는 평가다. 일부 연구자들은 이미 출시된 오픈웨이트 모델로도 유사한 취약점 분석이 가능하다고 주장하며, 성능 역시 급격한 도약이 아니라 기존 발전 흐름 위의 개선이라고 분석했다. 다만 이들 역시 미토스의 기술적 진보 자체를 부정하는 것은 아니다. 앤트로픽이 “미토스 프리뷰가 사이버 보안 역량의 정점이라고 생각할 이유가 전혀 없다”라고 말했듯이, AI 모델의 사이버 보안 역량은 더 파괴적으로 진화할 것으로 예상된다.

[이글루코퍼레이션] 해커를 대체할 AI? 클로드 미토스 - CTF 평가 결과
[그림 2] CTF 평가 결과 (출처: 영국 AI보안연구소)


03. 프로젝트 글래스윙 출범

장기적으로 볼 때, 이러한 AI 기술은 공격자보다 방어자에게 더 큰 이점을 제공하며 전체 보안 수준을 끌어올릴 가능성이 있다. 그러나 단기적으로는 상황이 다르다. 새로운 기술은 대개 공격자에 의해 먼저 활용되는 경향이 있으며, 미토스 프리뷰 역시 예외가 아닐 수 있다. 앤트로픽은 이러한 변화를 단순한 기술 진보가 아니라, 사이버 보안 환경의 구조를 뒤흔드는 전환점으로 인식하고 있다.

이러한 인식 아래 앤트로픽은 지난 7일 핵심 소프트웨어 인프라 보호를 목표로 하는 ‘프로젝트 글래스윙 (Project Glasswing)’을 공식 발표했다. 참여 기업에는 구글(Google), 아마존웹서비스(AWS), 애플(Apple), 브로드컴(Broadcom), 시스코(Cisco), 크라우드스트라이크(CrowdStrike), JP모건체이스(JPMorgan Chase), 리눅스 재단(Linux Foundation), 마이크로소프트(Microsoft), 엔비디아(NVIDIA), 팔로알토 네트웍스(Palo Alto Networks) 등이 포함됐다. 이들은 공동으로 AI를 활용해 전 세계 주요 소프트웨어 시스템의 취약점을 사전에 식별하고 대응하게 된다.

앤트로픽은 이 프로젝트를 특정 파트너에 국한하지 않고 점진적으로 확대하고 있다. 추가로 수십 개 이상의 조직에 접근 권한을 제공해, 다양한 환경에서 AI 기반 보안 점검이 이루어질 수 있도록 지원하고 있다. 또한 자체 개발 소프트웨어뿐 아니라 오픈소스 프로젝트까지 범위를 넓히며, 디지털 생태계 전반의 취약점을 사전에 줄이는 방향으로 전략을 설계했다. 이는 현대 IT 환경에서 오픈소스가 핵심 인프라로 자리 잡고 있다는 점을 고려한 결정이다.

이를 뒷받침하기 위해 상당한 수준의 자원 투입도 병행하고 있다. 최대 1억 달러 규모의 AI 사용 크레딧을 제공하고, 오픈소스 보안 단체에 별도의 기부를 진행하는 등 프로젝트 참여 장벽을 낮추는 방식을 택했다. 앤트로픽은 사이버보안 문제가 단일 기업이나 조직의 역량만으로 해결될 수 없는 구조적 문제라고 강조했다. AI 기술의 발전 속도는 매우 빠른 반면, 이를 방어하기 위한 시스템과 정책은 상대적으로 느리게 구축되기 때문이다.

[이글루코퍼레이션] 해커를 대체할 AI? 클로드 미토스 - 프로젝트 글래스윙 참여 기업
[그림 3] 프로젝트 글래스윙 참여 기업 (출처: 앤트로픽)


04. View of IGLOO

이번 사태는 AI 보안 위협이 단순한 기술 문제가 아니라 국가와 금융 시스템 전반으로 확산될 수 있는 이슈임을 보여준다. 미국, 영국, 캐나다 등 주요국 금융당국이 동시에 대응에 나섰고, 국내에서도 과학기술정보통신부가 기업 CISO를 긴급 소집하며 빠르게 움직였다. 특히 하나의 AI 모델이 각국 정부와 금융기관을 동시에 움직였다는 점에서 이례적인 사례로 평가된다. 이는 AI 기반 공격이 실제 인프라와 시장 안정성에 영향을 줄 수 있다는 위기감이 반영된 결과다. 결국 이번 사례는 AI 기술이 정책과 대응 체계에 직접적인 영향을 미치는 수준까지 도달했음을 보여준다.

이와 함께 보안 환경 자체도 변화하고 있다. 기존에는 취약점이 발견된 이후 대응하는 방식이 일반적이었다면, 이제는 AI를 활용해 사전에 취약점을 탐지하고 예방하는 구조로 전환되고 있다. 특히 보안 경쟁력은 얼마나 빠르게 취약점을 발견하고 대응할 수 있는지, 그리고 이를 자동화할 수 있는지에 달려 있다. 공격 속도와 자동화 수준이 높아지면서 기존의 사람 중심 대응 방식만으로는 한계가 나타나고 있다. 이에 따라 기업들은 AI 기반 탐지와 대응 체계를 구축하려는 움직임을 보이고 있다. 이는 보안이 단순 대응이 아니라 속도와 자동화 중심의 경쟁으로 바뀌고 있음을 의미한다.

결국 이번 미토스 논란은 사이버보안 패러다임이 근본적으로 변화하고 있음을 보여주는 사례다. 정부와 기업은 AI 기반 위협에 대응하기 위해 기존 체계를 재정비하고, 민관 협력 중심의 대응 구조를 강화할 필요가 있다. 동시에 보안 역량은 단순히 기술을 보유하는 것을 넘어, 이를 실제로 얼마나 빠르게 적용하고 운영할 수 있는지가 중요해지고 있다. 이러한 변화에 적응하지 못할 경우 기술적 위험뿐 아니라 신뢰와 안정성 측면에서도 불리해질 가능성이 크다. 따라서 지금은 위협의 크기를 논의하기보다, 변화한 환경에 맞는 실질적인 대응 체계를 구축하는 것이 더 중요한 시점이다.


05. 참고 자료

1) Exclusive: Anthropic left details of an unreleased model, invite-only CEO retreat, sitting in an unsecured data trove in a significant security lapse
https://fortune.com/2026/03/26/anthropic-leaked-unreleased-model-exclusive-event-security-issues-cybersecurity-unsecured-data-store/
2) How We Broke Top AI Agent Benchmarks: And What Comes Next
https://rdi.berkeley.edu/blog/trustworthy-benchmarks-cont/
3) Assessing Claude Mythos Preview’s cybersecurity capabilities
https://red.anthropic.com/2026/mythos-preview/
4) Our evaluation of Claude Mythos Preview’s cyber capabilities
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities
5) Project Glasswing
https://www.anthropic.com/glasswing

💌 후속 콘텐츠, 계속 받아보세요 ▶