영국 AI안전연구소는 자체 개발한 ATLAS 벤치마크를 통해 미토스 모델군을 체계적으로 평가했다. 상위 모델인 '미토스-메이저'는 총 78개 사이버 보안 과제 중 26개(33.3%)를 해결했고, 하위 모델 '미토스-마이너'는 22개(28.2%)를 풀었다. 이는 기존 최고 성능 모델이던 클로드 3.5 소네트의 14개(18%)를 크게 상회하는 수치다. 특히 미토스는 네트워크 스캔, 취약한 서비스 식별, 작동하는 익스플로잇 코드 제작, 침해된 시스템에서의 권한 상승에 이르는 전체 공격 체인 — 정찰·익스플로잇·권한 상승·측면 이동 — 을 시연하는 데 성공했다.