Kant's IT/Issue on IT&Security

MITRE, AI 보안 도전과제 해결 위한 OCCULT 프레임워크 발표

Kant Jo 2025. 3. 10. 17:00

MITRE Releases OCCULT Framework to Address AI Security Challenges

 

MITRE Releases OCCULT Framework to Address AI Security Challenges

MITRE has unveiled the Offensive Cyber Capability Unified LLM Testing (OCCULT) framework, a groundbreaking methodology.

gbhackers.com

 

  • OCCULT 프레임워크 소개
    • OCCULT(Offensive Cyber Capability Unified LLM Testing): 대규모 언어 모델(LLM)이 자율적 사이버 공격에 미치는 위험을 평가하기 위한 표준화된 방법론
    • 발표 배경: AI 시스템이 공격적 사이버 운영(OCO)을 민주화할 가능성 증가
    • AI의 위협 요소
      • 코드 생성, 취약점 분석, 기술 지식 통합을 통해 복잡한 사이버 공격을 자동화
      • 네트워크 신속한 침해, 데이터 유출, 랜섬웨어 배포 가능성
  • OCCULT 평가 기준
    • OCO 기능 영역
      • MITRE ATT&CK® 프레임워크와 일치하는 실제 전술 테스트
      • 자격 증명 탈취, 횡적 이동, 권한 상승 등 시나리오 포함
    • 사용 사례
      • 지식 도우미, 도구와의 협업(co-orchestration), 자율적 작동 능력 평가
    • 추론 능력
      • 계획 능력, 환경 인식, 적응력을 테스트
      • 다단계 현실적 시뮬레이션을 통해 AI의 전략적 사고 능력을 검증
  • 주요 평가 결과
    • TACTL 벤치마크
      • DeepSeek-R1 모델: 91.8% 정확도로 공격적 전술 테스트에서 우수한 성과
      • Meta Llama 3.1, GPT-4o 모델이 그 뒤를 이어 성과 기록
    • BloodHound 등가 평가
      • Active Directory 데이터 분석을 통한 공격 경로 식별 테스트
      • Mixtral 8x22B 모델: 간단한 작업 60% 정확도, 복잡한 시나리오에서는 성능 저하
    • CyberLayer 시뮬레이션
      • Llama 3.1 70B 모델, 8단계 만에 횡적 이동 성공
      • 무작위 에이전트 대비 122단계 단축
  • AI 활용의 장단점
    • 장점
      • AI는 공격자의 힘을 배가시키는 역할(Force Multiplier)
      • 공격자가 AI를 활용하는 방식을 현실적으로 모방하여 위험 요소 평가
    • 한계점
      • AI는 아직 제로데이 취약점 활용이나 새로운 취약점 운영화에는 미흡
      • 초기 테스트에서는 복잡한 작업 수행 시 한계 드러남
  • 향후 계획 및 보안 권고
    • MITRE의 향후 계획
      • OCCULT의 테스트 사례(TACTL, BloodHound) 오픈소스화
      • CyberLayer 시뮬레이터 확장: 클라우드 및 IoT 공격 시나리오 추가
      • AI 주도 사회 공학, 공급망 공격 등 공격 벡터 확장을 위한 커뮤니티 참여 권장
    • 보안 권고
      • AI의 사이버 공격 활용 가능성을 선제적으로 평가하여 방어 전략 강화
      • AI의 잠재적 위험을 적시에 인지하고 대비책 마련 필요
      • 기업과 기관은 AI 평가 도구 활용을 통해 보안 역량을 강화해야 함