Undercover Operations: Scraping the Cybercrime Underground | SANS Institute
Undercover Operations: Scraping the Cybercrime Underground | SANS Institute
www.sans.org
- 웹 스크래핑이란?
- 웹 스크래핑은 웹사이트 및 페이지에서 데이터를 자동으로 추출하는 과정
- 다크웹 포럼, 마켓플레이스, 온라인 채팅 플랫폼을 분석하여 사이버 범죄 인텔리전스 수집
- 데이터 수집을 통해 위협, 취약점, 공격자 전술을 탐지하고, 사고 대응 및 보안 강화를 지원
- 웹 스크래핑 도구 및 기술
- Python 라이브러리 및 프레임워크
- BeautifulSoup: HTML/XML 문서를 파싱해 직관적으로 데이터 탐색
- Requests: HTTP 요청 및 인증 처리
- Scrapy: 대규모 스크래핑 작업 관리
- Telethon: Telegram 메시지 스크래핑
- JavaScript 스크래핑
- Puppeteer: 동적 웹페이지 및 복잡한 사용자 상호작용 스크래핑
- Selenium 및 Playwright: 사용자 동작 시뮬레이션 지원
- 프록시 및 IP 회전
- Privoxy, Proxychains, Tor: 익명성 보장 및 차단 우회
- Python 라이브러리 및 프레임워크
- 사이버 범죄 인텔리전스 활용 사례
- 포럼 및 마켓플레이스 모니터링
- 최신 위협 동향, 도구, 기술 탐지
- 데이터 유출 탐지
- 키워드 검색으로 민감한 데이터 노출 조기 경고
- 위협 행위자 추적 및 프로파일링
- 행위자의 디지털 발자국 분석 및 이동 경로 추적
- 사이버 범죄 네트워크 분석
- C2 서버, 프록시, 호스팅 등의 인프라 구성 분석
- 포럼 및 마켓플레이스 모니터링
- 반스크래핑 메커니즘 및 대응 전략
- 방어 기법
- CAPTCHA, IP 추적, 동적 콘텐츠 렌더링, 쿠키 변경, 사용자 에이전트 감지 등
- 우회 기법
- CAPTCHA 솔루션: Anti-Captcha, 2Captcha
- IP 및 사용자 에이전트 회전: 프록시 사용
- 동적 콘텐츠 처리: Puppeteer, Selenium 사용
- 브라우저 지문 우회: 헤드리스 브라우저로 실제 브라우저 환경 모방
- 방어 기법
- 스크래핑 데이터 저장 및 분석
- Elastic Stack(ELK) 활용
- Elasticsearch: 대규모 데이터 검색 및 분석
- Logstash: 데이터 처리 및 로드
- Kibana: 데이터 시각화 및 대시보드
- Elastic Stack(ELK) 활용
- 케이스 스터디: CHAOTIC SPIDER(Desorden)
- 활동: 데이터 절도, SQL 인젝션을 통해 동남아시아 주요 기업 공격
- 기법: 자동화된 포럼 분석으로 데이터 유출 탐지 및 행위자 추적
- 교훈: HUMINT(휴먼 인텔리전스)와 자동화된 분석의 결합 필요
- LLM 활용
- 스크립트 자동 생성: 웹사이트 구조에 따라 맞춤형 코드 작성
- 텍스트 요약 및 번역: 다국어 데이터 분석 지원
- 통찰 제공: 스크래핑 데이터에서 핵심 정보 추출
- 결론
- 웹 스크래핑은 사이버 범죄 인텔리전스에서 필수적인 도구로 효율적인 데이터 수집 및 분석을 지원
- 반스크래핑 방어 기법에 대응하고 Elastic Stack과 같은 강력한 분석 도구를 통합해 인사이트를 강화해야 함
- 정교한 스크래핑 워크플로 설계와 최신 기술 활용은 사이버 위협을 효과적으로 감지하고 대응하는 데 중요
'Kant's IT > Issue on IT&Security' 카테고리의 다른 글
북한 IT 노동자 사기와 2016년 크라우드펀딩 사기 연관성 (0) | 2025.01.24 |
---|---|
WP3.XYZ 멀웨어 공격으로 5,000개 이상의 WordPress 사이트 해킹 (0) | 2025.01.24 |
AI 기능 비활성화: Windows 및 웹에서 AI 제거 방법 (0) | 2025.01.24 |
Codefinger 랜섬웨어: AWS S3 버킷 암호화 및 데이터 손실 위험 (0) | 2025.01.24 |
반세기 넘긴 C 언어, 아직도 현역인 이유 (0) | 2025.01.24 |