2026/06/10/anthropic-s-public-fable-model-frustrates
Anthropic 공개형 보안 AI Fable, 과도한 안전장치로 무해한 보안 작업까지 차단해 연구자 반발 확산
편집자 요약
Anthropic은 강력한 사이버보안 모델 Mythos의 공개·제한 버전인 Fable을 출시했지만, 보안 연구자들은 안전장치가 지나치게 넓게 작동한다고 지적합니다. Fable은 사이버보안 또는 생물학 관련으로 판단한 프롬프트를 차단하고, 경우에 따라 Claude Opus 4.8로 전환하며, 블로그 읽기나 안전한 코드 작성 같은 무해한 요청도 거부한다는 불만이 나왔습니다.
맥락
Anthropic의 접근은 AI가 malware 개발이나 software compromise에 악용될 위험을 줄이려는 조치지만, keyword 기반으로 보이는 차단은 정당한 보안 연구와 software engineering 업무의 활용성을 떨어뜨릴 수 있습니다. 이번 논란은 고위험 AI 모델에서 남용 방지와 전문 사용자의 생산성 사이 균형을 어떻게 설계할지가 핵심 경쟁 요소로 부상하고 있음을 보여줍니다.
본문
Cybersecurity researchers aren't happy about the guardrails on Anthropic's Fable
댓글
토론
> geekhaus:~$ 다음 읽을거리?


