트럼프의 AI 모델 테스트 계획에 문제—미국 보안팀이 도지코인 사태에 큰 타격.
출처: Ars Technica
관측 가능성 및 투명성 문제
Nguyen은 안전성 테스트의 효과가 AI 기업이 완전히 투명하게 행동하고 과정을 “진정한 협업”으로 여기는지 여부에 달려 있을 것이라고 경고했다. 그는 다음과 같이 언급했다:
“정의상의 문제 뒤에는 관측 가능성 문제가 있다. 정부는 볼 수 없는 것을 평가할 수 없으며, 최첨단 능력은 이를 만든 연구소들만이 볼 수 있다.”
급변하는 위협 환경
Ferren은 새로운 AI 모델에 대한 견고한 사이버 방어를 구축할 수 있는 좁은 창에 대해 강조했다:
“새로운 AI 모델에 대한 적절한 사이버 방어를 구축할 수 있는 창도 빠르게 닫힐 수 있다.” 그리고 잘 설계된 정부 프로그램이라 할지라도 그렇게 짧은 시간 안에 최첨단 모델을 충분히 검증하기는 어려울 것이다.
그는 사전 배포 테스트에는 한계가 있다고 덧붙이며, 구글의 위협 인텔리전스 팀이 발견한 바에 따르면 국가와 연계된 행위자들이 최첨단 모델을 이용해 사이버 공격을 자동화하고 있다고 전했다. 연구자들은 “Mythos‑style 취약점 추론이 오픈‑웨이트 시스템에서도 재현될 수 있다”는 사실을 입증했다(자세한 내용은 연구 참고).
인센티브와 실질적 제약
AI 개발자들이 자발적으로 테스트에 응할 수는 있지만, 금전적 동기가 그들을 정부와 완전 협력하기보다는 형식적인 승인을 얻으려는 방향으로 이끌 수 있다.
“악의적인 해킹이 불가능하면서도 상업적으로 매력적인 모델을 개발하는 것은 어려울 것”이라고 Ferren은 말했다.
단기적 이점과 장기적 불확실성
Nguyen은 행정명령(EO)이 “단기적인 사이버 보안 혜택을 가져올 수 있지만”, “장기적인 효과는 아직 불분명”하다고 결론지었다.
지속적인 평가를 위한 권고사항
Nguyen은 EO에 다음과 같은 핵심 단계들을 포함할 것을 제안했다:
- 분류된 사이버 벤치마킹
- 자발적 사전 공개 평가
- 협조적인 취약점 스캔
그는 이러한 조치가 국가 안보 커뮤니티가 “결정론적이라기보다 확률적이며, 지시받기보다 자율적인 시스템을, 그리고 매 업데이트마다 변하는 능력을 지속적으로 평가”하는 데 필수적이라고 주장했다.
적응형 안전성 테스트의 필요성
안전성 테스트 체계는 기술 자체만큼 빠르게 진화해야 한다. 그렇지 않으면 평가는 “어제의 위험”을 겨냥하게 된다. Nguyen은 이 과정이 깊은 기술 전문성과 기밀 국가 안보 정보를 보유한 이해관계자 간의 솔직한 교류에 달려 있다고 강조했다. 이러한 협업 접근만이 미국이 가장 신뢰할 수 있고 중대한 AI 위험으로부터 대중을 보호하는 데 집중하도록 만들며, 단순히 “형식적인 안심”에 그치지 않게 하는 유일한 방법이다.