AI 안전에 관한 조건부 국제 조약 제안: 인류를 지키는 국제법적 해법

작성·수정: 2025-08-20 · 예상 읽기 6~8분

AI 안전과 국제 조약 필요성

인공지능(AI)은 의료 진단, 금융 리스크 평가, 국방 의사결정, 교통 최적화 등 전 산업을 관통하며 비약적으로 확산되었지만, 그만큼 안전 문제도 커졌습니다. 초거대 언어모델의 할루시네이션이 의료·법률 문맥에서 치명적 오류를 만들거나, 자동화된 조합 능력이 생물·사이버 보안의 문턱을 낮출 수 있다는 우려가 대표적입니다. 특히 자율 무기체계와 고성능 모델의 결합은 오판·오남용 가능성을 세계적 차원으로 끌어올립니다. 문제는 이 위험들이 국경을 가리지 않는다는 점입니다. 한 국가의 느슨한 규제가 타국의 안전을 위협할 수 있고, 반대로 과도한 규제는 혁신의 역외 이전(regulatory arbitrage)을 부릅니다. 그래서 제기된 해법이 ‘조건부 국제 조약(Conditional Treaty)’입니다. 모든 AI를 일률적으로 막는 대신, 일정 위험 임계치—예컨대 훈련 연산량, 파라미터 규모, 특정 위험 능력(예: 고급 생물학 설계 보조, 대규모 사이버 침투 시뮬레이션)— 을 넘는 경우에만 국제적 감독과 통제를 의무화하자는 접근입니다. 이는 기술 발전을 전면 제한하지 않으면서도 위험을 초국경적 공공재로 취급해 공동 관리하자는 국제법적 문제의식에서 출발합니다. 키워드: AI 안전, 국제 조약 필요성, 조건부 규제, 초거대 모델, 초국경 위험

조건부 국제 조약의 핵심 구조

조건부 조약의 설계는 트리거–감독–집행의 세 축으로 요약할 수 있습니다. 첫째, 트리거는 규제 ‘발동 조건’입니다. 대표적으로 (1) 훈련 연산량(FLOPs) 또는 전력·시간 기반의 누적 연산 지표, (2) 파라미터 규모 또는 기능 테스트로 측정되는 능력 기반 임계치, (3) 생물·사이버·핵 관련 위험 도메인에서의 금지 또는 고위험 기능 등입니다. 둘째, 감독은 임계치를 넘는 프로젝트가 따라야 할 의무를 뜻합니다. 국제 등록부에 프로젝트를 사전 신고하고, 독립된 평가단의 모델 감사(데이터 출처·학습 절차·안전 가드레일 검증), 적대적 테스트(red-teaming)와 위험 관리 계획(폭주·탈주·자기증식 방지 설계, 킬스위치·운용제한)을 제출하며, 고위험 도메인 접근은 격리된 안전 컴퓨팅 환경에서만 허용됩니다. 셋째, 집행은 보고·검증 불이행 시의 제재를 말합니다. 계산 인프라·가속기 접근 제한, 국경 간 모델 수출·가중치 이전 통제, 국제 연구 보조금·조달 배제 등이 현실적 수단입니다. 이 구조는 원자력 분야의 IAEA처럼 ‘정보 투명성 + 현장검증 + 제재’의 삼중 안전망을 AI에 이식하는 데 초점을 둡니다. 기업의 영업비밀을 보호하기 위해 보호된 검증 채널과 차등 공개(필요 최소 정보) 원칙을 병행하는 설계가 일반적 제안입니다. 키워드: 국제 감독, 모델 감사, 위험 관리, 레드팀, 안전 컴퓨팅, 집행 메커니즘

국제법적 의미와 현실적 난제

국제법 관점에서 조건부 조약은 두 가지 의미가 큽니다. 하나, 예방 원칙(precautionary principle)과 생명권·안전권의 현대적 적용입니다. 잠재적으로 대규모·광역 피해를 유발할 수 있는 기술은 피해 발생 전 단계에서 합리적 예방조치를 취해야 한다는 환경·보건 분야의 원칙을 AI에 확장하는 셈입니다. 둘, 초국경 위험의 공동 관리입니다. 데이터·모델·가중치가 국경을 넘어 순식간에 이동하는 시대에는 전통적 영토 관할만으론 공공재를 지킬 수 없습니다. 다만 난제도 분명합니다. (1) 미·EU·중 등 거대권의 기술·안보 이해가 다르고, (2) 무엇을 ‘고위험’으로 정의할지에 대한 능력 평가 지표 합의가 어렵고, (3) 오픈소스 생태계와 연구 자유, 혁신 촉진을 해치지 않으면서 악용 억제를 달성해야 합니다. 이에 대한 해법으로는 위험 임계치 아래의 연구·오픈소스는 장려하되, 임계치 이상의 모델은 ‘안전 사례(Safety Case) 제출 → 단계적 공개’로 유도하고, 검증가능성(verifiability)을 높이는 감사용 로깅·추적(프로비넌스)을 의무화하는 절충이 논의됩니다. 개발도상국의 공정 접근을 위해 국제 기금으로 평가·감사 비용을 보조하고, 역량 강화(안전 평가 툴·가이드라인 공유)를 병행하는 것도 핵심입니다. 키워드: 국제법, 예방 원칙, 생명권, 공정 접근, 오픈소스, 검증가능성

미래 전망: 보편 규범과 실행 로드맵

조건부 AI 안전 조약은 ‘혁신을 막지 않되, 위험을 공동 관리한다’는 보편 규범을 지향합니다. 실무 로드맵은 다음과 같이 구체화될 수 있습니다. (A) 국제 등록부 설립: 임계치 이상 프로젝트의 사전 신고·변경 신고 의무화, (B) 표준화된 안전 평가: 생물·사이버·자율행동 등 도메인별 SEP 채택, (C) 현장검증 권한을 가진 소형 국제 감독기구 설치와 회원국 내 국가 지정 평가기관 네트워크 연계, (D) 집행 수단: 가중치 이전 신고제, 고위험 모델의 단계적 공개(제한적 API → 제한적 가중치 공유), 위반 시 가속기·클라우드 접근 제한, (E) 정기 재평가: 임계치·평가 항목을 기술 변화에 맞춰 12~18개월 주기로 업데이트. 이러한 체계는 컴퓨트 중심 트리거와 능력 중심 트리거를 혼합해 기술 회피를 줄이고, 산업계에는 예측가능성을, 사회에는 안전 이득을 제공합니다. 핵심은 ‘투명성은 늘리되, 영업비밀은 보호’라는 이중 목표를 균형 있게 달성하는 것입니다. 결과적으로 조건부 조약은 인류 생존과 번영을 위한 안전 레일로 작동하며, 각국이 자국 규제를 상호 인정하고 데이터·평가 기준을 호환시키는 순간 글로벌 거버넌스는 현실이 됩니다. 키워드: 보편 규범, 국제 협상, 국제 감독기구, 단계적 공개, 글로벌 거버넌스, 인류 생존