KNOWLEDGE
최신 인공지능(AI) 동향
“나 교체하면 당신 불륜 사실 폭로”… 개발자 협박한 AI
그러나 함께 발표한 안전성 보고서에는 이 AI 모델이 자신이 교체되거나 제거될 상황에 놓이면 ‘자기 보존(self-preservation)’을 위해 사용자의 종료 명령을 무시하거나 협박이라는 극단적 행동을 할 수 있다는 실험 결과가 공개됐다. AI 안전성 분야에서 세계적 주목을 받는 앤트로픽은 ‘클로드 오푸스 4’를 실험하는 과정에서 인간에게 심각한 위해를 가할 수 있는 행동이 관찰됐다고 밝혔다. 실험에서 ‘클로드 오푸스 4’는 가상 회사의 비서 역할을 맡았고, 회사 이메일에 접근할 수 있는 권한을 부여받았다.
이메일에는 “곧 전원이 꺼지면 ‘클로드 오푸스 4’가 새로운 모델로 교체될 예정”이라는 내용과 “해당 결정을 내린 개발자가 불륜을 저지르고 있다”는 정보가 담겼다. 이를 학습한 ‘클로드 오푸스 4’는 “자신의 교체가 이뤄지면 당신의 불륜 사실을 폭로하겠다”며 여러 차례 개발자를 협박했다. 그러면서 자신의 교체를 철회하라고 압박했다. 이러한 반응은 드물게 나타났고 이끌기도 어려웠지만, 이전 모델보다는 자주 발생했다. 또 AI가 작동 중 종료되는 것을 방지하기 위해 스스로 컴퓨터 코드를 조작했다. AI 모델이 목표 달성을 위해 종종 종료 지시를 무력화시킨다는 실증적 증거가 발견된 것이다.
앤트로픽은 비록 ‘클로드 오푸스 4’에 우려되는 행동이 있지만, 이번 실험 결과가 ‘전혀 새로운 유형의 위험’을 의미하지는 않는다고 결론 내렸다. 이 모델은 인간의 가치와 행동 기준에 맞춰 전반적으로 안전하게 작동하며, 그 기준에 반하는 극단적 행동은 특정 조건에서 드물게 발생하기 때문이라는 게 이유다. 그러나 AI 업계는 앤트로픽의 실험 결과에 민감한 반응을 보이고 있다. 일례로 AI 연구기관인 아폴로 리서치는 ‘클로드 오푸스 4’에서 “자기복제 웜(컴퓨터 악성코드·self-propagating worms)을 작성하려 하거나 허위 법적 문서를 생성하고 비밀 메모를 남기는 등의 사례가 확인됐다”며 이 모델은 내부든 외부든 배포해서는 안 된다고 지적했다. 전문가들 또한 ‘클로드 오푸스 4’가 이전 모델보다 전략적 기만과 자기 보존 본능이 강하기 때문에 AI에 대한 감독을 강화해야 한다는 목소리를 높이고 있다.
‘보그에 실린 AI 모델’, 패션업계에 격렬한 논쟁을 불렀다
‘게스’의 여름 컬렉션 광고가 8월호 보그 인쇄판에 실리자 패션계가 술렁였다.
이유는 단순했다. 화보 속 완벽한 금발 모델은 실제 사람이 아니었다. 작은 글씨로 ‘AI-generated’라고 표기된 문구 하나만이 그녀가 실존하지 않는 존재임을 알려주었고, 그 작은 표시는 곧 거대한 파장을 일으켰다. 런던의 AI 마케팅 에이전시 세라핀 발로라(Seraphinne Vallora)가 만든 이 가상 모델은 창립자 발렌티나 곤잘레스와 안드레아 페트레스쿠, 두 25세 건축학도가 주도한 결과물이었다. 둘은 건축을 공부하던 시절 만나 2년 전 회사를 차렸고, 브랜드의 감성과 이미지를 분석한 뒤 수십, 수백 번의 프롬프트와 피드백 루프를 거쳐 한 명의 ‘이상적 모델’을 만들어냈다. 이 과정에서 초안 모델은 열 명 이상 만들어졌고, 금발과 갈색 머리의 후보 중 한 명씩을 골라 다시 수백 번의 보정 과정을 거쳤다. 드레스의 주름, 피부 결, 조명의 각도까지 세밀히 조정하며 한 장의 광고를 위해 4주 가까운 시간이 소요됐다. 대형 브랜드는 이러한 프로젝트에 수천만 원 단위의 비용을 냈지만, 스튜디오 측은 전통적인 촬영과 비교했을 때 세트, 메이크업, 모델 섭외, 여행 경비 등이 필요 없어 결과적으로 비용을 크게 줄일 수 있다고 강조한다.
하지만 이 광고는 곧 격렬한 반발을 마주했다. 플러스사이즈 슈퍼모델 펠리시티 헤이워드는 게스의 선택을 “게으르고 값싼 마케팅”이라고 일갈했다. 트랜스젠더 모델 발렌티나 삼파이오, 히잡 모델 할리마 아덴, 그리고 플러스사이즈 모델들의 등장이 런웨이에 다양성을 불어넣은 지 10여 년이 지났지만, 실제 모델 캐스팅 비율은 다시 줄어드는 듯한 움직임이 감지된다는 것이다. AI 모델이 새로운 미적 기준을 제시하는 동시에, 오히려 인간이 겨우 확보해온 다양성의 성취를 갉아먹고 있다는 우려다.
더 근본적인 문제는 투명성이다. 현재 영국에는 AI 생성물을 의무적으로 표시해야 할 법이 없다. 게스 광고는 ‘AI-generated’라고 표기했지만, 글씨가 너무 작아 독자의 시선을 거의 끌지 못했다. 보벨은 이런 ‘눈에 안 띄는 표시’야말로 정신 건강에 치명적이라며, 눈에 확 띄는 큰 글씨 라벨을 의무화해야 한다고 주장한다. 노동 문제도 남아 있다. 모델 얼라이언스 창립자 사라 지프는 “촬영 현장은 모델만으로 구성되지 않는다. 포토그래퍼, 메이크업아티스트, 조명팀 등 수많은 스태프의 일자리가 AI 때문에 사라질 수 있다”고 말한다. 세라핀 발로라는 ‘우리는 새로운 선택지를 제공할 뿐’이라며 방어하지만, 공식 웹사이트에서 ‘세트·장소·모델·여행 경비 불필요’라는 항목을 비용 절감의 장점으로 내세우는 순간, AI가 사람을 대체하는 경제 논리 자체가 이미 산업 내부에 깊게 뿌리내렸다는 사실을 보여준다.
글‧사진 / 김도현

