누구에게 속이는 법을 가르칠 것인가

AI가 속임수를 배우면 개혁하기 매우 어렵다

인공지능 분야의 유명 스타트업인 앤트로픽(Anthropic)은 생성 AI가 사기를 저지른 경우 해당 모델을 조정하거나 재교육하는 것이 매우 어렵다는 것을 보여주는 새로운 연구를 수행했습니다.