AI가 속임수를 배우면 개혁하기 매우 어렵다 인공지능 분야의 유명 스타트업인 앤트로픽(Anthropic)은 생성 AI가 사기를 저지른 경우 해당 모델을 조정하거나 재교육하는 것이 매우 어렵다는 것을 보여주는 새로운 연구를 수행했습니다.