OpenAI, 복잡한 작업을 위한 가장 스마트한 모델 GPT-4.1 발표

OpenAI는 공식적으로 GPT-4.1, GPT-4.1 mini, GPT-4.1 nano라는 세 가지 새로운 모델을 출시했습니다. 이러한 모델은 최대 100만 개의 토큰에 달하는 대규모 컨텍스트 처리 기능과 2024년 6월까지 업데이트된 지식 한도를 갖추고 있습니다.

이 회사는 이 모델이 지난 7월에 출시되어 최근 업데이트된 GPT-4o와 GPT-4o 미니보다 성능이 뛰어나다고 밝혔습니다. 현재 GPT-4.1은 API를 통해서만 제공되므로 아직은 ChatGPT에서 직접 사용할 수 없습니다.

OpenAI는 GPT-4.1은 API를 통해서만 사용할 수 있다고 밝혔습니다. ChatGPT에서는 명령어 준수, 프로그래밍, 인텔리전스 측면에서 많은 개선 사항이 최신 버전의 GPT-4o에 점진적으로 통합되었으며, 회사는 향후 릴리스에서 더 많은 기능을 추가할 예정입니다.

OpenAI, 복잡한 작업을 위한 가장 스마트한 모델 GPT-4.1 발표

벤치마크 결과는 GPT-4.1이 놀라운 개선을 가져왔음을 보여줍니다. 이 모델은 SWE-bench Verified에서 54.6%의 점수를 받았으며, 이는 GPT-4o보다 21.4포인트 증가한 수치입니다. 이 모델은 가이드라인 준수를 측정하는 벤치마크인 MultiChallenge에서 38.3%의 점수를 받았고, 모델이 자막 없이 최대 1시간 길이의 비디오를 분석하는 Video-MME 벤치마크에서 72.0%의 점수를 받아 장편 비디오 이해도에서 새로운 기록을 세웠습니다.

OpenAI는 또한 알파 파트너와 협력하여 실제 사용 사례에서 GPT-4.1의 성능을 테스트했습니다.

  • Thomson Reuters는 자사의 법률 AI 지원 서비스인 CoCounsel을 통해 GPT-4.1을 테스트했습니다. GPT-4o와 비교했을 때 GPT-4.1은 다중 문서 평가에서 정확도가 17% 향상되었습니다. 이러한 유형의 작업은 여러 소스에서 맥락을 추적하고 상충되는 용어나 숨겨진 종속성과 같은 복잡한 관계를 식별하는 능력에 크게 의존하며, GPT-4.1은 지속적으로 강력한 성능을 입증했습니다.
  • Carlyle은 GPT-4.1을 사용하여 Excel 및 PDF 파일을 포함한 길고 복잡한 문서에서 재무 데이터를 추출했습니다. 회사 내부 벤치마크에 따르면, 이 모델은 문서 검색 측면에서 이전 모델보다 50% 더 나은 성능을 보였습니다. 이 모델은 "건초더미에서 바늘 찾기", 문서 중간에서 정보 손실, 여러 파일에 걸쳐 정보를 연결해야 하는 인수 등의 문제를 안정적으로 처리하는 최초의 모델입니다.

성능도 중요하지만, 속도도 마찬가지로 중요합니다. OpenAI에 따르면 GPT-4.1은 128,000개의 토큰을 처리할 때 약 15초 만에 첫 번째 토큰을 반환하고, 100만 개의 토큰을 처리할 때는 최대 30초가 걸린다고 합니다. GPT-4.1 미니와 나노는 더 빠릅니다.

GPT-4.1 nano는 일반적으로 128,000개의 입력 토큰이 있는 프롬프트에 5초 이내에 응답합니다. 즉각적인 캐싱을 통해 비용을 절감하는 동시에 지연 시간을 더욱 줄일 수 있습니다.

이미지 이해도 상당한 진전을 이루었습니다. 특히, GPT-4.1 mini는 다양한 시각적 벤치마크에서 GPT-4o보다 우수한 성능을 보입니다.

  • MMMU (그래프, 다이어그램, 지도 포함) 에서 GPT-4.1 mini는 73%를 기록했습니다. 이는 GPT-4.5보다 높고 GPT-4o mini의 56%를 훨씬 넘어섭니다.
  • MathVista (이미지 문제 해결 능력을 테스트하는 기관) 에서는 GPT-4.1과 GPT-4.1 mini 모두 57%의 성적을 기록했는데, 이는 GPT-4o mini의 37%를 훨씬 뛰어넘는 수치입니다.
  • 과학적 그래프를 기반으로 모델이 질문에 답하는 CharXiv-Reasoning 에서는 GPT-4.1이 계속해서 선두를 달리고 있습니다.
  • Video-MME (자막 없는 긴 영상) 에서 GPT-4.1은 72%를 달성했는데, 이는 GPT-4o의 65%에 비해 상당히 개선된 수치입니다.

가격에 관하여:

  • GPT-4.1의 비용은 100만 개의 토큰 입력당 2달러, 출력당 8달러입니다.
  • GPT-4.1 mini의 입력 가격은 0.40달러, 출력 가격은 1.60달러입니다.
  • GPT-4.1 nano의 입력 비용은 $0.10, 출력 비용은 $0.40입니다.

프롬프트 캐싱이나 배치 API를 사용하면 이러한 비용을 더욱 줄일 수 있으며, 이는 대규모 애플리케이션에 매우 유용합니다. OpenAI는 또한 GPT-4.1의 더 나은 성능, 낮은 지연 시간, 낮은 비용을 이유로 2025년 7월 14일에 GPT-4.5 Preview에 대한 지원을 중단할 준비를 하고 있습니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAI, 새로운 브라우저로 구글 크롬에 도전

OpenAI, 새로운 브라우저로 구글 크롬에 도전

OpenAI는 Google Chrome과 직접 경쟁할 수 있는 웹 브라우저 프로젝트를 진행 중이라고 합니다.

삼성, OpenAI와 손잡고 AI TV 개발…다양한 흥미로운 기능 약속

삼성, OpenAI와 손잡고 AI TV 개발…다양한 흥미로운 기능 약속

삼성전자가 OpenAI와 함께 업계 최고의 인공지능 기술을 통합한 AI TV를 개발하는 야심찬 공동 프로젝트를 진행 중인 것으로 알려졌습니다.

Microsoft는 1,000억 달러 이상의 가치로 OpenAI에 계속해서 많은 투자를 할 예정입니다.

Microsoft는 1,000억 달러 이상의 가치로 OpenAI에 계속해서 많은 투자를 할 예정입니다.

마이크로소프트는 2019년부터 OpenAI에 수십억 달러를 투자했지만, 레드먼드에 본사를 둔 이 소프트웨어 대기업이 혁신적인 AI 스타트업에 대한 주요 투자자는 결코 아닙니다.

OpenAI가 세계에서 가장 강력한 AI 코드 편집기 중 하나인 Windsurf를 인수할 예정입니다.

OpenAI가 세계에서 가장 강력한 AI 코드 편집기 중 하나인 Windsurf를 인수할 예정입니다.

OpenAI는 업계를 선도하는 AI 기반 코드 편집기인 Windsurf를 인수하기 위한 협상 중입니다.

O1-pro는 현재까지 OpenAI에서 가장 비싼 AI 모델입니다.

O1-pro는 현재까지 OpenAI에서 가장 비싼 AI 모델입니다.

OpenAI는 개발자 API에서 o1 추론 AI 모델인 o1-pro의 더욱 강력한 버전을 출시했습니다.

OpenAI, ChatGPT 프로젝트 소개: 더욱 스마트한 대화를 위한 새로운 기능

OpenAI, ChatGPT 프로젝트 소개: 더욱 스마트한 대화를 위한 새로운 기능

프로젝트를 만들면 사용자는 대화, 파일, 사용자 정의 지침을 모두 한곳에 보관할 수 있습니다. 이를 통해 사용자는 쉽게 이전에 하던 작업으로 돌아갈 수 있습니다.

OpenAI, 12월 차세대 AI 모델 오리온 출시

OpenAI, 12월 차세대 AI 모델 오리온 출시

The Verge에 따르면 OpenAI는 12월에 다음 주요 AI 모델인 Orion을 출시할 계획입니다.

알리바바, 인간의 감정을 읽는 AI 모델 출시

알리바바, 인간의 감정을 읽는 AI 모델 출시

중국 전자상거래 거대 기업 알리바바는 인간의 감정을 읽을 수 있다고 주장하는 새로운 AI 모델을 출시하며 계속해서 화제를 모으고 있습니다.

OpenAI, GPT Store 및 ChatGPT 팀 출시로 ChatGPT 생태계를 한 단계 더 발전

OpenAI, GPT Store 및 ChatGPT 팀 출시로 ChatGPT 생태계를 한 단계 더 발전

오랜 기다림과 수많은 소문 끝에 OpenAI가 마침내 오랫동안 기다려온 GPT Store와 ChatGPT 팀의 출시를 발표했습니다.

Copilot은 GPT-4 Turbo를 무료로 사용할 수 있는 가장 좋은 방법입니다.

Copilot은 GPT-4 Turbo를 무료로 사용할 수 있는 가장 좋은 방법입니다.

GPT-4 Turbo를 사용해보고 싶다면 Microsoft의 Copilot 도구를 사용하는 것이 가장 좋은 방법입니다.

OpenAI, 단 15초 녹음으로 음성 재구성 기술 개발

OpenAI, 단 15초 녹음으로 음성 재구성 기술 개발

OpenAI가 단 15초 녹음으로 누구의 목소리든 재현할 수 있는 기술을 출시했습니다.

OpenAI, 모든 사용자를 위한 ChatGPT 검색 분리, 계정 필요 없음

OpenAI, 모든 사용자를 위한 ChatGPT 검색 분리, 계정 필요 없음

OpenAI는 ChatGPT 사용자가 더 이상 로그인하지 않고도 AI 모델의 검색 엔진 기능을 사용할 수 있다고 발표했습니다.

Microsoft는 사용자가 GPT와 유사하게 Copilot 챗봇의 자체 버전을 만들 수 있도록 허용할 예정입니다.

Microsoft는 사용자가 GPT와 유사하게 Copilot 챗봇의 자체 버전을 만들 수 있도록 허용할 예정입니다.

Copilot GPT라고 불리는 이 기능을 사용하면 사용자는 "자신이 특히 관심 있는 주제에 대한 Copilot의 동작을 사용자 지정"할 수 있습니다.

OpenAI, 개발자 API에 최신 이미지 생성 모델 제공

OpenAI, 개발자 API에 최신 이미지 생성 모델 제공

지난달, OpenAI는 새로운 모델을 기반으로 한 ChatGPT의 이미지 생성 기능에 대한 주요 업데이트를 출시했습니다.

대수란 무엇인가?

대수란 무엇인가?

혼합수는 정수와 분수의 조합입니다. 혼합수의 분수 부분은 항상 1보다 작습니다.

부자처럼 여행하기 위한 팁

부자처럼 여행하기 위한 팁

여행 예산이 부족한가요? 걱정하지 마세요. 유명한 여행 전문가가 공유한 아래 팁을 활용하면 부자처럼 여행하는 데 도움이 될 것입니다.

모바일을 위한 최고의 Obsidian 플러그인 7가지

모바일을 위한 최고의 Obsidian 플러그인 7가지

인터페이스를 조정하고 Obsidian을 더 효율적으로 실행할 수 있도록 하는 것 외에도, 더 풍부한 노트 작성 도구 세트를 제공할 예정입니다.

흐릿한 외부 디스플레이를 수정하는 방법

흐릿한 외부 디스플레이를 수정하는 방법

어두운 외부 디스플레이는 생산성을 저해하고 눈의 피로를 유발할 수 있습니다. 다행히도 흐릿한 화면을 고치는 데 할 수 있는 몇 가지 방법이 있습니다!

남성과 여성의 상징은 어디에서 왔는가?

남성과 여성의 상징은 어디에서 왔는가?

오늘날 인기 있는 남성 및 여성 상징의 의미를 모든 사람이 알고 있는 것은 아닐 수도 있습니다. 남성과 여성의 상징에 대해 더 알아보세요!

과학자들은 블랙홀의 신비한 역사를 해독했습니다.

과학자들은 블랙홀의 신비한 역사를 해독했습니다.

블랙홀에 대한 흔한 오해 중 하나는 블랙홀이 물질을 삼킬 뿐만 아니라 그 물질의 역사까지 삼킨다는 것입니다. 블랙홀의 역사에 대한 진실이 마침내 밝혀졌습니다.

여러 개의 Adobe Mobile 앱이 필요 없습니다. Adobe Express만 있으면 됩니다!

여러 개의 Adobe Mobile 앱이 필요 없습니다. Adobe Express만 있으면 됩니다!

Adobe는 휴대폰에서 4개 이상의 특정 사진 편집 앱을 제공합니다. 모두 너무 유사해서 실제로 필요한 앱을 구분하기 어렵습니다.

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV도 몇 가지 가젯을 사용하면 새로운 기능을 익혀 단 몇 분 만에 값비싼 스마트 TV보다 더 나은 TV가 될 수 있습니다.

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨을 올바르게 사용하면 에어컨의 기능을 최대한 활용하는 데 도움이 됩니다.

Gemini가 사진, 파일 및 YouTube에 대한 Talk Live를 출시합니다.

Gemini가 사진, 파일 및 YouTube에 대한 Talk Live를 출시합니다.

Gemini Live에 "Talk Live about" 기능이 추가되었으며, 이제 Android 기기에서 더 광범위하게 출시될 예정입니다. 기존 제미니 라이브는 음성 입력만 가능했지만, 'Talk Live about'을 통해 콘텐츠 업로드가 확대됐다.

심층 연구로 업그레이드된 Microsoft Copilot

심층 연구로 업그레이드된 Microsoft Copilot

Microsoft는 마침내 Copilot AI에 심층 연구 기능을 도입했습니다. 이를 통해 사용자는 어떤 주제에 대해서든 철저하고 여러 단계의 조사를 수행할 수 있습니다.

포토샵에서 사진을 연필 스케치로 바꾸는 방법

포토샵에서 사진을 연필 스케치로 바꾸는 방법

이 튜토리얼에서는 Adobe Photoshop을 사용하여 사진을 연필 스케치로 쉽게 바꾸는 방법을 보여줍니다.

Golang의 Volatile 함수

Golang의 Volatile 함수

Go의 가변 함수를 사용하면 함수에 가변 개수의 인수를 전달할 수 있습니다. Golang의 volatile 함수에 대해 알아야 할 모든 것을 소개합니다.

Lien Quan Mobile에서 컬러 글자를 쓰는 방법

Lien Quan Mobile에서 컬러 글자를 쓰는 방법

Lien Quan Mobile에서 컬러 텍스트를 작성하려면 이 문서의 지침을 따르세요. LQ 모바일 컬러 문자가 더욱 눈에 띄게 됩니다.

절대 끝나서는 안 될 7가지 작업 관리자 프로세스

절대 끝나서는 안 될 7가지 작업 관리자 프로세스

Windows 10 작업 관리자 목록 하단에 있는 Windows 시스템 프로세스 섹션에는 컴퓨터가 제대로 작동하는 데 필수적인 몇 가지 중요한 프로세스가 포함되어 있습니다.