OpenAI, 복잡한 작업을 위한 가장 스마트한 모델 GPT-4.1 발표

OpenAI는 공식적으로 GPT-4.1, GPT-4.1 mini, GPT-4.1 nano라는 세 가지 새로운 모델을 출시했습니다. 이러한 모델은 최대 100만 개의 토큰에 달하는 대규모 컨텍스트 처리 기능과 2024년 6월까지 업데이트된 지식 한도를 갖추고 있습니다.

이 회사는 이 모델이 지난 7월에 출시되어 최근 업데이트된 GPT-4o와 GPT-4o 미니보다 성능이 뛰어나다고 밝혔습니다. 현재 GPT-4.1은 API를 통해서만 제공되므로 아직은 ChatGPT에서 직접 사용할 수 없습니다.

OpenAI는 GPT-4.1은 API를 통해서만 사용할 수 있다고 밝혔습니다. ChatGPT에서는 명령어 준수, 프로그래밍, 인텔리전스 측면에서 많은 개선 사항이 최신 버전의 GPT-4o에 점진적으로 통합되었으며, 회사는 향후 릴리스에서 더 많은 기능을 추가할 예정입니다.

OpenAI, 복잡한 작업을 위한 가장 스마트한 모델 GPT-4.1 발표

벤치마크 결과는 GPT-4.1이 놀라운 개선을 가져왔음을 보여줍니다. 이 모델은 SWE-bench Verified에서 54.6%의 점수를 받았으며, 이는 GPT-4o보다 21.4포인트 증가한 수치입니다. 이 모델은 가이드라인 준수를 측정하는 벤치마크인 MultiChallenge에서 38.3%의 점수를 받았고, 모델이 자막 없이 최대 1시간 길이의 비디오를 분석하는 Video-MME 벤치마크에서 72.0%의 점수를 받아 장편 비디오 이해도에서 새로운 기록을 세웠습니다.

OpenAI는 또한 알파 파트너와 협력하여 실제 사용 사례에서 GPT-4.1의 성능을 테스트했습니다.

  • Thomson Reuters는 자사의 법률 AI 지원 서비스인 CoCounsel을 통해 GPT-4.1을 테스트했습니다. GPT-4o와 비교했을 때 GPT-4.1은 다중 문서 평가에서 정확도가 17% 향상되었습니다. 이러한 유형의 작업은 여러 소스에서 맥락을 추적하고 상충되는 용어나 숨겨진 종속성과 같은 복잡한 관계를 식별하는 능력에 크게 의존하며, GPT-4.1은 지속적으로 강력한 성능을 입증했습니다.
  • Carlyle은 GPT-4.1을 사용하여 Excel 및 PDF 파일을 포함한 길고 복잡한 문서에서 재무 데이터를 추출했습니다. 회사 내부 벤치마크에 따르면, 이 모델은 문서 검색 측면에서 이전 모델보다 50% 더 나은 성능을 보였습니다. 이 모델은 "건초더미에서 바늘 찾기", 문서 중간에서 정보 손실, 여러 파일에 걸쳐 정보를 연결해야 하는 인수 등의 문제를 안정적으로 처리하는 최초의 모델입니다.

성능도 중요하지만, 속도도 마찬가지로 중요합니다. OpenAI에 따르면 GPT-4.1은 128,000개의 토큰을 처리할 때 약 15초 만에 첫 번째 토큰을 반환하고, 100만 개의 토큰을 처리할 때는 최대 30초가 걸린다고 합니다. GPT-4.1 미니와 나노는 더 빠릅니다.

GPT-4.1 nano는 일반적으로 128,000개의 입력 토큰이 있는 프롬프트에 5초 이내에 응답합니다. 즉각적인 캐싱을 통해 비용을 절감하는 동시에 지연 시간을 더욱 줄일 수 있습니다.

이미지 이해도 상당한 진전을 이루었습니다. 특히, GPT-4.1 mini는 다양한 시각적 벤치마크에서 GPT-4o보다 우수한 성능을 보입니다.

  • MMMU (그래프, 다이어그램, 지도 포함) 에서 GPT-4.1 mini는 73%를 기록했습니다. 이는 GPT-4.5보다 높고 GPT-4o mini의 56%를 훨씬 넘어섭니다.
  • MathVista (이미지 문제 해결 능력을 테스트하는 기관) 에서는 GPT-4.1과 GPT-4.1 mini 모두 57%의 성적을 기록했는데, 이는 GPT-4o mini의 37%를 훨씬 뛰어넘는 수치입니다.
  • 과학적 그래프를 기반으로 모델이 질문에 답하는 CharXiv-Reasoning 에서는 GPT-4.1이 계속해서 선두를 달리고 있습니다.
  • Video-MME (자막 없는 긴 영상) 에서 GPT-4.1은 72%를 달성했는데, 이는 GPT-4o의 65%에 비해 상당히 개선된 수치입니다.

가격에 관하여:

  • GPT-4.1의 비용은 100만 개의 토큰 입력당 2달러, 출력당 8달러입니다.
  • GPT-4.1 mini의 입력 가격은 0.40달러, 출력 가격은 1.60달러입니다.
  • GPT-4.1 nano의 입력 비용은 $0.10, 출력 비용은 $0.40입니다.

프롬프트 캐싱이나 배치 API를 사용하면 이러한 비용을 더욱 줄일 수 있으며, 이는 대규모 애플리케이션에 매우 유용합니다. OpenAI는 또한 GPT-4.1의 더 나은 성능, 낮은 지연 시간, 낮은 비용을 이유로 2025년 7월 14일에 GPT-4.5 Preview에 대한 지원을 중단할 준비를 하고 있습니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-pro는 현재까지 OpenAI에서 가장 비싼 AI 모델입니다.

O1-pro는 현재까지 OpenAI에서 가장 비싼 AI 모델입니다.

OpenAI는 개발자 API에서 o1 추론 AI 모델인 o1-pro의 더욱 강력한 버전을 출시했습니다.

OpenAI, ChatGPT 프로젝트 소개: 더욱 스마트한 대화를 위한 새로운 기능

OpenAI, ChatGPT 프로젝트 소개: 더욱 스마트한 대화를 위한 새로운 기능

프로젝트를 만들면 사용자는 대화, 파일, 사용자 정의 지침을 모두 한곳에 보관할 수 있습니다. 이를 통해 사용자는 쉽게 이전에 하던 작업으로 돌아갈 수 있습니다.

OpenAI, 12월 차세대 AI 모델 오리온 출시

OpenAI, 12월 차세대 AI 모델 오리온 출시

The Verge에 따르면 OpenAI는 12월에 다음 주요 AI 모델인 Orion을 출시할 계획입니다.

알리바바, 인간의 감정을 읽는 AI 모델 출시

알리바바, 인간의 감정을 읽는 AI 모델 출시

중국 전자상거래 거대 기업 알리바바는 인간의 감정을 읽을 수 있다고 주장하는 새로운 AI 모델을 출시하며 계속해서 화제를 모으고 있습니다.

OpenAI, GPT Store 및 ChatGPT 팀 출시로 ChatGPT 생태계를 한 단계 더 발전

OpenAI, GPT Store 및 ChatGPT 팀 출시로 ChatGPT 생태계를 한 단계 더 발전

오랜 기다림과 수많은 소문 끝에 OpenAI가 마침내 오랫동안 기다려온 GPT Store와 ChatGPT 팀의 출시를 발표했습니다.

Copilot은 GPT-4 Turbo를 무료로 사용할 수 있는 가장 좋은 방법입니다.

Copilot은 GPT-4 Turbo를 무료로 사용할 수 있는 가장 좋은 방법입니다.

GPT-4 Turbo를 사용해보고 싶다면 Microsoft의 Copilot 도구를 사용하는 것이 가장 좋은 방법입니다.

OpenAI, 단 15초 녹음으로 음성 재구성 기술 개발

OpenAI, 단 15초 녹음으로 음성 재구성 기술 개발

OpenAI가 단 15초 녹음으로 누구의 목소리든 재현할 수 있는 기술을 출시했습니다.

OpenAI, 모든 사용자를 위한 ChatGPT 검색 분리, 계정 필요 없음

OpenAI, 모든 사용자를 위한 ChatGPT 검색 분리, 계정 필요 없음

OpenAI는 ChatGPT 사용자가 더 이상 로그인하지 않고도 AI 모델의 검색 엔진 기능을 사용할 수 있다고 발표했습니다.

Microsoft는 사용자가 GPT와 유사하게 Copilot 챗봇의 자체 버전을 만들 수 있도록 허용할 예정입니다.

Microsoft는 사용자가 GPT와 유사하게 Copilot 챗봇의 자체 버전을 만들 수 있도록 허용할 예정입니다.

Copilot GPT라고 불리는 이 기능을 사용하면 사용자는 "자신이 특히 관심 있는 주제에 대한 Copilot의 동작을 사용자 지정"할 수 있습니다.

OpenAI, 개발자 API에 최신 이미지 생성 모델 제공

OpenAI, 개발자 API에 최신 이미지 생성 모델 제공

지난달, OpenAI는 새로운 모델을 기반으로 한 ChatGPT의 이미지 생성 기능에 대한 주요 업데이트를 출시했습니다.

미국, 딥시크(DeepSeek) 운영 위해 중국으로 엔비디아 GPU 밀수 조사 고려

미국, 딥시크(DeepSeek) 운영 위해 중국으로 엔비디아 GPU 밀수 조사 고려

기술 세계를 뒤흔들고 있는 무료 AI 모델을 만든 중국 기업 DeepSeek은 자사의 AI 모델을 훈련하고 운영하는 데 밀수된 Nvidia GPU를 사용했다는 등 여러 가지 부정적인 혐의에 직면해 있습니다.

OpenAI, ChatGPT로 생성된 텍스트에 워터마크 추가 고려

OpenAI, ChatGPT로 생성된 텍스트에 워터마크 추가 고려

월스트리트 저널에 따르면, OpenAI는 ChatGPT가 생성한 텍스트에 워터마크를 넣는 시스템과 워터마크를 감지하는 도구를 약 1년 전부터 준비해 왔습니다.

함께 플레이 공간, 공간 이름 Play Together

함께 플레이 공간, 공간 이름 Play Together

많은 사람들이 Play Together 이름에 공백을 사용하거나 작은 밑줄을 사용하여 이름에 쓰는 글자 사이에 공백을 만듭니다.

Black Beacon PC 다운로드 방법

Black Beacon PC 다운로드 방법

PC에서 Black Beacon을 플레이하는 것은 가능하지만, 이 게임은 현재 공식적으로 이 플랫폼에 최적화되어 있지 않습니다.

구의 표면적과 부피를 계산하는 공식

구의 표면적과 부피를 계산하는 공식

구의 표면적은 큰 원의 면적의 4배이고, 이는 상수 파이에 구의 반지름 제곱을 곱한 값의 4배입니다.

중국이 최초로 달에 유인 착륙할 때 선택한 우주복의 특별한 점은 무엇일까?

중국이 최초로 달에 유인 착륙할 때 선택한 우주복의 특별한 점은 무엇일까?

중국은 2030년까지 최초로 국민을 달에 보내는 것을 목표로 하고 있으며, 이 나라는 다가올 역사적 임무에 사용될 새롭게 디자인된 우주복을 공개했습니다.

신체에 염증을 쉽게 일으키는 음식

신체에 염증을 쉽게 일으키는 음식

많은 음식이 염증과 만성 질환을 유발할 수 있습니다. 신체에 질병을 가져오고 싶지 않다면 너무 많이 섭취하지 말아야 할 음식은 다음과 같습니다.

Zuka Lien Quan 모바일 시즌 S1 2023 플레이 방법 안내

Zuka Lien Quan 모바일 시즌 S1 2023 플레이 방법 안내

주카는 체력이 낮은 챔피언에게 공포의 대상인 암살자로 알려져 있습니다. 시즌 23에서 주카를 효과적으로 사용하는 방법을 알아보세요.

최신 영웅 시대 코드 및 코드 사용 방법

최신 영웅 시대 코드 및 코드 사용 방법

영웅시대 기프트 코드를 통해 선물을 받는 것은 거의 모든 신규 플레이어가 게임에 참여할 때 하는 일입니다.

가장 저렴한 클라우드 스토리지 제공업체 8곳

가장 저렴한 클라우드 스토리지 제공업체 8곳

가장 저렴한 온라인 클라우드 스토리지 옵션을 살펴보겠습니다. 이 글에서는 절대 가격과 기가바이트당(월) 가격을 모두 살펴보겠습니다. 이를 통해 귀하에게 가장 적합한 가격을 선택할 수 있습니다.

Excel에서 파운드 기호 오류(####)는 무엇인가요?

Excel에서 파운드 기호 오류(####)는 무엇인가요?

Excel의 ####는 일반적인 Excel 오류이며 Excel에 데이터를 입력하거나, Excel 함수를 사용하거나, Excel에 수식을 입력할 때 다양한 경우에 나타납니다.

삼성 갤럭시 폰에서 변경해야 할 12가지 설정

삼성 갤럭시 폰에서 변경해야 할 12가지 설정

삼성 갤럭시 폰을 새로 구매했는데 설정이 필요하신가요? 삼성 휴대폰을 더 잘 작동시키기 위해 변경해야 할 10가지 설정은 다음과 같습니다.

최신 Murder Mystery 2 코드 및 참여 방법

최신 Murder Mystery 2 코드 및 참여 방법

코드 머더 미스터리 2는 플레이어가 캐릭터에 맞는 더 많은 칼 스킨을 선택하거나, 게임 내 서비스에 사용하거나 다른 물건을 구매할 수 있는 더 많은 돈을 얻는 데 도움이 됩니다.

부모님, 배우자, 연인, 친구에게 전하는 따뜻한 축하 인사가 담긴 아름다운 생일 카드 디자인 28개

부모님, 배우자, 연인, 친구에게 전하는 따뜻한 축하 인사가 담긴 아름다운 생일 카드 디자인 28개

연인, 부모님, 친구, 형제자매, 동료의 생일에는 선물 외에도 축하말을 담은 생일카드를 보내는 것을 잊지 마세요.

짝사랑하는 사람의 마음을 사로잡을 재밌지만 달콤한 유혹 수수께끼

짝사랑하는 사람의 마음을 사로잡을 재밌지만 달콤한 유혹 수수께끼

이 재미있는 퀴즈는 당신이 강한 인상을 남기고 좋아하는 사람의 마음을 빠르고 행복하게 사로잡는 데 도움이 될 것입니다.

코르키 DTCL 시즌 7: 아이템 제작, 표준 코르키 거너 분대

코르키 DTCL 시즌 7: 아이템 제작, 표준 코르키 거너 분대

코르키 DTCL 시즌 7은 적 팀을 파괴할 수 있는 자유를 얻고 싶다면 통제력을 발휘할 수 있는 보호나 지원이 필요합니다. 동시에, 코르키의 장비도 더 효과적인 피해를 입히기 위해서는 표준이어야 합니다.

Mini World Royale 다운로드 방법 및 플레이 방법 안내

Mini World Royale 다운로드 방법 및 플레이 방법 안내

미니 월드 로얄의 다운로드 링크와 플레이 방법은 다음과 같습니다. 미니 월드 로얄 APK와 미니 월드 로얄 iOS, 두 가지 버전이 있습니다.