OpenAI, 복잡한 작업을 위한 가장 스마트한 모델 GPT-4.1 발표

OpenAI는 공식적으로 GPT-4.1, GPT-4.1 mini, GPT-4.1 nano라는 세 가지 새로운 모델을 출시했습니다. 이러한 모델은 최대 100만 개의 토큰에 달하는 대규모 컨텍스트 처리 기능과 2024년 6월까지 업데이트된 지식 한도를 갖추고 있습니다.

이 회사는 이 모델이 지난 7월에 출시되어 최근 업데이트된 GPT-4o와 GPT-4o 미니보다 성능이 뛰어나다고 밝혔습니다. 현재 GPT-4.1은 API를 통해서만 제공되므로 아직은 ChatGPT에서 직접 사용할 수 없습니다.

OpenAI는 GPT-4.1은 API를 통해서만 사용할 수 있다고 밝혔습니다. ChatGPT에서는 명령어 준수, 프로그래밍, 인텔리전스 측면에서 많은 개선 사항이 최신 버전의 GPT-4o에 점진적으로 통합되었으며, 회사는 향후 릴리스에서 더 많은 기능을 추가할 예정입니다.

OpenAI, 복잡한 작업을 위한 가장 스마트한 모델 GPT-4.1 발표

벤치마크 결과는 GPT-4.1이 놀라운 개선을 가져왔음을 보여줍니다. 이 모델은 SWE-bench Verified에서 54.6%의 점수를 받았으며, 이는 GPT-4o보다 21.4포인트 증가한 수치입니다. 이 모델은 가이드라인 준수를 측정하는 벤치마크인 MultiChallenge에서 38.3%의 점수를 받았고, 모델이 자막 없이 최대 1시간 길이의 비디오를 분석하는 Video-MME 벤치마크에서 72.0%의 점수를 받아 장편 비디오 이해도에서 새로운 기록을 세웠습니다.

OpenAI는 또한 알파 파트너와 협력하여 실제 사용 사례에서 GPT-4.1의 성능을 테스트했습니다.

  • Thomson Reuters는 자사의 법률 AI 지원 서비스인 CoCounsel을 통해 GPT-4.1을 테스트했습니다. GPT-4o와 비교했을 때 GPT-4.1은 다중 문서 평가에서 정확도가 17% 향상되었습니다. 이러한 유형의 작업은 여러 소스에서 맥락을 추적하고 상충되는 용어나 숨겨진 종속성과 같은 복잡한 관계를 식별하는 능력에 크게 의존하며, GPT-4.1은 지속적으로 강력한 성능을 입증했습니다.
  • Carlyle은 GPT-4.1을 사용하여 Excel 및 PDF 파일을 포함한 길고 복잡한 문서에서 재무 데이터를 추출했습니다. 회사 내부 벤치마크에 따르면, 이 모델은 문서 검색 측면에서 이전 모델보다 50% 더 나은 성능을 보였습니다. 이 모델은 "건초더미에서 바늘 찾기", 문서 중간에서 정보 손실, 여러 파일에 걸쳐 정보를 연결해야 하는 인수 등의 문제를 안정적으로 처리하는 최초의 모델입니다.

성능도 중요하지만, 속도도 마찬가지로 중요합니다. OpenAI에 따르면 GPT-4.1은 128,000개의 토큰을 처리할 때 약 15초 만에 첫 번째 토큰을 반환하고, 100만 개의 토큰을 처리할 때는 최대 30초가 걸린다고 합니다. GPT-4.1 미니와 나노는 더 빠릅니다.

GPT-4.1 nano는 일반적으로 128,000개의 입력 토큰이 있는 프롬프트에 5초 이내에 응답합니다. 즉각적인 캐싱을 통해 비용을 절감하는 동시에 지연 시간을 더욱 줄일 수 있습니다.

이미지 이해도 상당한 진전을 이루었습니다. 특히, GPT-4.1 mini는 다양한 시각적 벤치마크에서 GPT-4o보다 우수한 성능을 보입니다.

  • MMMU (그래프, 다이어그램, 지도 포함) 에서 GPT-4.1 mini는 73%를 기록했습니다. 이는 GPT-4.5보다 높고 GPT-4o mini의 56%를 훨씬 넘어섭니다.
  • MathVista (이미지 문제 해결 능력을 테스트하는 기관) 에서는 GPT-4.1과 GPT-4.1 mini 모두 57%의 성적을 기록했는데, 이는 GPT-4o mini의 37%를 훨씬 뛰어넘는 수치입니다.
  • 과학적 그래프를 기반으로 모델이 질문에 답하는 CharXiv-Reasoning 에서는 GPT-4.1이 계속해서 선두를 달리고 있습니다.
  • Video-MME (자막 없는 긴 영상) 에서 GPT-4.1은 72%를 달성했는데, 이는 GPT-4o의 65%에 비해 상당히 개선된 수치입니다.

가격에 관하여:

  • GPT-4.1의 비용은 100만 개의 토큰 입력당 2달러, 출력당 8달러입니다.
  • GPT-4.1 mini의 입력 가격은 0.40달러, 출력 가격은 1.60달러입니다.
  • GPT-4.1 nano의 입력 비용은 $0.10, 출력 비용은 $0.40입니다.

프롬프트 캐싱이나 배치 API를 사용하면 이러한 비용을 더욱 줄일 수 있으며, 이는 대규모 애플리케이션에 매우 유용합니다. OpenAI는 또한 GPT-4.1의 더 나은 성능, 낮은 지연 시간, 낮은 비용을 이유로 2025년 7월 14일에 GPT-4.5 Preview에 대한 지원을 중단할 준비를 하고 있습니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAI, 사용자를 대신해 자동으로 작업을 수행하는 AI 에이전트 Operator 발표

OpenAI, 사용자를 대신해 자동으로 작업을 수행하는 AI 에이전트 Operator 발표

ChatGPT를 만든 회사가 AI를 활용하는 새로운 방법을 공개하고 있습니다. OpenAI는 방금 사용자를 대신해 자동으로 작업을 수행할 수 있는 AI 에이전트인 Operator를 발표했습니다.

OpenAI, 새로운 브라우저로 구글 크롬에 도전

OpenAI, 새로운 브라우저로 구글 크롬에 도전

OpenAI는 Google Chrome과 직접 경쟁할 수 있는 웹 브라우저 프로젝트를 진행 중이라고 합니다.

삼성, OpenAI와 손잡고 AI TV 개발…다양한 흥미로운 기능 약속

삼성, OpenAI와 손잡고 AI TV 개발…다양한 흥미로운 기능 약속

삼성전자가 OpenAI와 함께 업계 최고의 인공지능 기술을 통합한 AI TV를 개발하는 야심찬 공동 프로젝트를 진행 중인 것으로 알려졌습니다.

Microsoft는 1,000억 달러 이상의 가치로 OpenAI에 계속해서 많은 투자를 할 예정입니다.

Microsoft는 1,000억 달러 이상의 가치로 OpenAI에 계속해서 많은 투자를 할 예정입니다.

마이크로소프트는 2019년부터 OpenAI에 수십억 달러를 투자했지만, 레드먼드에 본사를 둔 이 소프트웨어 대기업이 혁신적인 AI 스타트업에 대한 주요 투자자는 결코 아닙니다.

OpenAI가 세계에서 가장 강력한 AI 코드 편집기 중 하나인 Windsurf를 인수할 예정입니다.

OpenAI가 세계에서 가장 강력한 AI 코드 편집기 중 하나인 Windsurf를 인수할 예정입니다.

OpenAI는 업계를 선도하는 AI 기반 코드 편집기인 Windsurf를 인수하기 위한 협상 중입니다.

O1-pro는 현재까지 OpenAI에서 가장 비싼 AI 모델입니다.

O1-pro는 현재까지 OpenAI에서 가장 비싼 AI 모델입니다.

OpenAI는 개발자 API에서 o1 추론 AI 모델인 o1-pro의 더욱 강력한 버전을 출시했습니다.

OpenAI, ChatGPT 프로젝트 소개: 더욱 스마트한 대화를 위한 새로운 기능

OpenAI, ChatGPT 프로젝트 소개: 더욱 스마트한 대화를 위한 새로운 기능

프로젝트를 만들면 사용자는 대화, 파일, 사용자 정의 지침을 모두 한곳에 보관할 수 있습니다. 이를 통해 사용자는 쉽게 이전에 하던 작업으로 돌아갈 수 있습니다.

OpenAI, 12월 차세대 AI 모델 오리온 출시

OpenAI, 12월 차세대 AI 모델 오리온 출시

The Verge에 따르면 OpenAI는 12월에 다음 주요 AI 모델인 Orion을 출시할 계획입니다.

알리바바, 인간의 감정을 읽는 AI 모델 출시

알리바바, 인간의 감정을 읽는 AI 모델 출시

중국 전자상거래 거대 기업 알리바바는 인간의 감정을 읽을 수 있다고 주장하는 새로운 AI 모델을 출시하며 계속해서 화제를 모으고 있습니다.

OpenAI, GPT Store 및 ChatGPT 팀 출시로 ChatGPT 생태계를 한 단계 더 발전

OpenAI, GPT Store 및 ChatGPT 팀 출시로 ChatGPT 생태계를 한 단계 더 발전

오랜 기다림과 수많은 소문 끝에 OpenAI가 마침내 오랫동안 기다려온 GPT Store와 ChatGPT 팀의 출시를 발표했습니다.

Copilot은 GPT-4 Turbo를 무료로 사용할 수 있는 가장 좋은 방법입니다.

Copilot은 GPT-4 Turbo를 무료로 사용할 수 있는 가장 좋은 방법입니다.

GPT-4 Turbo를 사용해보고 싶다면 Microsoft의 Copilot 도구를 사용하는 것이 가장 좋은 방법입니다.

OpenAI, 단 15초 녹음으로 음성 재구성 기술 개발

OpenAI, 단 15초 녹음으로 음성 재구성 기술 개발

OpenAI가 단 15초 녹음으로 누구의 목소리든 재현할 수 있는 기술을 출시했습니다.

OpenAI, 모든 사용자를 위한 ChatGPT 검색 분리, 계정 필요 없음

OpenAI, 모든 사용자를 위한 ChatGPT 검색 분리, 계정 필요 없음

OpenAI는 ChatGPT 사용자가 더 이상 로그인하지 않고도 AI 모델의 검색 엔진 기능을 사용할 수 있다고 발표했습니다.

Microsoft는 사용자가 GPT와 유사하게 Copilot 챗봇의 자체 버전을 만들 수 있도록 허용할 예정입니다.

Microsoft는 사용자가 GPT와 유사하게 Copilot 챗봇의 자체 버전을 만들 수 있도록 허용할 예정입니다.

Copilot GPT라고 불리는 이 기능을 사용하면 사용자는 "자신이 특히 관심 있는 주제에 대한 Copilot의 동작을 사용자 지정"할 수 있습니다.

일반 TV와 스마트 TV의 차이점

일반 TV와 스마트 TV의 차이점

스마트 TV는 정말로 세상을 휩쓸었습니다. 이렇게 많은 뛰어난 기능과 ​​인터넷 연결 덕분에 기술은 우리가 TV를 시청하는 방식을 바꾸어 놓았습니다.

왜 냉동고에는 조명이 없는데 냉장고에는 조명이 있나요?

왜 냉동고에는 조명이 없는데 냉장고에는 조명이 있나요?

냉장고는 가정에서 흔히 볼 수 있는 가전제품이다. 냉장고는 보통 2개의 칸으로 구성되어 있는데, 냉장실은 넓고 사용자가 열 때마다 자동으로 켜지는 조명이 있는 반면, 냉동실은 좁고 조명이 없습니다.

Wi-Fi 속도를 저하시키는 네트워크 혼잡을 해결하는 2가지 방법

Wi-Fi 속도를 저하시키는 네트워크 혼잡을 해결하는 2가지 방법

Wi-Fi 네트워크는 라우터, 대역폭, 간섭 외에도 여러 요인의 영향을 받지만 네트워크를 강화하는 몇 가지 스마트한 방법이 있습니다.

Tenorshare Reiboot를 사용하여 데이터 손실 없이 iOS 17에서 iOS 16으로 다운그레이드하는 방법

Tenorshare Reiboot를 사용하여 데이터 손실 없이 iOS 17에서 iOS 16으로 다운그레이드하는 방법

휴대폰에서 안정적인 iOS 16으로 돌아가려면 iOS 17을 제거하고 iOS 17에서 16으로 다운그레이드하는 기본 가이드는 다음과 같습니다.

매일 요구르트를 먹으면 몸에 어떤 일이 일어날까요?

매일 요구르트를 먹으면 몸에 어떤 일이 일어날까요?

요거트는 정말 좋은 음식이에요. 매일 요구르트를 먹는 것이 좋은가요? 매일 요구르트를 먹으면, 몸에 어떤 변화가 있을까요? 함께 알아보죠!

어떤 종류의 쌀이 건강에 가장 좋은가요?

어떤 종류의 쌀이 건강에 가장 좋은가요?

이 기사에서는 가장 영양가 있는 쌀 종류와 어떤 쌀을 선택하든 건강상의 이점을 극대화하는 방법에 대해 설명합니다.

아침에 제 시간에 일어나는 방법

아침에 제 시간에 일어나는 방법

수면 일정과 취침 루틴을 정하고, 알람 시계를 바꾸고, 식단을 조절하는 것은 더 나은 수면을 취하고 아침에 제때 일어나는 데 도움이 되는 몇 가지 방법입니다.

Rent Please!를 플레이하기 위한 팁 초보자를 위한 집주인 시뮬레이션

Rent Please!를 플레이하기 위한 팁 초보자를 위한 집주인 시뮬레이션

임대해 주세요! Landlord Sim은 iOS와 Android에서 플레이할 수 있는 모바일 시뮬레이션 게임입니다. 여러분은 아파트 단지의 집주인 역할을 하며 아파트 내부를 업그레이드하고 세입자가 입주할 수 있도록 준비하여 임대를 시작하게 됩니다.

최신 욕실 타워 디펜스 코드 및 코드 입력 방법

최신 욕실 타워 디펜스 코드 및 코드 입력 방법

욕실 타워 디펜스 Roblox 게임 코드를 받고 신나는 보상을 받으세요. 이들은 더 높은 데미지를 지닌 타워를 업그레이드하거나 잠금 해제하는 데 도움이 됩니다.

변압기의 구조, 기호 및 동작 원리

변압기의 구조, 기호 및 동작 원리

변압기의 구조, 기호, 동작 원리에 대해 가장 정확한 방법으로 알아보겠습니다.

AI가 스마트 TV를 더욱 개선하는 4가지 방법

AI가 스마트 TV를 더욱 개선하는 4가지 방법

더 나은 화질과 음질, 음성 제어 등 AI 기반 기능 덕분에 스마트 TV가 훨씬 더 좋아지고 있습니다!

ChatGPT가 DeepSeek보다 나은 이유

ChatGPT가 DeepSeek보다 나은 이유

처음에 사람들은 DeepSeek에 큰 기대를 걸었습니다. ChatGPT의 강력한 경쟁자로 마케팅되는 AI 챗봇으로서, 지능적인 채팅 기능과 경험을 약속합니다.

Fireflies.ai를 만나보세요: 여러분의 업무 시간을 절약해주는 무료 AI 비서

Fireflies.ai를 만나보세요: 여러분의 업무 시간을 절약해주는 무료 AI 비서

다른 필수 사항을 적다 보면 중요한 세부 사항을 놓치기 쉽고, 채팅하면서 메모를 하려고 하면 주의가 산만해질 수 있습니다. Fireflies.ai가 해결책입니다.

마인크래프트에서 악솔로틀 키우는 법, 마인크래프트 도롱뇽 길들이는 법

마인크래프트에서 악솔로틀 키우는 법, 마인크래프트 도롱뇽 길들이는 법

Axolot Minecraft는 플레이어가 사용법을 안다면 수중에서 작업할 때 큰 도움이 될 것입니다.

A Quiet Place: The Road Ahead PC 게임 구성

A Quiet Place: The Road Ahead PC 게임 구성

'콰이어트 플레이스: 더 로드 어헤드'의 구성은 상당히 높은 평가를 받고 있으므로, 다운로드하기로 결정하기 전에 구성을 고려해야 합니다.