Deepseek, 일반 하드웨어 구성에서 잘 실행되는 무료 언어 모델 v3 출시

중국 AI 스타트업 DeepSeek이 최신 대규모 언어 모델(LLM) DeepSeek-V3-0324를 공식 출시했습니다. 최대 641GB 용량을 갖춘 이 모델은 지금까지 회사가 신제품에 대해 비밀스럽게 적용해 온 스타일에 맞춰 많은 정보를 공개하지 않은 채 AI 허깅 페이스 플랫폼에서 발표되었습니다.

이 모델의 특별한 점은 상업적 목적으로 무료로 사용할 수 있는 MIT 라이센스입니다. 초기 벤치마크 결과에 따르면 DeepSeek-V3-0324는 M3 Ultra 칩이 탑재된 Apple의 Mac Studio와 같은 주류 하드웨어 구성에서 실행될 수 있는 것으로 나타났습니다. AI 과학자 아우니 하눈(Awni Hannun)은 이 구성을 사용하여 초당 20개 이상의 토큰 처리 속도를 달성할 수 있다고 보고했습니다. 상용 하드웨어에서 대규모 언어 모델을 온프레미스에서 실행할 수 있는 이러한 기능은 고급 AI 모델을 지원하기 위해 대규모 데이터 센터 인프라를 사용하는 기존 접근 방식과 극명한 대조를 이룹니다.

Deepseek, 일반 하드웨어 구성에서 잘 실행되는 무료 언어 모델 v3 출시

DeepSeek의 정보에 따르면, 초기 테스트 결과 이전 버전에 비해 상당한 개선이 이루어진 것으로 나타났습니다. 이 모델은 내부 이해 관계자에 의해 엄격하게 테스트되었으며, 뛰어난 성능을 입증했습니다. 심지어 다른 모든 경쟁 모델보다 우수한 성과를 보였으며, 심층적인 사고가 필요하지 않은 작업에서는 Anthropic의 Claude Sonnet 3.5보다 우수했습니다. 하지만 유료 구독이 필요한 Sonnet 스타일 모델과 달리 DeepSeek-V3-0324는 완전히 무료로 다운로드하여 사용할 수 있습니다.

기술적으로 DeepSeek-V3-0324는 전문가 혼합(MoE) 아키텍처를 사용합니다. 이 알고리즘은 작업당 6,850억 개의 매개변수 중 약 370억 개를 선택적으로 사용하여 성능을 유지하면서 계산 요구 사항을 줄여 효율성을 높이는 기능이 특징입니다. 이 모델은 또한 컨텍스트 메모리를 개선하고 출력 속도를 높이는 데 기여하는 Multi-Head Latent Attention(MLA) 및 Multi-Token Prediction(MTP) 기술을 적용합니다.

사용자는 Hugging Face, OpenRouter의 채팅 인터페이스 및 API를 통해 DeepSeek-V3-0324에 접속할 수 있으며, 원하는 경우 DeepSeek의 채팅 플랫폼을 이용할 수도 있습니다. 추론 서비스 제공업체인 Hyperbolic Labs도 이 모델에 대한 액세스를 제공합니다.

DeepSeek-V3-0324를 출시함으로써 회사는 대규모 언어 모델 개발 경쟁에서 자사의 입지를 더욱 공고히 하는 동시에 AI 연구 및 개발 커뮤니티에 강력하고 접근하기 쉬운 옵션을 제공합니다. 상용 하드웨어에서 실행할 수 있는 기능과 무료 라이선스 덕분에 가까운 미래에 이 모델에 대한 많은 실용적인 응용 가능성이 열릴 것입니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

일반 TV와 스마트 TV의 차이점

일반 TV와 스마트 TV의 차이점

스마트 TV는 정말로 세상을 휩쓸었습니다. 이렇게 많은 뛰어난 기능과 ​​인터넷 연결 덕분에 기술은 우리가 TV를 시청하는 방식을 바꾸어 놓았습니다.

왜 냉동고에는 조명이 없는데 냉장고에는 조명이 있나요?

왜 냉동고에는 조명이 없는데 냉장고에는 조명이 있나요?

냉장고는 가정에서 흔히 볼 수 있는 가전제품이다. 냉장고는 보통 2개의 칸으로 구성되어 있는데, 냉장실은 넓고 사용자가 열 때마다 자동으로 켜지는 조명이 있는 반면, 냉동실은 좁고 조명이 없습니다.

Wi-Fi 속도를 저하시키는 네트워크 혼잡을 해결하는 2가지 방법

Wi-Fi 속도를 저하시키는 네트워크 혼잡을 해결하는 2가지 방법

Wi-Fi 네트워크는 라우터, 대역폭, 간섭 외에도 여러 요인의 영향을 받지만 네트워크를 강화하는 몇 가지 스마트한 방법이 있습니다.

Tenorshare Reiboot를 사용하여 데이터 손실 없이 iOS 17에서 iOS 16으로 다운그레이드하는 방법

Tenorshare Reiboot를 사용하여 데이터 손실 없이 iOS 17에서 iOS 16으로 다운그레이드하는 방법

휴대폰에서 안정적인 iOS 16으로 돌아가려면 iOS 17을 제거하고 iOS 17에서 16으로 다운그레이드하는 기본 가이드는 다음과 같습니다.

매일 요구르트를 먹으면 몸에 어떤 일이 일어날까요?

매일 요구르트를 먹으면 몸에 어떤 일이 일어날까요?

요거트는 정말 좋은 음식이에요. 매일 요구르트를 먹는 것이 좋은가요? 매일 요구르트를 먹으면, 몸에 어떤 변화가 있을까요? 함께 알아보죠!

어떤 종류의 쌀이 건강에 가장 좋은가요?

어떤 종류의 쌀이 건강에 가장 좋은가요?

이 기사에서는 가장 영양가 있는 쌀 종류와 어떤 쌀을 선택하든 건강상의 이점을 극대화하는 방법에 대해 설명합니다.

아침에 제 시간에 일어나는 방법

아침에 제 시간에 일어나는 방법

수면 일정과 취침 루틴을 정하고, 알람 시계를 바꾸고, 식단을 조절하는 것은 더 나은 수면을 취하고 아침에 제때 일어나는 데 도움이 되는 몇 가지 방법입니다.

Rent Please!를 플레이하기 위한 팁 초보자를 위한 집주인 시뮬레이션

Rent Please!를 플레이하기 위한 팁 초보자를 위한 집주인 시뮬레이션

임대해 주세요! Landlord Sim은 iOS와 Android에서 플레이할 수 있는 모바일 시뮬레이션 게임입니다. 여러분은 아파트 단지의 집주인 역할을 하며 아파트 내부를 업그레이드하고 세입자가 입주할 수 있도록 준비하여 임대를 시작하게 됩니다.

최신 욕실 타워 디펜스 코드 및 코드 입력 방법

최신 욕실 타워 디펜스 코드 및 코드 입력 방법

욕실 타워 디펜스 Roblox 게임 코드를 받고 신나는 보상을 받으세요. 이들은 더 높은 데미지를 지닌 타워를 업그레이드하거나 잠금 해제하는 데 도움이 됩니다.

변압기의 구조, 기호 및 동작 원리

변압기의 구조, 기호 및 동작 원리

변압기의 구조, 기호, 동작 원리에 대해 가장 정확한 방법으로 알아보겠습니다.

AI가 스마트 TV를 더욱 개선하는 4가지 방법

AI가 스마트 TV를 더욱 개선하는 4가지 방법

더 나은 화질과 음질, 음성 제어 등 AI 기반 기능 덕분에 스마트 TV가 훨씬 더 좋아지고 있습니다!

ChatGPT가 DeepSeek보다 나은 이유

ChatGPT가 DeepSeek보다 나은 이유

처음에 사람들은 DeepSeek에 큰 기대를 걸었습니다. ChatGPT의 강력한 경쟁자로 마케팅되는 AI 챗봇으로서, 지능적인 채팅 기능과 경험을 약속합니다.

Fireflies.ai를 만나보세요: 여러분의 업무 시간을 절약해주는 무료 AI 비서

Fireflies.ai를 만나보세요: 여러분의 업무 시간을 절약해주는 무료 AI 비서

다른 필수 사항을 적다 보면 중요한 세부 사항을 놓치기 쉽고, 채팅하면서 메모를 하려고 하면 주의가 산만해질 수 있습니다. Fireflies.ai가 해결책입니다.

마인크래프트에서 악솔로틀 키우는 법, 마인크래프트 도롱뇽 길들이는 법

마인크래프트에서 악솔로틀 키우는 법, 마인크래프트 도롱뇽 길들이는 법

Axolot Minecraft는 플레이어가 사용법을 안다면 수중에서 작업할 때 큰 도움이 될 것입니다.

A Quiet Place: The Road Ahead PC 게임 구성

A Quiet Place: The Road Ahead PC 게임 구성

'콰이어트 플레이스: 더 로드 어헤드'의 구성은 상당히 높은 평가를 받고 있으므로, 다운로드하기로 결정하기 전에 구성을 고려해야 합니다.