Deepseek, 일반 하드웨어 구성에서 잘 실행되는 무료 언어 모델 v3 출시

중국 AI 스타트업 DeepSeek이 최신 대규모 언어 모델(LLM) DeepSeek-V3-0324를 공식 출시했습니다. 최대 641GB 용량을 갖춘 이 모델은 지금까지 회사가 신제품에 대해 비밀스럽게 적용해 온 스타일에 맞춰 많은 정보를 공개하지 않은 채 AI 허깅 페이스 플랫폼에서 발표되었습니다.

이 모델의 특별한 점은 상업적 목적으로 무료로 사용할 수 있는 MIT 라이센스입니다. 초기 벤치마크 결과에 따르면 DeepSeek-V3-0324는 M3 Ultra 칩이 탑재된 Apple의 Mac Studio와 같은 주류 하드웨어 구성에서 실행될 수 있는 것으로 나타났습니다. AI 과학자 아우니 하눈(Awni Hannun)은 이 구성을 사용하여 초당 20개 이상의 토큰 처리 속도를 달성할 수 있다고 보고했습니다. 상용 하드웨어에서 대규모 언어 모델을 온프레미스에서 실행할 수 있는 이러한 기능은 고급 AI 모델을 지원하기 위해 대규모 데이터 센터 인프라를 사용하는 기존 접근 방식과 극명한 대조를 이룹니다.

Deepseek, 일반 하드웨어 구성에서 잘 실행되는 무료 언어 모델 v3 출시

DeepSeek의 정보에 따르면, 초기 테스트 결과 이전 버전에 비해 상당한 개선이 이루어진 것으로 나타났습니다. 이 모델은 내부 이해 관계자에 의해 엄격하게 테스트되었으며, 뛰어난 성능을 입증했습니다. 심지어 다른 모든 경쟁 모델보다 우수한 성과를 보였으며, 심층적인 사고가 필요하지 않은 작업에서는 Anthropic의 Claude Sonnet 3.5보다 우수했습니다. 하지만 유료 구독이 필요한 Sonnet 스타일 모델과 달리 DeepSeek-V3-0324는 완전히 무료로 다운로드하여 사용할 수 있습니다.

기술적으로 DeepSeek-V3-0324는 전문가 혼합(MoE) 아키텍처를 사용합니다. 이 알고리즘은 작업당 6,850억 개의 매개변수 중 약 370억 개를 선택적으로 사용하여 성능을 유지하면서 계산 요구 사항을 줄여 효율성을 높이는 기능이 특징입니다. 이 모델은 또한 컨텍스트 메모리를 개선하고 출력 속도를 높이는 데 기여하는 Multi-Head Latent Attention(MLA) 및 Multi-Token Prediction(MTP) 기술을 적용합니다.

사용자는 Hugging Face, OpenRouter의 채팅 인터페이스 및 API를 통해 DeepSeek-V3-0324에 접속할 수 있으며, 원하는 경우 DeepSeek의 채팅 플랫폼을 이용할 수도 있습니다. 추론 서비스 제공업체인 Hyperbolic Labs도 이 모델에 대한 액세스를 제공합니다.

DeepSeek-V3-0324를 출시함으로써 회사는 대규모 언어 모델 개발 경쟁에서 자사의 입지를 더욱 공고히 하는 동시에 AI 연구 및 개발 커뮤니티에 강력하고 접근하기 쉬운 옵션을 제공합니다. 상용 하드웨어에서 실행할 수 있는 기능과 무료 라이선스 덕분에 가까운 미래에 이 모델에 대한 많은 실용적인 응용 가능성이 열릴 것입니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

예상치 못한 폴더블 스크린 폰의 8가지 주요 단점

예상치 못한 폴더블 스크린 폰의 8가지 주요 단점

폴더블 폰이 꽤 멋지다는 것은 부인할 수 없습니다. 하지만 얼마간 사용하다 보니 이 장치에는 꽤 많은 단점이 있다는 걸 알게 됐습니다. 예상치 못한 폴더블 스크린 휴대폰의 5가지 주요 단점을 소개합니다!

Adobe가 Premiere Pro에 AI 비디오 제작 기술을 도입합니다.

Adobe가 Premiere Pro에 AI 비디오 제작 기술을 도입합니다.

Adobe는 AI 영상 제작 기술을 새로운 방식으로 대중에게 선보였지만, 아직 이 기술을 사용하여 완성된 영화를 만든 적은 없습니다.

최신 Genshin Impact 코드 2025년 4월

최신 Genshin Impact 코드 2025년 4월

Genshin Impact 5.5 코드를 사용하면 원시석, 마법 광물, 경험치 및 기타 여러 보상을 교환할 수 있습니다.

IPad를 추가 Mac 디스플레이로 바꾸는 방법

IPad를 추가 Mac 디스플레이로 바꾸는 방법

macOS Catalina와 iPadOS에는 Sidecar라는 새로운 기능에 대한 지원이 포함되어 있습니다. 이 기능을 사용하면 iPad를 Mac의 보조 디스플레이로 사용할 수 있습니다.

배경화면 1280, 아름다운 노키아 1280 휴대폰 배경화면

배경화면 1280, 아름다운 노키아 1280 휴대폰 배경화면

이것은 Nokia 1280 배경화면 세트입니다. 1280 배경화면이나 벽돌색 휴대전화 배경화면을 요청해 본 적이 있다면 이 배경화면을 살펴보세요.

초음속 우주비행기, 시속 11,115km 달성

초음속 우주비행기, 시속 11,115km 달성

비너스 에어로스페이스는 스타게이저라는 새로운 초음속 항공기의 첫 번째 이미지를 공개했습니다. 이 항공기는 최고 속도 11,115km/h, 마하 9에 도달할 수 있습니다.

아침에 바나나를 먹으면 복부 팽창을 줄이는 데 도움이 됩니다.

아침에 바나나를 먹으면 복부 팽창을 줄이는 데 도움이 됩니다.

복부 팽창은 누구에게나 일어날 수 있습니다. 좋은 소식은 아침 식사가 복부 팽창을 줄이는 데 도움이 되는 재료를 식사에 추가할 수 있는 좋은 시간이라는 것입니다. 그 재료는 바나나예요.

OpenAI, ChatGPT에서 AI 이미지 생성에 대한 주요 업데이트 발표

OpenAI, ChatGPT에서 AI 이미지 생성에 대한 주요 업데이트 발표

OpenAI는 ChatGPT에서 AI 이미지 생성 기능에 대한 주목할 만한 업그레이드를 공식적으로 도입했습니다. 이는 이전 DALL-E와 같이 별도의 이미지 생성 모델을 사용하는 대신 중요한 진전입니다.

Deepseek, 일반 하드웨어 구성에서 잘 실행되는 무료 언어 모델 v3 출시

Deepseek, 일반 하드웨어 구성에서 잘 실행되는 무료 언어 모델 v3 출시

중국 AI 스타트업 DeepSeek이 최신 대규모 언어 모델(LLM) DeepSeek-V3-0324를 공식 출시했습니다.

Gboard를 버리고 Samsung Keyboard로 전환해야 하는 이유

Gboard를 버리고 Samsung Keyboard로 전환해야 하는 이유

Gboard는 오랫동안 Android 휴대폰에서 널리 쓰이는 키보드였습니다. 하지만 최근 많은 사람들이 삼성 키보드로 전환했고, 후회하지 않았습니다.

연인을 위한 달콤하고 로맨틱한 주말 인사

연인을 위한 달콤하고 로맨틱한 주말 인사

당신의 연인에게 달콤하고 낭만적인 주말 인사를 전해보세요. 그것들은 단지 말이나 메시지일지라도, 의미 있는 영적 선물이 되어 두 분의 관계를 강화하는 데 도움이 될 것입니다.

해리포터 TV 시리즈가 성공하려면 다음과 같은 요소가 필요합니다.

해리포터 TV 시리즈가 성공하려면 다음과 같은 요소가 필요합니다.

HBO의 해리포터 리메이크는 2026년에 초연될 예정입니다. TV판 해리포터가 성공한 이유는 다음과 같습니다.

전 세계에서 촬영한 슈퍼문의 놀라운 사진

전 세계에서 촬영한 슈퍼문의 놀라운 사진

아름다운 달 사진은 인터넷에서 흔히 볼 수 있다. 이 기사에서는 세계에서 가장 아름다운 달 사진을 요약해 드리겠습니다.

AMD Ryzen 사용자는 무료 성능 향상을 위해 이 BIOS 업데이트를 설치해야 합니다.

AMD Ryzen 사용자는 무료 성능 향상을 위해 이 BIOS 업데이트를 설치해야 합니다.

AMD는 이제 초당 프레임 수를 몇 개 더 늘릴 수 있는 새로운 업데이트를 통해 성능이 떨어지는 주력 CPU 제품군의 문제에 대응했습니다.

X의 가치는 440억 달러에서 100억 달러 미만으로 떨어집니다.

X의 가치는 440억 달러에서 100억 달러 미만으로 떨어집니다.

2022년 10월, 일론 머스크는 X를 인수하기 위해 440억 달러를 지출했지만, 현재까지 해당 플랫폼의 가치는 78.6% 하락하여 약 94억 달러가 되었습니다.