Foxconn, Meta의 Llama 3.1에서 개선된 대규모 언어 모델(LLM) 발표

iPhone과 기타 Apple 하드웨어 제품을 제조하는 것으로 유명한 회사인 Foxconn은 제조 및 공급망 관리를 개선하는 데 사용될 예정인 최초의 대규모 언어 모델(LLM)인 FoxBrain을 발표하여 모든 사람을 놀라게 했습니다.

대만 제조업체는 FoxBrain이 Nvidia의 H100 GPU 120개만으로 훈련되었다고 밝혔습니다. 이 LLM은 기본적으로 Meta의 Llama 3.1 아키텍처를 기반으로 개발되었으며, 증류를 통해 700억 개의 매개변수를 얻었습니다. LLM 개선이라는 개념에는 "부모" 모델을 사용하고 해당 모델의 응답을 기반으로 "자식" 모델을 훈련하는 것이 포함됩니다. 폭스콘 역시 자사의 LLM이 중국 딥시크의 정교한 모델만큼 좋지는 않지만, 전반적인 성과는 세계적 수준에 매우 가깝다고 인정했습니다.

이러한 성과에 대해 홍하이연구소(폭스콘) 인공지능 연구센터 소장인 리융후이 박사는 다음과 같이 말했습니다.

최근 몇 달 동안 추론 능력의 향상과 GPU의 효율적인 활용이 점차 AI 분야의 주요 트렌드가 되고 있습니다. FoxBrain 모델은 컴퓨팅 파워를 맹목적으로 축적하는 대신, 훈련 과정을 최적화하는 데 중점을 두어 매우 효율적인 훈련 전략을 채택했습니다.

신중하게 설계된 훈련 방법과 리소스 최적화를 통해 우리는 강력한 추론 기능을 갖춘 로컬 AI 모델을 구축하는 데 성공했습니다."

Foxconn, Meta의 Llama 3.1에서 개선된 대규모 언어 모델(LLM) 발표

폭스콘은 애플 제품을 조립할 뿐만 아니라, 엔비디아의 AI 서버도 제조합니다. FoxBrain은 120개의 H100 GPU와 함께 Nvidia의 Quantum-2 InfiniBand 네트워크를 사용하여 확장되었으며, 학습에는 약 4주가 소요됩니다(총 연산 비용은 2,688GPU 일입니다). Foxconn은 최대 128,000개 토큰의 컨텍스트 창 길이를 사용하여 중국어 번체로 980억 개의 고품질 사전 학습 데이터 토큰을 생성했습니다.

Foxconn과 Nvidia의 협력은 새로운 것이 아니며, 두 회사는 세계 최대 규모의 Blackwell GPU 제조 시설 건설을 포함한 다른 프로젝트도 진행하고 있습니다.

엔비디아는 또한 폭스콘에 타이베이-1 슈퍼컴퓨터를 제공하여 모델 사전 학습 과정을 완료했습니다. 폭스콘은 폭스브레인이 회사의 3대 주요 플랫폼인 스마트 제조, 스마트 전기 자동차, 스마트 시티를 업그레이드하는 "핵심 엔진"이 될 것이라고 밝혔습니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

악마의 열매가 이제 블록스 프루트에서 출시됩니다

악마의 열매가 이제 블록스 프루트에서 출시됩니다

몇 시간마다 플레이어는 무작위로 블록스 과일을 구매할 수 있으며, 이 경우 더 나은 과일을 얻을 가능성이 있습니다. 하지만 악마의 열매 변경 알림이 없다면 기회를 놓칠 수도 있습니다.

Dislyte 캐릭터 순위, Dislyte 티어 목록

Dislyte 캐릭터 순위, Dislyte 티어 목록

Dislyte 캐릭터 순위는 전투에 투입할 가치가 없는 캐릭터부터 팀의 최상위가 될 캐릭터까지 가장 강력한 캐릭터를 분류하는 데 도움이 됩니다.

최신 Phong Ma Dao Si 코드 및 코드 입력 방법

최신 Phong Ma Dao Si 코드 및 코드 입력 방법

또한, Phong Ma Dao Si 기프트 코드를 사용하여 귀중한 상품과 교환할 수도 있습니다.

Duo Mobile이란 무엇인가요? Duo Mobile을 사용하는 것이 안전한가요?

Duo Mobile이란 무엇인가요? Duo Mobile을 사용하는 것이 안전한가요?

인증 앱은 보안을 한 단계 더 강화하며, 개인의 신원을 확인하는 쉽고 편리한 방법입니다. Duo Mobile은 이런 종류의 앱 중 가장 인기 있는 앱 중 하나입니다.

좋은 아침 이미지, 아름다운 새 날 이미지

좋은 아침 이미지, 아름다운 새 날 이미지

좋은 아침 이미지, 긍정적인 메시지가 담긴 좋은 아침 이미지는 우리가 더 많은 에너지와 동기를 얻어 더욱 효과적인 근무일을 보내는 데 도움이 됩니다.

OPPO Reno 5 Pro 5G 리뷰: 다른 경쟁사 주의

OPPO Reno 5 Pro 5G 리뷰: 다른 경쟁사 주의

Reno 5 Pro 5G는 이전 모델과 크게 다르지 않으며, 여전히 6.5인치 AMOLED 곡면 화면을 유지하고 있습니다.

대수란 무엇인가?

대수란 무엇인가?

혼합수는 정수와 분수의 조합입니다. 혼합수의 분수 부분은 항상 1보다 작습니다.

부자처럼 여행하기 위한 팁

부자처럼 여행하기 위한 팁

여행 예산이 부족한가요? 걱정하지 마세요. 유명한 여행 전문가가 공유한 아래 팁을 활용하면 부자처럼 여행하는 데 도움이 될 것입니다.

모바일을 위한 최고의 Obsidian 플러그인 7가지

모바일을 위한 최고의 Obsidian 플러그인 7가지

인터페이스를 조정하고 Obsidian을 더 효율적으로 실행할 수 있도록 하는 것 외에도, 더 풍부한 노트 작성 도구 세트를 제공할 예정입니다.

흐릿한 외부 디스플레이를 수정하는 방법

흐릿한 외부 디스플레이를 수정하는 방법

어두운 외부 디스플레이는 생산성을 저해하고 눈의 피로를 유발할 수 있습니다. 다행히도 흐릿한 화면을 고치는 데 할 수 있는 몇 가지 방법이 있습니다!

남성과 여성의 상징은 어디에서 왔는가?

남성과 여성의 상징은 어디에서 왔는가?

오늘날 인기 있는 남성 및 여성 상징의 의미를 모든 사람이 알고 있는 것은 아닐 수도 있습니다. 남성과 여성의 상징에 대해 더 알아보세요!

과학자들은 블랙홀의 신비한 역사를 해독했습니다.

과학자들은 블랙홀의 신비한 역사를 해독했습니다.

블랙홀에 대한 흔한 오해 중 하나는 블랙홀이 물질을 삼킬 뿐만 아니라 그 물질의 역사까지 삼킨다는 것입니다. 블랙홀의 역사에 대한 진실이 마침내 밝혀졌습니다.

여러 개의 Adobe Mobile 앱이 필요 없습니다. Adobe Express만 있으면 됩니다!

여러 개의 Adobe Mobile 앱이 필요 없습니다. Adobe Express만 있으면 됩니다!

Adobe는 휴대폰에서 4개 이상의 특정 사진 편집 앱을 제공합니다. 모두 너무 유사해서 실제로 필요한 앱을 구분하기 어렵습니다.

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV도 몇 가지 가젯을 사용하면 새로운 기능을 익혀 단 몇 분 만에 값비싼 스마트 TV보다 더 나은 TV가 될 수 있습니다.

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨을 올바르게 사용하면 에어컨의 기능을 최대한 활용하는 데 도움이 됩니다.