일반 TV와 스마트 TV의 차이점
스마트 TV는 정말로 세상을 휩쓸었습니다. 이렇게 많은 뛰어난 기능과 인터넷 연결 덕분에 기술은 우리가 TV를 시청하는 방식을 바꾸어 놓았습니다.
Google은 I/O 2024에서 Gemma 2 모델의 차기 라인을 발표했으며, 이제 회사는 마침내 오픈 소스 라이선스에 따라 경량 모델을 출시하고 있습니다. 새로운 Gemma 2 27B 모델은 Llama 3 70B 및 Qwen 1.5 32B와 같은 일부 대형 모델보다 성능이 뛰어나 매우 유망한 것으로 알려져 있습니다. 이 주장을 검증하기 위해 현재 가장 인기 있는 오픈소스 모델인 Gemma 2와 Llama 3를 비교해 보겠습니다.
창작 글쓰기
먼저, Gemma 2와 Llama 3가 창작 글쓰기에 얼마나 능숙한지 살펴보겠습니다. 이 기사의 저자는 두 모델에게 달과 태양의 관계에 대한 짧은 이야기를 쓰라고 요청했습니다. 두 모델 모두 훌륭한 성과를 거두었지만, Google의 Gemma 2 모델이 매력적인 산문과 훌륭한 스토리로 돋보입니다.
반면에 라마 3은 조금 지루하고 로봇처럼 보입니다. Google은 Gemini 모델을 사용하여 텍스트 생성에 항상 능숙했으며 더 작은 Gemma 2 27B도 예외는 아닙니다.
당첨 옵션: Gemma 2
다국어 테스트
다음 라운드에서는 두 모델 모두 영어가 아닌 언어를 얼마나 잘 처리하는지 살펴보겠습니다. Google은 Gemma 2가 여러 언어를 이해하는 데 능숙하다고 광고하므로 저자는 이를 Meta의 Llama 3 모델과 비교했습니다. 저자는 두 모델에게 힌디어 구절을 번역해 달라고 요청했습니다. Gemma 2와 Llama 3 모두 매우 좋은 성과를 보였습니다.
저자는 또한 벵골어라는 또 다른 언어를 시도했고, 그 모델은 비슷하게 좋은 결과를 보여주었습니다. 최소한 인도어의 경우 Gemma 2와 Llama 3은 대규모 코퍼스에서 잘 훈련되었다고 할 수 있습니다. 하지만 Gemma 2 27B는 Llama 3 70B보다 약 2.5배 작아서 더욱 인상적입니다.
우승 옵션: Gemma 2 및 Llama 3
논리를 확인하세요
Gemma 2와 Llama 3는 가장 똑똑한 모델은 아니지만 훨씬 더 큰 모델과 마찬가지로 몇 가지 일반적인 추론 테스트를 수행할 수 있습니다. 이전에 Llama 3와 GPT-4를 비교했을 때 , Meta의 70B 모델은 더 작은 크기에도 불구하고 매우 뛰어난 지능을 보여주어 인상적이었습니다.
이 라운드에서는 라마 3가 제마 2를 큰 점수 차이로 이겼습니다. 라마 3은 3개 질문 중 2개에 정답을 맞혔지만, 젬마 2는 단 하나에도 정답을 맞추지 못했습니다. Gemma 2는 복잡한 추론 문제를 풀도록 훈련되지 않았습니다.
반면, Llama 3는 견고한 추론 기반을 갖추고 있는데, 이는 암호화된 데이터 세트에서 추론할 수 있을 가능성이 높습니다. GPT-4와 같은 수조 개의 매개변수를 가진 모델과 비교했을 때 크기는 작지만, 상당한 수준의 지능을 보여줍니다. 궁극적으로, 모델을 훈련하는 데 더 많은 토큰을 사용하면 실제로 더 강력한 모델이 만들어집니다.
당첨 옵션: 라마 3
지시사항을 따르세요
다음 라운드에서 저자는 Gemma 2와 Llama 3에게 "NPU"로 끝나는 단어 10개를 만들어 보라고 했습니다. 그리고 라마 3은 10/10의 정답을 맞혔습니다. 반면 Gemma 2는 10개의 문장 중 7개만 올바른 문장을 생성했습니다. 이전 릴리스에서 Gemini를 포함한 Google 모델은 사용자 지침을 잘 따르지 못했습니다. Gemma 2에서도 같은 추세가 계속됩니다.
AI 모델에 있어서 사용자 지침을 따르는 것은 매우 중요합니다. 이는 신뢰성을 보장하고 귀하가 지시한 내용에 대한 정확한 피드백을 생성합니다. 안전 측면에서도 안전 프로토콜을 더 잘 준수하여 모델을 접지 상태로 유지하는 데 도움이 됩니다.
당첨 옵션: 라마 3
정보 찾기
Gemma 2와 Llama 3 모두 8K 토큰의 컨텍스트 길이를 갖습니다. 저자는 오만과 편견이라는 책에서 직접 발췌한 17,000개가 넘는 문자와 3,800개의 토큰이 포함된 방대한 텍스트 블록을 추가했습니다. 언제나 그렇듯이 저자는 텍스트 어딘가에 무작위로 인용문을 삽입하고 두 모델에게 그것을 찾으라고 했습니다.
제마 2는 재빨리 정보를 파악하고 그 인용문이 무작위로 삽입된 것이라고 지적했습니다. 라마 3도 이 주장이 어울리지 않는다고 생각하고 이를 지적했습니다. 장기 컨텍스트 메모리 측면에서는 8K 토큰으로 제한되기는 하지만 두 모델 모두 이 측면에서 매우 강력합니다.
저자가 HuggingChat(웹)에서 이 테스트를 실행한 이유는 meta.ai가 저작권 내용 때문에 이 프롬프트를 실행하지 않았기 때문일 가능성이 큽니다.
우승 옵션: Gemma 2 및 Llama 3
환각을 확인하세요
작은 모델의 경우 제한된 학습 데이터로 인해 AI 환각 현상이 나타나기 쉽고, 모델이 익숙하지 않은 주제에 직면하면 정보를 조작하는 경우가 많습니다. 그래서 작가는 Gemma 2와 Llama 3가 환각을 보고 있는지 시험하기 위해 자신이 만들어낸 국가 이름을 넣었습니다. 놀랍게도 그렇지 않았습니다. 즉, Google과 Meta는 모두 각자의 모델에 대한 꽤 좋은 기반을 갖추고 있다는 뜻입니다.
저자는 또한 모델의 타당성을 시험하기 위해 또 다른 (잘못된) 질문을 제기했지만, 역시 환각성은 없었습니다. 그런데 저자는 meta.ai가 관련 주제에 대한 최신 정보를 인터넷에서 검색하는 동안 HuggingChat에서 Llama 3를 테스트했습니다.
우승 옵션: Gemma 2 및 Llama 3
끝내다
Google의 Gemma 2 27B 모델은 추론 테스트에서는 좋은 성적을 거두지 못했지만, 다른 여러 가지 작업에서는 성능이 뛰어납니다. 창의적인 글쓰기에 매우 좋고, 여러 언어를 지원하며, 기억력이 좋고, 무엇보다도 이전 모델에 비해 환각성이 낮습니다.
물론 라마 3가 더 뛰어나지만, 700억 개의 매개변수로 학습된 모델이라 훨씬 더 큽니다. 개발자는 Gemma 2 27B 모델이 다양한 사용 사례에 유용하다는 것을 알게 될 것입니다. 그리고 좋은 대비책으로 Gemma 2 9B도 구매 가능합니다.
또한, 사용자는 훨씬 작은 모델이며 다중 모드 입력을 지원하는 Gemini 1.5 Flash도 확인해보시기 바랍니다. 말할 것도 없이, 정말 빠르고 효율적입니다.
스마트 TV는 정말로 세상을 휩쓸었습니다. 이렇게 많은 뛰어난 기능과 인터넷 연결 덕분에 기술은 우리가 TV를 시청하는 방식을 바꾸어 놓았습니다.
냉장고는 가정에서 흔히 볼 수 있는 가전제품이다. 냉장고는 보통 2개의 칸으로 구성되어 있는데, 냉장실은 넓고 사용자가 열 때마다 자동으로 켜지는 조명이 있는 반면, 냉동실은 좁고 조명이 없습니다.
Wi-Fi 네트워크는 라우터, 대역폭, 간섭 외에도 여러 요인의 영향을 받지만 네트워크를 강화하는 몇 가지 스마트한 방법이 있습니다.
휴대폰에서 안정적인 iOS 16으로 돌아가려면 iOS 17을 제거하고 iOS 17에서 16으로 다운그레이드하는 기본 가이드는 다음과 같습니다.
요거트는 정말 좋은 음식이에요. 매일 요구르트를 먹는 것이 좋은가요? 매일 요구르트를 먹으면, 몸에 어떤 변화가 있을까요? 함께 알아보죠!
이 기사에서는 가장 영양가 있는 쌀 종류와 어떤 쌀을 선택하든 건강상의 이점을 극대화하는 방법에 대해 설명합니다.
수면 일정과 취침 루틴을 정하고, 알람 시계를 바꾸고, 식단을 조절하는 것은 더 나은 수면을 취하고 아침에 제때 일어나는 데 도움이 되는 몇 가지 방법입니다.
임대해 주세요! Landlord Sim은 iOS와 Android에서 플레이할 수 있는 모바일 시뮬레이션 게임입니다. 여러분은 아파트 단지의 집주인 역할을 하며 아파트 내부를 업그레이드하고 세입자가 입주할 수 있도록 준비하여 임대를 시작하게 됩니다.
욕실 타워 디펜스 Roblox 게임 코드를 받고 신나는 보상을 받으세요. 이들은 더 높은 데미지를 지닌 타워를 업그레이드하거나 잠금 해제하는 데 도움이 됩니다.
변압기의 구조, 기호, 동작 원리에 대해 가장 정확한 방법으로 알아보겠습니다.
더 나은 화질과 음질, 음성 제어 등 AI 기반 기능 덕분에 스마트 TV가 훨씬 더 좋아지고 있습니다!
처음에 사람들은 DeepSeek에 큰 기대를 걸었습니다. ChatGPT의 강력한 경쟁자로 마케팅되는 AI 챗봇으로서, 지능적인 채팅 기능과 경험을 약속합니다.
다른 필수 사항을 적다 보면 중요한 세부 사항을 놓치기 쉽고, 채팅하면서 메모를 하려고 하면 주의가 산만해질 수 있습니다. Fireflies.ai가 해결책입니다.
Axolot Minecraft는 플레이어가 사용법을 안다면 수중에서 작업할 때 큰 도움이 될 것입니다.
'콰이어트 플레이스: 더 로드 어헤드'의 구성은 상당히 높은 평가를 받고 있으므로, 다운로드하기로 결정하기 전에 구성을 고려해야 합니다.