알리바바, 인간의 감정을 읽는 AI 모델 출시

중국 전자상거래 거대 기업 알리바바는 인간의 감정을 읽을 수 있다고 주장하는 새로운 AI 모델을 출시하며 계속해서 화제를 모으고 있습니다. "R1-Omni"라는 이름의 이 모델은 알리바바의 통이 연구소 엔지니어 팀에 의해 개발되었습니다. 알리바바는 감정 판독을 사용자 상호작용의 핵심으로 삼아, R1-Omni가 실제 경험 측면에서 OpenAI의 ChatGPT 및 현재 시장에 출시된 다른 많은 LLM 모델과 같은 경쟁사를 완전히 능가할 수 있다고 자신 있게 주장합니다.

특히, R1-Omni는 오픈 소스로 제공됩니다. 데모에서 이 AI 모델은 비디오에서 사람의 감정을 이해하고, 옷차림과 주변 환경을 묘사할 수 있었습니다. 알리바바의 새로운 AI 모델은 컴퓨터 비전을 새로운 차원으로 끌어올렸으며, 연구원 자오 지아싱과 통이 연구소의 동료들이 개발한 HumanOmni라는 기존 모델을 기반으로 합니다.

기술적으로 R1-Omni는 검증 가능한 보상을 통한 강화 학습(RLVR)을 적용한 최초의 포괄적인 다중 모드 언어 모델로 간주될 수 있습니다. RLVR은 AI의 추론 및 감정 분석 능력을 향상시킬 것을 약속하는 기술입니다. 그 결과, R1-Omni는 시각적, 청각적 정보가 감정 인식을 어떻게 지원하는지 빠르게 분석하고 더욱 정확하게 이해할 수 있으며, 각 유형의 감정을 평가하는 데 어떤 요소가 더 중요한 역할을 하는지 명확하게 파악할 수 있습니다.

알리바바는 AI 도구와 애플리케이션에 많은 투자를 하고 있습니다. 중국 기술 대기업은 최근 Apple과 파트너십을 맺고 중국 내 iPhone에 AI 기능을 도입했으며, Hugging Face 플랫폼에서 R1-Omni를 무료로 제공하여 OpenAI에 도전했습니다.

알리바바가 달성하고자 하는 궁극적인 목표는 '인공 일반 지능'(AGI)입니다. 에디 우는 2월에 분석가들에게 AGI가 회사의 최우선 과제임을 분명히 밝혔습니다. 그리고 AI 분야의 최신 동향은 알리바바가 글로벌 AI 경쟁에서 주요 기업으로서의 입지를 다지기 위해 노력하고 있음을 보여줍니다.

반면, OpenAI는 경쟁 AI 플랫폼과의 경쟁이 심화되고 있다는 사실도 알고 있습니다. 이 회사는 올해 초에 사용자 메시지의 미묘한 뉘앙스를 감지할 수 있는 업데이트된 GPT-4.5 모델을 출시했습니다. 하지만 이 모델은 무료로 제공되지 않고, 월 200달러라는 높은 요금을 내고 프리미엄 구독자에게만 제공됩니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

대수란 무엇인가?

대수란 무엇인가?

혼합수는 정수와 분수의 조합입니다. 혼합수의 분수 부분은 항상 1보다 작습니다.

부자처럼 여행하기 위한 팁

부자처럼 여행하기 위한 팁

여행 예산이 부족한가요? 걱정하지 마세요. 유명한 여행 전문가가 공유한 아래 팁을 활용하면 부자처럼 여행하는 데 도움이 될 것입니다.

모바일을 위한 최고의 Obsidian 플러그인 7가지

모바일을 위한 최고의 Obsidian 플러그인 7가지

인터페이스를 조정하고 Obsidian을 더 효율적으로 실행할 수 있도록 하는 것 외에도, 더 풍부한 노트 작성 도구 세트를 제공할 예정입니다.

흐릿한 외부 디스플레이를 수정하는 방법

흐릿한 외부 디스플레이를 수정하는 방법

어두운 외부 디스플레이는 생산성을 저해하고 눈의 피로를 유발할 수 있습니다. 다행히도 흐릿한 화면을 고치는 데 할 수 있는 몇 가지 방법이 있습니다!

남성과 여성의 상징은 어디에서 왔는가?

남성과 여성의 상징은 어디에서 왔는가?

오늘날 인기 있는 남성 및 여성 상징의 의미를 모든 사람이 알고 있는 것은 아닐 수도 있습니다. 남성과 여성의 상징에 대해 더 알아보세요!

과학자들은 블랙홀의 신비한 역사를 해독했습니다.

과학자들은 블랙홀의 신비한 역사를 해독했습니다.

블랙홀에 대한 흔한 오해 중 하나는 블랙홀이 물질을 삼킬 뿐만 아니라 그 물질의 역사까지 삼킨다는 것입니다. 블랙홀의 역사에 대한 진실이 마침내 밝혀졌습니다.

여러 개의 Adobe Mobile 앱이 필요 없습니다. Adobe Express만 있으면 됩니다!

여러 개의 Adobe Mobile 앱이 필요 없습니다. Adobe Express만 있으면 됩니다!

Adobe는 휴대폰에서 4개 이상의 특정 사진 편집 앱을 제공합니다. 모두 너무 유사해서 실제로 필요한 앱을 구분하기 어렵습니다.

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV도 몇 가지 가젯을 사용하면 새로운 기능을 익혀 단 몇 분 만에 값비싼 스마트 TV보다 더 나은 TV가 될 수 있습니다.

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨을 올바르게 사용하면 에어컨의 기능을 최대한 활용하는 데 도움이 됩니다.

Gemini가 사진, 파일 및 YouTube에 대한 Talk Live를 출시합니다.

Gemini가 사진, 파일 및 YouTube에 대한 Talk Live를 출시합니다.

Gemini Live에 "Talk Live about" 기능이 추가되었으며, 이제 Android 기기에서 더 광범위하게 출시될 예정입니다. 기존 제미니 라이브는 음성 입력만 가능했지만, 'Talk Live about'을 통해 콘텐츠 업로드가 확대됐다.

심층 연구로 업그레이드된 Microsoft Copilot

심층 연구로 업그레이드된 Microsoft Copilot

Microsoft는 마침내 Copilot AI에 심층 연구 기능을 도입했습니다. 이를 통해 사용자는 어떤 주제에 대해서든 철저하고 여러 단계의 조사를 수행할 수 있습니다.

포토샵에서 사진을 연필 스케치로 바꾸는 방법

포토샵에서 사진을 연필 스케치로 바꾸는 방법

이 튜토리얼에서는 Adobe Photoshop을 사용하여 사진을 연필 스케치로 쉽게 바꾸는 방법을 보여줍니다.

Golang의 Volatile 함수

Golang의 Volatile 함수

Go의 가변 함수를 사용하면 함수에 가변 개수의 인수를 전달할 수 있습니다. Golang의 volatile 함수에 대해 알아야 할 모든 것을 소개합니다.

Lien Quan Mobile에서 컬러 글자를 쓰는 방법

Lien Quan Mobile에서 컬러 글자를 쓰는 방법

Lien Quan Mobile에서 컬러 텍스트를 작성하려면 이 문서의 지침을 따르세요. LQ 모바일 컬러 문자가 더욱 눈에 띄게 됩니다.

절대 끝나서는 안 될 7가지 작업 관리자 프로세스

절대 끝나서는 안 될 7가지 작업 관리자 프로세스

Windows 10 작업 관리자 목록 하단에 있는 Windows 시스템 프로세스 섹션에는 컴퓨터가 제대로 작동하는 데 필수적인 몇 가지 중요한 프로세스가 포함되어 있습니다.