알리바바, 시각 추론 모델 QVQ-Max 출시: 보고, 이해하고, 생각할 수 있다

중국 기술 그룹 알리바바가 멀티미디어 AI 분야에서 획기적인 발전을 이룬 Qwen 시리즈의 새로운 AI 모델인 QVQ-Max를 발표했습니다. 이 모델의 특징은 이미지/비디오 콘텐츠를 분석한 후, 얻은 정보를 바탕으로 주장과 해결책을 제시할 수 있다는 것입니다.

인상적인 능력

알리바바는 QVQ-Max를 순수한 텍스트 기반 AI 모델과 현실 세계를 연결하는 다리로 설명합니다. 시각적 추론 기능을 통해 시스템은 다음을 수행할 수 있습니다.

  • 이미지를 분석하고 핵심 요소를 식별합니다.
  • 일러스트레이션 디자인, 영상 대본 제작부터 캐릭터 롤플레잉까지 다양한 분야에 다양하게 활용 가능
  • 다이어그램을 사용하여 문제 해결(수학, 물리)
  • 레시피 사진을 기반으로 한 단계별 요리 지침

알리바바는 이 모델이 텍스트만 처리하는 AI와 실제 정보만 처리하는 AI 간의 격차를 메우는 데 도움이 된다고 말합니다. QVQ-Max는 시각적 추론 능력 덕분에 주변 세계를 "보고, 이해하고, 생각할" 수 있습니다. 이 회사는 이미지 분석, 핵심 요소 식별, 일러스트레이션 디자인, 비디오 대본 제작, 롤플레잉 등 다양한 분야에 적용할 수 있는 유연성 측면에서 탁월한 모델을 강조합니다.

알리바바, 시각 추론 모델 QVQ-Max 출시: 보고, 이해하고, 생각할 수 있다

다른 AI 챗봇과 마찬가지로 QVQ-Max는 업무, 교육, 개인 생활을 지원할 뿐만 아니라 시각적 통합 덕분에 다이어그램을 통한 수학/물리 문제 해결, 레시피 이미지를 통한 요리 지침 제공 등 보다 구체적인 업무도 해결합니다.

알리바바는 QVQ-Max를 첫 번째 버전으로 간주하고 후속 버전에 대한 업그레이드 로드맵을 설명했습니다. 첫째, 그들은 접지 기술을 사용하여 이미지 인식 정확도를 높이고자 했습니다. 둘째, 이 모델은 멀티태스킹과 휴대전화, 컴퓨터 작업, 게임 플레이 등 복잡한 문제를 처리하도록 최적화될 것입니다. 알리바바는 궁극적으로 텍스트 상호작용에서 도구 검증 및 이미지 콘텐츠 생성으로 확장할 계획입니다.

사용자는 다음을 통해 QVQ-Max를 경험할 수 있습니다.

  1. chat.qwen.ai 를 방문하세요
  2. 왼쪽 모서리의 모델 메뉴를 선택하세요 → " 더 많은 모델 확장 "
  3. QVQ-Max를 선택 하고 채팅을 시작하세요
  4. AI 처리 기능을 살펴보려면 이미지 파일을 첨부하세요.

알리바바는 QVQ-Max를 출시하면서 멀티미디어 AI 개발 경쟁에서 자사의 입지를 더욱 공고히 하고, 글로벌 기술 대기업과 직접 경쟁할 수 있게 되었습니다. 이 모델은 직장, 교육, 개인 생활에 실제적으로 적용될 수 있을 것으로 기대됩니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

전자 기기 조작을 돕기 위해 뇌에 ChatGPT를 이식한 최초의 사람

전자 기기 조작을 돕기 위해 뇌에 ChatGPT를 이식한 최초의 사람

ChatGPT는 환자가 전자 기기를 조작하는 데 도움이 되는 뇌 이식(BCI) 칩 분야의 선구자 중 하나인 Synchron에서 테스트 중입니다.

AI 아트 생성기가 일상 사진을 어떻게 더욱 돋보이게 할까요?

AI 아트 생성기가 일상 사진을 어떻게 더욱 돋보이게 할까요?

일상 사진의 분위기를 바꾸고 싶으신가요? AI 예술 창작 도구를 사용하면 수동 편집으로는 달성할 수 없는 독특하고 창의적인 느낌을 더할 수 있습니다.

오페라의 Aria AI가 유용한 5가지 이유

오페라의 Aria AI가 유용한 5가지 이유

많은 사람들이 AI를 좋아하지 않는 이유는 스스로 원시 데이터를 읽고 분석하고 싶어하기 때문입니다. 하지만 지루한 작업에 막혀 아이디어가 필요할 때는 Opera의 Aria AI를 사용해보세요. 오페라의 Aria AI가 유용한 이유는 다음과 같습니다!

House of Flying Daggers의 최신 코드 및 코드 사용 방법

House of Flying Daggers의 최신 코드 및 코드 사용 방법

Code Thap Dien Mai Phuc은 플레이어에게 Kim Nguyen Bao, Hoan Khon Halo, Gold, Huyen Tinh, Huyen Tinh Chest를 제공합니다.

블랙 신화: 오공이 사이버펑크 2077에서 기록을 훔치다

블랙 신화: 오공이 사이버펑크 2077에서 기록을 훔치다

대부분 긍정적인 리뷰가 쏟아지면서 Black Myth: Wukong이 Steam에서 기록을 경신하고 있다는 것은 놀라운 일이 아닙니다.

오류 코드 0xc00000e에 대해 알아보고 해결 방법을 알아보세요

오류 코드 0xc00000e에 대해 알아보고 해결 방법을 알아보세요

Windows 10을 시작할 때 종종 나타나는 두려운 블루 스크린 오브 데스(BSOD) 오류 코드 0xc00000e는 혼란스러울 수 있습니다.

함께 플레이 공간, 공간 이름 Play Together

함께 플레이 공간, 공간 이름 Play Together

많은 사람들이 Play Together 이름에 공백을 사용하거나 작은 밑줄을 사용하여 이름에 쓰는 글자 사이에 공백을 만듭니다.

Black Beacon PC 다운로드 방법

Black Beacon PC 다운로드 방법

PC에서 Black Beacon을 플레이하는 것은 가능하지만, 이 게임은 현재 공식적으로 이 플랫폼에 최적화되어 있지 않습니다.

구의 표면적과 부피를 계산하는 공식

구의 표면적과 부피를 계산하는 공식

구의 표면적은 큰 원의 면적의 4배이고, 이는 상수 파이에 구의 반지름 제곱을 곱한 값의 4배입니다.

중국이 최초로 달에 유인 착륙할 때 선택한 우주복의 특별한 점은 무엇일까?

중국이 최초로 달에 유인 착륙할 때 선택한 우주복의 특별한 점은 무엇일까?

중국은 2030년까지 최초로 국민을 달에 보내는 것을 목표로 하고 있으며, 이 나라는 다가올 역사적 임무에 사용될 새롭게 디자인된 우주복을 공개했습니다.

신체에 염증을 쉽게 일으키는 음식

신체에 염증을 쉽게 일으키는 음식

많은 음식이 염증과 만성 질환을 유발할 수 있습니다. 신체에 질병을 가져오고 싶지 않다면 너무 많이 섭취하지 말아야 할 음식은 다음과 같습니다.

Zuka Lien Quan 모바일 시즌 S1 2023 플레이 방법 안내

Zuka Lien Quan 모바일 시즌 S1 2023 플레이 방법 안내

주카는 체력이 낮은 챔피언에게 공포의 대상인 암살자로 알려져 있습니다. 시즌 23에서 주카를 효과적으로 사용하는 방법을 알아보세요.

최신 영웅 시대 코드 및 코드 사용 방법

최신 영웅 시대 코드 및 코드 사용 방법

영웅시대 기프트 코드를 통해 선물을 받는 것은 거의 모든 신규 플레이어가 게임에 참여할 때 하는 일입니다.

가장 저렴한 클라우드 스토리지 제공업체 8곳

가장 저렴한 클라우드 스토리지 제공업체 8곳

가장 저렴한 온라인 클라우드 스토리지 옵션을 살펴보겠습니다. 이 글에서는 절대 가격과 기가바이트당(월) 가격을 모두 살펴보겠습니다. 이를 통해 귀하에게 가장 적합한 가격을 선택할 수 있습니다.

Excel에서 파운드 기호 오류(####)는 무엇인가요?

Excel에서 파운드 기호 오류(####)는 무엇인가요?

Excel의 ####는 일반적인 Excel 오류이며 Excel에 데이터를 입력하거나, Excel 함수를 사용하거나, Excel에 수식을 입력할 때 다양한 경우에 나타납니다.