Amazon, Nova Sonic 사운드 모델 발표, OpenAI와 Google을 능가하는 성능 주장

Amazon은 오늘 개발자들이 실시간으로 사람의 목소리와 대화할 수 있는 앱을 개발할 수 있도록 지원하는 고급 음성 대 음성 모델인 Nova Sonic을 출시했습니다. Amazon은 이 새로운 오디오 모델이 업계 최고의 가격 대비 성능과 낮은 지연 시간을 자랑한다고 주장합니다.

일반적으로 음성 지원 애플리케이션을 개발하려면 개발자가 동시에 여러 모델을 사용해야 합니다.

  • 오디오를 텍스트로 변환하는 음성 인식 모델.
  • 응답을 이해하고 생성하기 위한 대규모 언어 모델(LLM)
  • 텍스트-음성 모델.

이런 접근 방식은 복잡할 뿐만 아니라 음색, 음조, 말하는 스타일과 같은 중요한 음향적 맥락을 놓치는 경우가 많습니다.

Amazon, Nova Sonic 사운드 모델 발표, OpenAI와 Google을 능가하는 성능 주장

Nova Sonic은 사운드 이해와 생성을 단일 모델로 통합하여 이러한 과제를 해결합니다. 통합된 접근 방식은 모델이 톤, 스타일, 오디오 입력을 포착하는 데 도움이 되어 보다 자연스러운 대화를 만들 수 있습니다. 또한 적절한 대응 시간을 결정하고 바지선 진입을 보다 잘 처리합니다.

Nova Sonic은 미국식, 영국식 등 다양한 영국식 악센트를 갖춘 남성 및 여성 음성을 지원합니다. 개발자는 함수 호출을 지원하는 양방향 스트리밍 API를 사용하여 Amazon Bedrock을 통해 모델에 액세스할 수 있습니다. 이 모델에는 콘텐츠 검토 및 워터마킹과 같은 내장 보호 기능도 제공됩니다.

이와 관련하여 지난달 OpenAI는 새로운 세대의 음성-텍스트 모델인 gpt-4o-transcribe와 gpt-4o-mini-transcribe를 발표했습니다. 이 모델은 기존 Whisper 모델에 비해 단어 오류율, 언어 인식 및 정확도가 크게 향상되었습니다.

Sign up and earn $1000 a day ⋙

Leave a Comment

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV를 스마트 TV로 바꿔주는 5가지 가젯

일반 TV도 몇 가지 가젯을 사용하면 새로운 기능을 익혀 단 몇 분 만에 값비싼 스마트 TV보다 더 나은 TV가 될 수 있습니다.

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨 사용 방법

파나소닉 에어컨 리모컨을 올바르게 사용하면 에어컨의 기능을 최대한 활용하는 데 도움이 됩니다.

Gemini가 사진, 파일 및 YouTube에 대한 Talk Live를 출시합니다.

Gemini가 사진, 파일 및 YouTube에 대한 Talk Live를 출시합니다.

Gemini Live에 "Talk Live about" 기능이 추가되었으며, 이제 Android 기기에서 더 광범위하게 출시될 예정입니다. 기존 제미니 라이브는 음성 입력만 가능했지만, 'Talk Live about'을 통해 콘텐츠 업로드가 확대됐다.

심층 연구로 업그레이드된 Microsoft Copilot

심층 연구로 업그레이드된 Microsoft Copilot

Microsoft는 마침내 Copilot AI에 심층 연구 기능을 도입했습니다. 이를 통해 사용자는 어떤 주제에 대해서든 철저하고 여러 단계의 조사를 수행할 수 있습니다.

포토샵에서 사진을 연필 스케치로 바꾸는 방법

포토샵에서 사진을 연필 스케치로 바꾸는 방법

이 튜토리얼에서는 Adobe Photoshop을 사용하여 사진을 연필 스케치로 쉽게 바꾸는 방법을 보여줍니다.

Golang의 Volatile 함수

Golang의 Volatile 함수

Go의 가변 함수를 사용하면 함수에 가변 개수의 인수를 전달할 수 있습니다. Golang의 volatile 함수에 대해 알아야 할 모든 것을 소개합니다.

Lien Quan Mobile에서 컬러 글자를 쓰는 방법

Lien Quan Mobile에서 컬러 글자를 쓰는 방법

Lien Quan Mobile에서 컬러 텍스트를 작성하려면 이 문서의 지침을 따르세요. LQ 모바일 컬러 문자가 더욱 눈에 띄게 됩니다.

절대 끝나서는 안 될 7가지 작업 관리자 프로세스

절대 끝나서는 안 될 7가지 작업 관리자 프로세스

Windows 10 작업 관리자 목록 하단에 있는 Windows 시스템 프로세스 섹션에는 컴퓨터가 제대로 작동하는 데 필수적인 몇 가지 중요한 프로세스가 포함되어 있습니다.

Apple은 사용자가 iOS 16으로 업그레이드하기 전에 iOS 15.7을 유지할 수 있도록 허용합니다.

Apple은 사용자가 iOS 16으로 업그레이드하기 전에 iOS 15.7을 유지할 수 있도록 허용합니다.

Apple은 사용자가 iOS 16으로 업그레이드하기 전에도 보안 업데이트를 받으면서 iOS 15를 계속 사용할 수 있도록 허용합니다.

Intel Core Ultra 5 225H, Core Ultra 7 255H 및 Core Ultra 9 285H CPU 성능 평가 결과가 Geekbench에서 제공됩니다.

Intel Core Ultra 5 225H, Core Ultra 7 255H 및 Core Ultra 9 285H CPU 성능 평가 결과가 Geekbench에서 제공됩니다.

인텔의 차기 Arrow Lake-H 모바일 라인업에 속하는 3개의 SKU가 Geekbench에서 테스트되었으며, 매우 인상적인 단일 코어 및 멀티 코어 성능과 사양이 드러났습니다.

익숙한 고무줄을 만드는 과정이 이렇게 복잡하고 정교할 줄 누가 상상했겠는가?

익숙한 고무줄을 만드는 과정이 이렇게 복잡하고 정교할 줄 누가 상상했겠는가?

작은 고무줄은 간단해 보이지만, 실제로 만드는 과정은 생각보다 복잡합니다. 고무줄을 만드는 전체 과정은 다음과 같습니다.

수성에 대한 흥미로운 사실 ​​9가지

수성에 대한 흥미로운 사실 ​​9가지

수성은 태양계에서 가장 작은 행성이며, 태양에 가장 가까운 행성이기도 합니다. 수성은 믿을 수 없을 정도로 빠른 속도로 태양을 공전하며, 평균 속도는 시속 106,000마일에 달합니다. 이는 이 행성에 대한 많은 흥미로운 사실 ​​중 일부에 불과합니다.

소니, 삼성, LG 등에서 판매하는 32인치, 40인치, 43인치, 55인치 TV의 크기는 어떻게 되나요?

소니, 삼성, LG 등에서 판매하는 32인치, 40인치, 43인치, 55인치 TV의 크기는 어떻게 되나요?

아래 기사는 소니, 삼성, LG의 현재 TV 제품군의 크기를 이해하는 데 도움이 되며, 이를 통해 올바른 구매 결정을 내리는 데 도움이 될 것입니다.

삶의 질을 극적으로 향상시키는 7가지 간단한 기술 개선

삶의 질을 극적으로 향상시키는 7가지 간단한 기술 개선

기술과 건강한 관계를 맺는 것은 어려워 보일 수 있지만, 작은 변화가 큰 변화를 가져올 수 있습니다.

삼성 갤러리 앱에서 할 수 있다는 사실을 몰랐던 8가지

삼성 갤러리 앱에서 할 수 있다는 사실을 몰랐던 8가지

삼성 갤러리 앱은 여러분이 생각하는 것보다 더 강력한 기능을 가지고 있지만, 당장은 눈에 띄지 않을 수도 있습니다.