亞馬遜推出了一款名為 Nova Sonic 的 AI 語音模型,它不僅能理解語音內(nèi)容,還能捕捉說話者的語氣、猶豫等細微變化。這個模型整合了語音識別、回復生成和語音合成功能,能夠?qū)崿F(xiàn)更自然的對話交互。Nova Sonic 可以根據(jù)說話者的語氣調(diào)整回應,理解對話中的停頓,并能適當處理打斷等情況,從而提供更智能、更人性化的語音交互體驗。
Sierra AI主要通過OpenAI的GPT-4o、o1等模型打造了一個對話式AI Agent平臺,主要聚焦在客戶服務領域,可以混合處理文本、語音自動執(zhí)行超復雜工作流程。包括客服咨詢、退訂商單、訂閱更新等。