国产成人无码aa精品一区19,国内精品久久久久野战,四虎国产精品亚洲一区久久,国产成人无码aa精品一区19 ,国产成人一区二区视频免费,玖玖草在线观看一区二区三区,亚洲线精品一区二区三区,97久久精品一区二区少妇,亚洲精品麻豆一区二区

設為首頁 - 加入收藏   
您的當前位置:首頁 > 綜合 > 豆包語音識別模型2.0發布:能聽懂字看懂圖 支持13種外語 正文

豆包語音識別模型2.0發布:能聽懂字看懂圖 支持13種外語

來源:企業錄(www.955ce.com)-公司信息發布,網上買賣交易門戶 編輯:綜合 時間:2025-12-16 15:24:01

12月5日消息,豆包懂字今日,語音火山引擎發布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),識別依托Seed混合專家大語言模型架構構建。模型

據介紹,發布2.0版本模型推理能力提升,看懂可以通過深度理解上下文完成精準識別,圖支上下文整體關鍵詞召回率提升20%。持種

同時支持多模態視覺識別,外語不僅“聽懂字”還能“看懂圖”,豆包懂字通過單圖和多圖等視覺信息輸入讓文字識別更精準。語音

此外,識別2.0版本還支持日語、模型韓語、發布德語、看懂法語等 13 種海外語種的精準識別。

并且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復雜場景進行了升級。

以歷史人物生平討論場景為例,當用戶提及蘇轍貶謫地“筠(yún)州”時,如果模型缺乏推理能力會易將其誤識別為同音的“云州”“鄆州”等。

而豆包語音識別模型2.0可依托“當前討論蘇軾、蘇轍”這一背景,即便上下文從沒出現過“筠州”,也能通過邏輯推理鎖定用戶所指的特定地名,最終實現對多音字地名的精準識別。

目前,豆包語音識別模型2.0已上線火山方舟體驗中心并對外提供API服務。

熱門文章

0.1119s , 8420.9609375 kb

Copyright © 2025 Powered by 豆包語音識別模型2.0發布:能聽懂字看懂圖 支持13種外語,企業錄(www.955ce.com)-公司信息發布,網上買賣交易門戶  

sitemap

Top