豆包语音识别模型2.0发布：能听懂字看懂图支持13种外语--快科技--科技改变未来

正文内容 评论（0）

豆包语音识别模型2.0发布：能听懂字看懂图支持13种外语

2025-12-05 16:40:34 出处：快科技作者：哈尔编辑：哈尔评论(0)

复制

纠错

#豆包 #语音识别

快科技12月5日消息，今日，火山引擎发布豆包语音识别模型2.0（Doubao-Seed-ASR-2.0），依托Seed混合专家大语言模型架构构建。

据介绍，2.0版本模型推理能力提升，可以通过深度理解上下文完成精准识别，上下文整体关键词召回率提升20%。

同时支持多模态视觉识别，不仅“听懂字”还能“看懂图”，通过单图和多图等视觉信息输入让文字识别更精准。

豆包语音识别模型2.0发布：能听懂字看懂图支持13种外语

此外，2.0版本还支持日语、韩语、德语、法语等 13 种海外语种的精准识别。

豆包语音识别模型2.0发布：能听懂字看懂图支持13种外语

并且重点针对专有名词、人名、地名、品牌名称及易混淆多音字等复杂场景进行了升级。

以历史人物生平讨论场景为例，当用户提及苏辙贬谪地“筠（yún）州”时，如果模型缺乏推理能力会易将其误识别为同音的“云州”“郓州”等。

而豆包语音识别模型2.0可依托“当前讨论苏轼、苏辙”这一背景，即便上下文从没出现过“筠州”，也能通过逻辑推理锁定用户所指的特定地名，最终实现对多音字地名的精准识别。

豆包语音识别模型2.0发布：能听懂字看懂图支持13种外语

目前，豆包语音识别模型2.0已上线火山方舟体验中心并对外提供API服务。

豆包语音识别模型2.0发布：能听懂字看懂图支持13种外语

【本文结束】如需转载请务必注明出处：快科技

责任编辑：哈尔

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#豆包 #语音识别 #大模型

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波