

在最近举办的百度 AI DAY 上,百度文小言宣布了其品牌焕新和功能升级的消息。这次升级不仅包括全新的视觉形象,更重要的是引入了多模型融合调度技术,极大地增强了其语音识别和图片问答的能力。
文小言的多模型融合调度是这次升级的核心亮点。通过整合百度自研的文心 X1、文心4.5等模型,并引入第三方优质模型如DeepSeek-R1和可灵,用户可以根据需求灵活选择最适合的模型。用户只需点击“自动模式”,系统将智能选择最佳模型组合,显著提高响应速度和任务处理能力,实现了一键解决问题的理想体验。
在语音能力方面,全新升级的语音大模型支持多种方言对话、复杂知识问答,甚至可以随时打断对话。用户不仅可通过语音获取知识回答,还能进行趣味角色扮演,交互体验更为丰富。百度语音首席架构师贾磊指出,这款模型是行业首个基于全新互相关注意力技术的端到端语音语言大模型,调用成本降低50%-90%,推理响应速度快,等待时间缩短至1秒左右,让用户的交互体验更加流畅。
此外,文小言还推出了创新的图片问答功能,用户可以通过拍照或上传图片,直接以文字或语音提问,获取详细解析。例如,用户拍摄数学题,可实时获得解题思路与视频解析;上传商品图片可比较参数与价格,方便购物决策。新增的“图个冷知识”功能增加了趣味性,用户可预设各种视角,从多维度解读同一图片,提升了互动乐趣。
百度文小言的这次升级为用户带来了更智能和便捷的体验,未来的互动将更加多样化。
快讯中提到的AI工具

DeepSeek
深度求索:引领未来人工智能技术的探索与创新
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/29chs5cs暂无评论...