2025vivo开发者大会 蓝心语言大模型升级!vivo重构了意图中控,让系统能在准确理解用户意图的基础上,拆解复杂任务,调整执行步骤,并结合长期记忆实现更精准、更个性化的交互体验。今年蓝心小V具备了深度思考能力,可以为用户提供更有洞察力、更高质量的智能问答服务。另外vivo正在积极布局深度研究功能,大模型仅需十几分钟,即可完成广泛的信息调研与分析,生成数千字高质量报告。
得益于蓝心语音大模型与多模态技术融合,小V语音交互更自然流畅:无需唤醒词即可直接下达指令,可以“聆听”与“响应”并行的全双工语音交互,超拟人音色在语调、韵律和呼吸细节上更接近真人,定制音色相似度和还原度更高。同声传译将拾音距离从 1 米提升至 3 米,声音记忆可识别说话者并实施感知“谁、何时、说了什么”,小V全新语音对话还能感知语气与情绪,支持自然打断,让语音交流像面对面对话一样顺畅自然。
通过渐进式、多阶段的训练,我们进一步提升了图像大模型,图文一致性和美观度;基于字形控制网络的深度优化,突破长文本渲染难题,实现文字精准生成;此外,依托图像大模型,我们推出了丰富的AI修图功能。比如备受用户喜欢的AI路人消除,基于图像大模型基座,通过模型剪枝、蒸馏学习、低比特量化等多种技术,将模型放到端侧,对比云端链路性能提升46%,端侧路人消除效果保持行业领先。还有AI魔法移动,通过多阶段高精度分割,配合光影合成的智能补全,帮用户实现随心所欲的主体构图。vivo全新系统OriginOS6