百度语音合成服务key,百度语音合成服务?

近两年来,各类虚拟形象如雨后春笋般冒了出来,他们开始承担起原先完全需要人类来完成的工作,有的是像人工一样提供服务,有的则登上舞台进行表演。元宇宙概念带来的这一波热度更让大量企业和资本投入到虚拟形象建设,但最基本的“从哪来,到哪去”问题还有待解决。

在人工智能技术上投入巨大的百度,提出了自己对于虚拟形象和元宇宙的新见解。百度认为这类形象可统称为“数字人”,存在着产业链割裂、服务场景与演艺场景没有有效打通、满足高频需求成本高三大难点,需要有切实的办法帮助企业完成服务、演艺生产的降本增效

百度语音合成服务key,百度语音合成服务?

基于此,百度智能云AI人机交互实验室负责人李士岩对外介绍了百度智能云曦灵平台。这是一个集数字人生产、内容创作、业务配置服务为一体的平台级产品,将百度的人工智能技术成果和数字资产服务等进行整合,让“数字人”有望从高成本定制转向标准化快速交付。

在百度的语境中,“数字人”可分为三个阶段:平面形象+语音合成的“纸片人”为1.0,虚拟主播可视作2.0,AI参与建模和内容生产等工作的是3.0。百度现在有生产3.0阶段“服务型数字人”和“演艺型数字人”的能力,百度智能云曦灵平台可通过照片快速生成2D虚拟形象,还能大幅压缩3D虚拟形象的生产时间。

百度语音合成服务key,百度语音合成服务?

从现在的产品来看,“服务型数字人”概念更像是接近真实世界互动方式的人机交互界面,通过拟人化的形象消除使用电子产品的陌生感,让数字素养相对陌生的人也能轻松使用各类服务。类似创意最早在上世纪末出现过,但因为难以统合复杂的场景并理解需求,最终被放弃

如今重新能提出拟人化的人机交互变革,可能和人工智能以及硬件产品的飞速发展存在密切联系:像是百度已经大规模上线的云客服等产品,能够为用户提供的交互方式更加自然,同时也能更精准地理解反馈,而图像、语音等多模态交互加入,有了提供充分服务的基础。

至于“服务型数字人”是否会真正的满足元宇宙世界内的需求,恐怕当下还不是做出判断的最佳时机。能够支撑起细节丰富、稳定可靠、大众能接受的元宇宙软硬件技术基础尚未到来,这类产品还得先在现有终端上提供交互体验改变,如网页内对话、手机App操作或柜员机等。

百度语音合成服务key,百度语音合成服务?

“演艺型数字人”提供了另一种想象空间,它无论看起来互动起来都比图文更像真人,以一种更为安全的方式代表品牌、企业、项目与用户沟通。到了娱乐消费、社交陪伴等需求上,虚拟形象更有着真人所不能及的“完美”,也能不随时间而变化。

等到计算资源大爆发,使用成本又变得相当低的时候,说不定还能定制出每个人专属的虚拟形象,“一切行动只为满足你的喜好”。李士岩展示了愿景:“我们近两年的奋斗目标是,通过百度智能云曦灵平台的开放,让每个人实现数字人自由。”

当然,现在的产品大都处于相当早期的阶段,很多虚拟形象仅仅是满足了动起来的要求,还没有做到像真正的偶像那样打动人心。不过古人有云“不积跬步,无以至千里”,在提供更多元的娱乐消费产品道路上,百度智能云曦灵驱动的“演艺型数字人”,或许会是关键的第一步。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.gooyie.com/45883.html