新闻

百度蒸汽机2.0上线 行业首推多人有声视频一体化生成

百度今天宣布其音视频一体化模型“蒸汽机”(MuseSteamer)完成2.0版本升级。该版本在行业内首次实现多人有声视频一体化生成功能,支持Turbo版、Lite版、Pro版及全系有声版的全面开放。普通用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验相关服务,企业用户则可通过千帆平台获取高性能视频生成支持。

据官方披露,2.0版本基于多模态时空规划、中文场景深度优化及音视端到端建模等技术,实现多人音视频同步生成、复杂运镜效果、电影级人物表演细节、丰富镜头表现及流畅画质输出。

打开驱动中国APP,了解更多热点新闻