发布日期:2025-03-06 11:56 点击量: 信息来源:龙8
近期,即梦AI正在社交上发布了一条新功能上线预告片。视频显示,采用了全新的多模态视频生成模子OmniHuman,用户仅需输入一张图片和一段音频,就能够生成一条活泼的AI视频,无望大幅提拔AI短片的制做效率和质量。OmniHuman手艺从页消息显示,可支撑肖像、半身以及等分歧尺寸的图片输入,并按照输入的音频,正在视频中让人物生成取之婚配的动做,包罗、乐器吹奏以及挪动。对于人物视频生成中常见的手势崩坏,此外,对动漫、3D等非实人图片输入的支撑结果也较为超卓,生成的视频能连结特定气概和原有的活动模式。按照手艺从页展现的演示结果来看,OmniHuman的生成结果曾经具有较高的天然度。为防止该项手艺被不妥操纵,字节跳脱手艺团队正在从页中出格标注称,OmniHuman将不会对外供给下载。该模子目前已具备较好的表示,但正在生成影视实正在级此外视频上仍存正在必然的提拔空间。由其支撑的多模态视频生成功能会期近梦上以小范畴内测的形式进行调优调整,并逐渐。该担任人同时暗示,即梦还会对这一功能设置严酷的平安审核机制,从而确保AI阐扬反面、积极的感化,帮力视频创做者更好地实现想象力的表达。