好莱坞特效师花300多块钱,用AI做了一部科幻短片 -

来源:人气:631更新:2025-08-24 18:00:49

曾参与《2012》《黑客帝国3》等好莱坞大片视觉特效指导的姚骐近日发布其AI创作的科幻短片《归途》。影片呈现了末日背景下异形生物追击驾驶车辆的人类、巨型蜘蛛攀附摩天大楼等震撼场景。姚骐表示"数字特效与实拍效果相当",并透露制作过程:全片包含超过40个镜头,每个镜头经三次生成形成120个视频片段,其中18个为10秒完整声画片段,其余102个为5秒无声片段,历时约7天完成制作。

姚骐指出,若以传统实拍或CG制作方式完成一部短片,通常需投入数百万成本。在好莱坞影视制作中,某些复杂镜头的单次制作费用甚至可达数十万至上百万。而AI生成技术则显著降低了制作门槛,百度蒸汽机音视频一体模型实现的短片成本仅为约330.6元人民币。尽管如此,AI生成的视频仍存在改进空间,当前技术在人物表现力、声画同步等方面尚未达到人类水平,但已突破"默片"时代,实现了多角色语音与环境音效的协同生成。

百度在视频生成领域的发展路径颇具代表性。虽然早在2024年春节OpenAI已推出Sora视频生成模型,国内大模型纷纷跟进研究,但百度并未立即推出同类技术。去年秋季的百度内部总监会上,李彦宏曾明确表示不涉足Sora类视频生成,认为其商业化应用可能需要十年甚至二十年。转折点出现在市场需求的变化,百度移动生态商业体系负责人陈一凡透露,商业部门收到的特定需求最终促使公司启动视频生成模型自主研发,项目代号为"MuseSteamer"。

目前百度视频生成模型上线50天,主要用户群体来自公司内部,包括搜索业务、移动生态创作者等,其次是专业领域创作者与企业客户。行业竞争态势日益激烈,快手可灵AI在2025年第二季度已实现2.5亿元人民币营收,字节、阿里、腾讯等科技巨头以及生数科技、爱诗科技等创业公司均在该赛道加速布局。

技术突破成为各厂商竞争的核心。谷歌推出的Veo3模型已突破视频生成的"无声时代",可同步生成环境音与人物对话。百度最新版本的蒸汽机模型则实现了多人有声视频的协同生成,但面对持续增长的视频时长需求,技术架构制约明显。当前主流技术以扩散模型为基础,延长视频长度会导致成本指数级上升,这使得10秒至20秒甚至100秒的视频生成存在成本与效果的平衡难题。

在技术发展与商业应用的双重驱动下,视频生成行业正经历快速迭代。百度虽入局较晚,但凭借多人有声视频技术和"行业七折"的价格策略,试图在竞争激烈的市场中开辟新赛道。百度人士强调,C端市场潜力巨大,但关键在于技术的持续优化。"我们欢迎AI视频生成的卷入,不卷不可能做好,大家互相启发才能突破技术边界。"陈一凡认为,尽管当前技术仍面临诸多挑战,但行业仍处于早期发展阶段,未来增长空间广阔。

Copyright © 2023 www.jdw8.com