Vidu是由清华大学与北京生数科技有限公司联合研发的中国首个原创全自研视频大模型,于2024年4月27日在中关村论坛正式发布。以下是其核心信息:

技术特点
- 架构创新
采用全球首个Diffusion与Transformer融合架构U-ViT,支持直接生成16秒、1080P高清视频,无需插帧或拼接,实现“一镜到底”的连贯效果。 - 核心能力
- 物理模拟:精准还原光影、物体运动等物理规律,如扬尘、水面倒影等细节;
- 多镜头语言:支持远景、特写、追焦等复杂镜头切换,动态运镜流畅自然;
- 文化理解:可生成熊猫、龙等中国元素,并融入国漫风格创作。
应用场景
- 内容创作:广告营销(如耳机、香水动态展示)、短剧制作、电商可视化;
- IP开发:与央视动漫合作推出“西游师徒”AI互动模板,实现经典IP数字化重生;
- 教育科研:模拟实验场景、辅助教学视频生成。
技术突破
- 效率与成本:2025年发布的Vidu Q1版本支持10秒生成5秒视频,成本低至0.3元/秒,性能超越Runway、Sora等国际模型;
- 榜单表现:连续两年入选中关村论坛重大科技成果,并获2025科幻星球大赛“科幻创作技术”冠军。
生态布局
- 开源与协作:2023年开源UniDiffuser多模态模型,推动技术共享;
- 全球合作:覆盖200+国家地区,与海外工作室合作开发科幻动漫剧集。
Vidu通过“技术+场景”双轮驱动,正重塑视频创作范式,降低专业内容制作门槛,成为AI+文化创意领域的标杆。