PaddleMIX-Wan2.1&HunyuanVideo多模态视频生成模型

·多模态文生视频模型:Wan2.1模型结合扩散变换器(DiT)与流匹配,利用交叉注意力嵌入文本条件;融入时空注意力机制,增强模型捕捉复杂动态的能力。HunyuanVideo模型:融合Causal 3D VAE、Large Language Models以及diffusion backbone架构,确保高质量的视觉效果、运动动态和文本-视频对齐,超越Runway Gen-3等领先模型。

·4月28日(周一)实战营将带你从环境准备开始,实操体验基于PaddleMIX框架的多模态文生视频模型Wan2.1和HunyuanVideo,感受其在多模态生成任务场景的出色表现。

*
您的姓名:
*
请输入您的手机号码:
*
您的身份是:
数据科学家
机器学习工程师
软件开发工程师
嵌入式系统工程师
产品经理
企业负责人
项目负责人
研究员/学者
老师
学生
其他
*
公司全称(如:百度在线网络技术有限公司):
*
您基于什么需求使用/计划使用PaddleMIX?【多选题】
企业有AI业务转型、AI业务落地需求,主要服务客户项目交付
希望快速提升企业内部业务开发效率、降低生产成本
希望快速提升个人算法能力
*
您/您所在单位的AI技术方向:
【多选题】
图像理解
文档理解
图表理解
视频理解
多模态检索
文生图
文生视频
图像编辑
视频编辑
多模态数据生成
多模态数据清理
其他
*
您计划将PaddleMIX应用于哪些领域:【多选题】
政企服务
工业制造
能源电力
交通
智慧城市
金融
教育
医疗
文化传媒
电商
运营商
仓储物流
建筑工程
其他
*
您使用的训练硬件主要为:
【多选题】
NVIDIA
昇腾
昆仑芯
海光
寒武纪
燧原
天数智芯
其他
*
您使用的推理硬件主要为:【多选题】
NVIDIA
Intel
昇腾
昆仑芯
寒武纪
燧原
天数智芯
登临
其他
问卷星提供技术支持
举报