腾讯混元大模型上线并开源文生视频能力拥有130亿参数

投稿人:丁丁 更新时间: 2024-12-04 09:40

【太平洋科技快讯】12月3日，腾讯公司宣布，其混元大模型成功上线视频生成能力，标志着继文生文、文生图、3D生成之后，腾讯在AI领域再次实现重大技术突破。该模型的参数量高达130亿，成为当前最大的视频开源模型。

混元大模型支持中英文双语输入，并具备“超写实”的视频生成能力，画面质量高，不易变形。在镜面或镜子场景中，模型能实现镜面反射动作与外部场景的完全同步，光影反射效果符合物理规律。

据悉，混元大模型采用了DiT架构，并结合新一代文本编码器，有效提升了语义遵循能力。这使得模型在描绘多个主体时更加精准，能够实现更细致的指令和画面呈现。

感兴趣的用户可在腾讯元宝App中的“AI应用”板块选择“AI视频”申请试用。同时，企业客户可通过腾讯云提供服务接入，目前API已同步开放内测申请，此次开源行动涵盖了模型权重、推理代码、模型算法等完整模型，免费提供给企业和个人开发者使用。

文章标签:

体验惠普星Book Pro 16:不到6000元的大屏高性能轻薄本之星！

苹果有望在下半年推出折叠iPhone，将为可折叠市场带来显著增长！

vivo S20系列正火热预售中，蓝厂美学旗舰名不虚传！

GNC 健安喜钙+维生素D3&镁

Lumene 优姿婷北极冰泉充盈水感修护啫喱面膜

Farmacy 限量套装、卸妆膏