腾讯混元大模型上线并开源文生视频能力 拥有130亿参数
投稿人:丁丁
更新时间: 2024-12-04 09:40
腾讯混元大模型上线并开源文生视频能力 拥有130亿参数
【太平洋科技快讯】12月3日,腾讯公司宣布,其混元大模型成功上线视频生成能力,标志着继文生文、文生图、3D生成之后,腾讯在AI领域再次实现重大技术突破。该模型的参数量高达130亿,成为当前最大的视频开源模型。
混元大模型支持中英文双语输入,并具备“超写实”的视频生成能力,画面质量高,不易变形。在镜面或镜子场景中,模型能实现镜面反射动作与外部场景的完全同步,光影反射效果符合物理规律。
据悉,混元大模型采用了DiT架构,并结合新一代文本编码器,有效提升了语义遵循能力。这使得模型在描绘多个主体时更加精准,能够实现更细致的指令和画面呈现。
感兴趣的用户可在腾讯元宝App中的“AI应用”板块选择“AI视频”申请试用。同时,企业客户可通过腾讯云提供服务接入,目前API已同步开放内测申请,此次开源行动涵盖了模型权重、推理代码、模型算法等完整模型,免费提供给企业和个人开发者使用。