曝DeepSeek-R2将于下月发布总参数量达1.2万亿

投稿人:丁丁 更新时间: 2025-04-29 20:34

【太平洋科技快讯】近日，据相关曝料透露，深度求索计划于下个月发布其下一代AI大模型DeepSeek-R2。据悉，该模型在性能和成本上都取得了显著突破，并实现了全产业链的自主可控，有望对现有AI服务市场产生重大影响。

DeepSeek-R2采用了混合专家模型(MoE)架构，并结合了智能门控网络层(Gating Network)，以优化高负载推理任务的性能。这种架构通过动态分配计算资源，使得模型能够更灵活、高效地处理复杂任务。此外，DeepSeek-R2的总参数量达到1.2万亿，几乎是上一代DeepSeek-R1的6710亿参数的两倍。

在训练和推理性能上，DeepSeek-R2表现出色。基于华为昇腾910B芯片集群进行训练，该模型在FP16精度下达到512 PetaFLOPS的计算能力，芯片使用效率高达82%，这一性能相当于英伟达上一代A100训练集群的91%。在推理方面，DeepSeek-R2的速度达到每秒320 tokens，比前代模型有显著提升，并且在复杂逻辑推理任务上的准确率提升了83%。

此外，DeepSeek-R2预计将比GPT-4的成本降低97%，这预示着其可能颠覆现有AI服务的定价模式。分析师预计，DeepSeek-R2的定价将显著低于OpenAI的同类产品，这无疑将极大地提升其市场竞争力。

文章标签:

推荐导读

字节豆包AI视频生成功能升级提升语义理解和动作连贯性

联发科天玑9500详细信息曝光搭载NPU9.0算力约100TOPS

元宝豆包踏进同一条河流，kimi怎么就“学”起了知乎？

VIVIENNE WESTWOOD REINA 锆石金色土星耳钉

SEIKO 精工 Prospex SSG017 男士太阳能电波腕表

Green Bell 格林贝尔匠の技 G-1004 指甲钳带放大镜 *4支

曝DeepSeek-R2将于下月发布 总参数量达1.2万亿

文章标签:

推荐导读

商家优惠券

曝DeepSeek-R2将于下月发布总参数量达1.2万亿