DeepSeek揭秘如何突破软硬件瓶颈｜科创要闻

2025-08-28 02:48:28 来源：沉潜刚克网

人工智能军备竞赛在国内外持续迭代演进。揭秘OpenAI、何突谷歌、破软瓶颈微软、硬件阿里巴巴等不断推出新应用，科创MCP协议、揭秘AI编程、何突具身智能机器人、破软瓶颈芯片自研等场景多样拓展。硬件自从年初引起全球震动并激发诸多领域AI变革以来，科创DeepSeek的揭秘一举一动都备受关注，但其最新R2模型千呼万唤仍未推出。何突

5月14日，破软瓶颈DeepSeek团队发表最新论文，硬件解释其DeepSeek-V3模型在硬件架构和模型设计方面的科创关键创新，公开大规模训练和推理的降本秘诀，令人瞩目的效率突破是如何做到的，又给业内很大启发。

这篇发表在arXiv平台的论文Insights into DeepSeek-V3:Scaling Challenges and Reflections on Hardware for AI Architectures，DeepSeek创始人兼CEO梁文锋出现在合著名单中。

相较此前的DeepSeek-V3技术报告，本篇论文的重点不在算法，而是从硬件架构和模型设计双重视角出发，探讨了硬件和模型两者如何相互配合，以实现低成本的大规模训练和推理，主要涵盖五方面内容，包括DeepSeek模型的设计原则、低精度驱动设计、以互联为驱动的设计、大规模网络驱动设计、面向未来的硬件架构设计。

论文重点介绍了多头潜在注意力（MLA）以提高内存效率、混合专家（MoE）架构以优化计算与通信权衡、FP8混合精度训练以充分发挥硬件潜力，以及多平面网络拓扑以最小化集群级网络开销等关键创新，还为未来AI硬件与模型协同设计提出了建议。

大模型的迅猛扩张暴露了硬件的架构瓶颈：内存容量不足、计算效率低下、互连带宽受限等。DeepSeek研究团队通过基础设施与算法团队的深度合作，开发了一个适用于MoE模型的FP8混合精度训练框架。在混合精度训练中，模型的权重和激活值可以使用FP8进行计算，而关键的梯度计算和优化步骤则使用更高的精度（如FP32）来保证训练的稳定性，从而在不损失模型性能的前提下，充分发挥硬件的计算能力，加速训练过程，降低训练成本和内存占用。

论文披露了对通信架构的重构。DeepSeek提出多平面双层胖树网络（MPFT），将传统三层网络拓扑压缩为两层，通过8个独立网络平面实现流量隔离和成本下降。这是DeepSeek首次披露超大规模集群的网络优化方案。

他们还提出了未来硬件架构设计的前瞻性方

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

百科

小米澎湃OS3系统明天发布 Beta测试开始报名

据小米官方透露，小米澎湃OS3系统发布会将在8月28日15:00开幕，新系统将会在此时正式推出。新系统的Beta版测试也会同步开启，目前已经在小米社区开始报名。据小米官方透露，小米澎湃OS3系统发布会

许昌污水管网工程施工涉及5条主干道路过要当心

民政部：有序恢复养老机构服务秩序

热点

交银全部：上调信义光能(00968)目标价至5.05港元重申“买入”评级,行业资讯

交银全部发表研究报告称，将信义光能(00968)目标价由4.8港元上调5.2%至5.05港元，重申“买入”评级。该行表示，信义光能业绩基本符合市场预期，上半年收入39.97亿港元，按年下降4.3%，纯

2017年，我国热水器行业规模可期

实木地板可不是谁家都能用处好效果的！

综合

市场激活：万亿级资产“苏醒”，民间收藏的春天真的来了？收藏资讯

凌晨五点，老李已经揣着放大镜蹲在了潘家园的地摊前。这位退休教师摆弄着手里那只青花小罐，眼角的皱纹里藏着掩饰不住的兴奋——就在上周，他那套传了三代的古钱币，终于在一家正规拍卖行拍出了六位数的价格。“搁以

众安癌症复发险在哪里购买？众安众民保癌症复发险多少钱？

榕:家具市场已成区域格局往高走-

探索

3·15促销越玩越嗨传播消费正能量才是门窗品牌应有之意

一年一度的315国际消费者权益日即将到来，备受关注的企业诚信、产品品质、售后服务等再度成为热议话题。在门窗消费市场，口碑评选、正品保证以及赤裸裸的打折促销，似乎都在让3·15维权日&ld

中粮茶业持续提升影响力荣获中华老字号创新大奖

议员国际米兰俱乐部：莫拉蒂的讲话

DeepSeek揭秘如何突破软硬件瓶颈｜科创要闻

扩展阅读