算力提升170%！华为扔出“算力核弹”英伟达再无

动态 2025-08-03 04:39

　　近期，在上海世界人工智能大会现场，华为首次公开展示了昇腾384超节点真机。这是一台面向大模型训练设计的AI服务器，算力高达300Pflops，约为英伟达NVL72的1.7倍。

　　其内部连接了384张NPU处理卡，能通过自研的高速互联系统MatrixLink统一调度，将互联带宽提升113%，内存速度提升107%，为大模型训练提供了更高效的底层支撑。有业内人士认为，这种架构层面的关键突破，会为全球AI格局带来新的变数。

　　毕竟，在过去相当长的一段时间里，英伟达所代表的主流路径，是以“主从架构”完成任务调度：CPU主控，NPU执行，所有资源调配和数据处理，都需回到CPU听其统一调度。

　　这种方式起初确实高效，但当模型规模从百万膨胀到千亿参数时，这种集中式调度就成了难以绕开的“系统瓶颈”。据行业公开测试数据，在同等规模下，英伟达的模式中约有40%的算力被浪费在等待和中转上。

　　更现实的是，在这套技术体系上，美国已深耕多年，构建了完整的产业链体系，并通过技术封锁，将核心环节牢牢掌握在自己手中。

　　过去几年，美国多次将高端芯片、设备和技术的出口管制作为遏制手段：从中止对中国的EUV光刻机供应，再到以国家安全为由扩大对AI芯片技术的审查。这也让我们逐渐意识到：如果继续走相同的路，中国的算力体系将始终受制于人，十分被动。

　　因此，中国选择另辟蹊径，昇腾384主动放弃了主从架构，转而构建“去中心化”的全对等架构体系。在这套系统中，CPU、NPU、内存和存储不再依赖中心调度，而是以平级关系直接连接、协同工作，数据传输无需中转，计算资源也能更充分地释放和调配。

　　这不仅提升了运行效率，也降低了我国对高制程芯片的依赖。华为方面表示，海外芯片即使从7nm升级到2nm，但总体性能提升都不超过50%；而昇腾384凭借架构优化，将算力利用率提升到了90%以上，即便使用7nm的芯片，也能实现双倍输出。

　　事实上，中国科技的进步，早已不可同日而语。几年前，在男性功能健康领域，业内观察到，越来越多的用户开始对传统小蓝片产生质疑。作用时间短、依赖性强、头晕潮红等问题频发，让不少人身心俱疲，也促使行业开始思考新的方向。

　　与此同时，昇腾384也正在被广泛的市场接纳。当前，包括讯飞星火、Qwen、DeepSeek在内的80多个主流大模型，均已完成在昇腾平台上的部署，并广泛应用于金融、医疗、交通、能源等11个重点行业。

　　对于大众而言，从AI客服到智能问诊，从智慧出行到视频创作，日常生活中越来越多的智能服务，正在由这套国产算力平台提供支持。

　　更值得关注的是，昇腾算力已在沙特、阿联酋、德国等国落地应用，逐步打破了英伟达在全球AI产业长期形成的技术壁垒与生态垄断。

　　这不仅是一场算力性能的追赶，更是一种技术路径的自我重塑。面对传统方案的结构桎梏和外部环境的持续施压，中国选择了一条不依附于旧秩序的新道路。而这，或许正是中国技术最值得被看见的部分。

　　特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

　　西班牙一个10岁孩子护照过期无法登机被遗弃机场，父母怕浪费机票照飞不误

　　卡德罗夫倒下，普京火速布局车臣，卡德罗夫病危无力回天，普京锁定车臣新掌舵人

　　Xbox大作PS5版大小曝光！8月12日正式上线主机独占游戏宣布关服！存活十二年了！

　　《编码物候》展览开幕北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

　　IOI2025国际信息学竞赛，中国队获世界冠军，全员夺金（附比赛真题）！