AICoin动态

算力提升170%!华为扔出“算力核弹”英伟达再无

动态 2025-08-03 04:39

  近期,在上海世界人工智能大会现场,华为首次公开展示了昇腾384超节点真机。这是一台面向大模型训练设计的AI服务器,算力高达300Pflops,约为英伟达NVL72的1.7倍。

  其内部连接了384张NPU处理卡,能通过自研的高速互联系统MatrixLink统一调度,将互联带宽提升113%,内存速度提升107%,为大模型训练提供了更高效的底层支撑。有业内人士认为,这种架构层面的关键突破,会为全球AI格局带来新的变数。

  毕竟,在过去相当长的一段时间里,英伟达所代表的主流路径,是以“主从架构”完成任务调度:CPU主控,NPU执行,所有资源调配和数据处理,都需回到CPU听其统一调度。

  这种方式起初确实高效,但当模型规模从百万膨胀到千亿参数时,这种集中式调度就成了难以绕开的“系统瓶颈”。据行业公开测试数据,在同等规模下,英伟达的模式中约有40%的算力被浪费在等待和中转上。

  更现实的是,在这套技术体系上,美国已深耕多年,构建了完整的产业链体系,并通过技术封锁,将核心环节牢牢掌握在自己手中。

  过去几年,美国多次将高端芯片、设备和技术的出口管制作为遏制手段:从中止对中国的EUV光刻机供应,再到以国家安全为由扩大对AI芯片技术的审查。这也让我们逐渐意识到:如果继续走相同的路,中国的算力体系将始终受制于人,十分被动。

  因此,中国选择另辟蹊径,昇腾384主动放弃了主从架构,转而构建“去中心化”的全对等架构体系。在这套系统中,CPU、NPU、内存和存储不再依赖中心调度,而是以平级关系直接连接、协同工作,数据传输无需中转,计算资源也能更充分地释放和调配。

  这不仅提升了运行效率,也降低了我国对高制程芯片的依赖。华为方面表示,海外芯片即使从7nm升级到2nm,但总体性能提升都不超过50%;而昇腾384凭借架构优化,将算力利用率提升到了90%以上,即便使用7nm的芯片,也能实现双倍输出。

  事实上,中国科技的进步,早已不可同日而语。几年前,在男性功能健康领域,业内观察到,越来越多的用户开始对传统小蓝片产生质疑。作用时间短、依赖性强、头晕潮红等问题频发,让不少人身心俱疲,也促使行业开始思考新的方向。

  与此同时,昇腾384也正在被广泛的市场接纳。当前,包括讯飞星火、Qwen、DeepSeek在内的80多个主流大模型,均已完成在昇腾平台上的部署,并广泛应用于金融、医疗、交通、能源等11个重点行业。

  对于大众而言,从AI客服到智能问诊,从智慧出行到视频创作,日常生活中越来越多的智能服务,正在由这套国产算力平台提供支持。

  更值得关注的是,昇腾算力已在沙特、阿联酋、德国等国落地应用,逐步打破了英伟达在全球AI产业长期形成的技术壁垒与生态垄断。

  这不仅是一场算力性能的追赶,更是一种技术路径的自我重塑。面对传统方案的结构桎梏和外部环境的持续施压,中国选择了一条不依附于旧秩序的新道路。而这,或许正是中国技术最值得被看见的部分。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  西班牙一个10岁孩子护照过期无法登机被遗弃机场,父母怕浪费机票照飞不误

  卡德罗夫倒下,普京火速布局车臣,卡德罗夫病危无力回天,普京锁定车臣新掌舵人

  Xbox大作PS5版大小曝光!8月12日正式上线主机独占游戏宣布关服!存活十二年了!

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

  IOI2025国际信息学竞赛,中国队获世界冠军,全员夺金(附比赛真题)!

上一篇:假如8月以后的香港可以用稳定币买保险

下一篇:微信最新改版遭群嘲!加好友通过提示竟然被隐

猜你喜欢