非小号app万字回顾首届中国AI算力大会!15+位大咖主会场演
以大模型、生成式AI为代表的新一轮人工智能浪潮的滚滚向前,催生出前所未有的AI算力需求,算力是数字经济时代的新质生产力,更是人工智能发展的基石。
2025年,以DeepSeek为代表的国产大模型强势突围,在全球引爆部署热潮和AI应用开发热潮,也给国内AI算力市场注入新的活力,推动AI推理算力需求暴涨,超大规模集群鳞次栉比,而需求的爆发也带来诸多挑战,酝酿新的行业变化。
为此,我们发起了一场聚焦前沿技术与产业趋势的夏日AI聚会——2025中国AI算力大会。
从国产AI算力的突围与崛起,到智算中心深层软硬件技术创新解决算力落地产业难题,近30位重量级嘉宾与会带来致辞、报告、演讲和对话,全方位解构DeepSeek引爆的AI算力变局,全场金句频频,各路大佬观点持续碰撞擦出火花,现场参会人数超过850人。
在会场外的展区,Alluxio、研惠通、惠普、白山云科技、中昊芯英、中科加禾、科华数据、行云集成电路等8家企业亮出了他们的最新技术和产品,展区人头攒动,交流热情氛围浓厚。
由智一科技旗下智猩猩与智东西共同发起主办、芯东西协办的首届AI算力大会,围绕AI算力产业变局与创新、AI推理算力、智算中心、智算集群异构混训、超节点等话题设置议程,主会场包括高峰论坛、AI推理算力专题论坛和智算中心专题论坛;分会场为闭门制,组织了智算集群异构混训技术研讨会、超节点技术研讨会。
▲联想集团Game of AI科普视频在大会展播:联想海神全液冷解决方案,革命性提升AI推理时代算力
智一科技联合创始人、CEO龚伦常在大会致辞环节宣布:中国AI算力大会正式成为“智领未来”北京人工智能系列品牌活动之一。
“智领未来”是北京市科委、中关村管委会打造的北京市人工智能领域的活动品牌。同样作为“智领未来”北京人工智能系列品牌活动之一的中国生成式AI大会已于今年4月1日-2日圆满举行。
龚伦常还预告了将于下半年举行的两场大型品牌活动:9月在上海举办第七届全球AI芯片峰会,11月在深圳举办2025中国具身智能机器人大会。
智算集群异构混训、超节点两场技术研讨会在分会场圆满举办。壁仞科技AI软件首席架构师丁云帆、中国移动研究院网络与IT技术研究所技术经理班有容、北京智源人工智能研究院AI框架研发负责人敖玉龙、上海人工智能实验室编译计算与国产化团队负责人裴芝林、商汤大装置技术产品总监刘叶枫在智算集群异构混训技术研讨会做了报告分享。
阿里云基础设施异构硬件和系统及解决方案资深总监卢晓伟、中国移动研究院网络与IT技术研究所技术经理王鹏、奇异摩尔首席网络架构专家叶栋、曦智科技联合创始人兼首席技术官孟怀宇围绕超节点进行了不同视角的报告分享。中信建投证券科技行业首席分析师阎贵成主持了超节点技术研讨会及圆桌Panel。
AI已成为数据中心增长的核心驱动力。大模型迭代拉动算力需求暴增,推动计算、存储、网络基础设施全面升级。在大模型训练与部署需求旺盛的背景下,如何更充分地利用闲置算力,国产AI芯片发展到了怎样的新阶段,有哪些优化大模型推理效果的创新技术?6位嘉宾分享了他们对产业最新风向的观察与探索。
1、信通院陈屹力:“算力荒”与“算力闲置”共存,算力互联互通、AI云成焦点
中国信息通信研究院云大所副总工程师陈屹力谈道,当下AI大规模应用促使智能算力需求激增,AI 云成为全球AI浪潮角逐的焦点。其中AI云基础设施需覆盖异构高效调度能力、一云多模能力、专家知识大脑等多方面。AI云平台推动AI应用的智能、便捷构建,提升国际影响力、助力生态繁荣。
随任务型智算应用兴起,对算力资源的定位、调度、部署效率提出更高要求。中国信通院联合产业各方探索构建算力互联网,积极推进算力标识、算力调度、传输协议、应用适配等方面技术研究,加快现有算力“局域网”间互联互通,逐步建立标准体系,形成算力互联网体系架构,核心解决算力“找调用”挑战,逐步形成具备智能感知、实时发现、随需获取的算力互联网。
摩尔线程副总裁王华引用了一些研究数据:2020至2025年间,大模型训练的算力需求提升近1000倍 ,驱动力来自参数规模与数据量双向增长。以DeepSeek-V3为例,其训练所需算力达10⁴级别,在万卡集群上可将训练时间压缩至13天内完成 。
为应对算力需求,摩尔线在内的全精度算力,有效支持混合精度训练,大幅提升训练效率;部署万卡集群,研发完整的软硬件栈,提供开箱即用的产品,快速满足大模型训练的算力需求;打造丰富的集群监控和诊断能力,针对大规模集群实现分钟级故障定位。
此外,摩尔线等数据类型的混合精度训练方案,开源Torch-MUSA、MT-MegatronLM与MT-TransformerEngine等大模型训练组件,已完成DeepSeek-V3的混合精度训练复现。在多个模型上的实验结果表明,其方案整体性能提升可达20%–30%,训练精度与业界主流保持一致。
▲摩尔线、中昊芯英杨龚轶凡:解读TPU架构创新设计,国产AI芯片如何抓住本土机遇
中昊芯英创始人、CEO杨龚轶凡谈道,AI专用芯片是AI Infra的必然发展趋势,TPU架构为AI大模型而生,采用多维度计算单元来优化数据复用,提高计算效率,并通过更激进的数据传输策略和更小的控制单元,给片上存储器和运算单元留下更大空间,其可扩展性也更适合超大规模计算。
魔形智能科技创始人、CEO徐凌杰幽默开场:“过去十年,中国最值钱的是房地产行业。未来最值钱的,可能还是房地产,只不过住的不是人,而是机器。”
中国科学院计算技术研究所研究员、中科加禾创始人崔慧敏谈道,大模型推理私有化部署需求大涨,但面临硬件繁多、需求多元、多模部署等多重挑战。
中科加禾围绕编译优化构建大模型推理的引擎和软件栈,积累了大量实践案例:在推理引擎中实施深度显存优化,有效提高显存利用率;在大规模推理中实现多维并行策略,有效利用计算、访存、通信资源;基于多项联合优化,推理技术在某互联网厂商合作中将QPS提升50%以上,并在昇腾910B平台私有化部署场景下有效支持128K长上下文。
趋境科技技术负责人陈祥麟分享了大模型推理的技术创新。他认为大模型私有化推理架构将从传统的以GPU为中心转向全系统异构协同,需要充分提升算力利用率。
以《国产AI算力的突围与崛起》为主题的高端对话,由智一科技联合创始人、智车芯产媒矩阵总编辑张国仁主持,中昊芯英创始人兼CEO杨龚轶凡,魔形智能科技创始人、CEO徐凌杰,中科加禾联合创始人兼CTO陈龙三位嘉宾进行分享。
面对国产算力在全球发展中的地位,陈龙谈道,国内厂商已掌握算力底层技术,但在PyTorch等主流训练框架适配方面仍处于跟随、陪跑阶段。
对于国产算力的市场化,徐凌杰判断,政府、资源导向型的现状未来几年不会有很大改变,芯片晶圆、制程以及芯片创企在国产生态中的成长,都需要政府扶持。芯片公司的机会是通过更强互联、集群打造差异化,找到商业化落脚点。
杨龚轶凡坚信专用芯片是未来的发展方向,在通用性需求大幅降低的情况下,可以抛弃部分通用性,增加芯片核心的性能和性价比。越专越好,是在满足一定可控性和变化下的结果。
谈到全球算力产业的产业格局,陈龙认为,虽然国内巨头有积累优势,但产业规模足够大,且需求多元化,将来企业将百花齐放。
如今中国算力规模已在全球排名第二,被预测有望影响全球AI 竞赛格局。陈龙认为,AI算力市场规模和国家GDP发展成正比关系,当国家GDP反超或许是国产算力格局更进一步的机会。杨龚轶凡提到投入产出比,目前美国和中国算力开销差10倍,当投入量逐步赶上才会有变化。徐凌杰认为未来当AI赋能千行百业,算力真正变成生产力时,就是一个巨大的机会。
下午场火热继续,在AI推理算力专题论坛和智算中心专题论坛中,来自行云集成电路、安谋科技、实在智能、白山云科技、Alluxio、浩云长盛集团、上海矩向科技、趋动科技的8位嘉宾带来了精彩演讲。
行云联合创始人、CTO余洪敏谈道,高质量大模型最核心的需求就是极其变态的内存需求,既要带宽,又要容量。推理芯片核心瓶颈有:显存容量,价格高昂,只有通过软硬件协同创新才能解决。
安谋科技产品总监鲍敏祺观察到,端侧设备正逐步承担更多AI计算任务,端侧AI模型在算法迭代、上下文长度扩展和模型理解力提升等方面进展迅速。
3、实在智能欧阳小刚:Agent端侧性能超GPT-4o 10%,一体机30分钟开箱部署
实在智能合伙人、核心算法负责人欧阳小刚提到,算力需求与场景落地的双向倒逼,正推动智能体技术端侧的探索革新。
其公司行业首发的通用智能体“实在Agent”,专注跨系统、链接各类软件的办公流程自动化。其自研的实在TARS大模型和TARS-VL大模型分别在垂域任务理解性能超越GPT-4o达10个百分点,GUI多模态理解能力领先3%,而通用能力几乎无损;同时,该模型支持私有化部署,深度融合RPA与智能体工作流,实现浏览器、桌面应用、移动端的无缝操作,支持一键流程编辑和智能体共享,降低30%重复开发成本。
白山云科技智算产品研发负责人李金锋谈到,AI推理面临网络时延与成本挑战,对边缘计算的需求日益增长。当前的云边端架构依然适用:中心云集中计算,追求性能极致优化;边缘云在靠近用户处提供算力,作为重要补充,现可处理百亿参数内大模型推理,显著降低时延;终端算力则在保障数据隐私场景中发挥作用。
Alluxio首席架构师傅正佳谈道,AI 数据全链路各环节面临的不同难题,以及环节间数据交互导致的资源浪费与效率低下,其本质都是数据湖困境的体现。
浩云长盛集团首席增长官(CGO)赵亮称,随着智算时代的到来,数据中心的算力密度不断提升,同时,大模型推理和训推一体的需求也在增长。
上海矩向科技创始人兼CEO黄朝波指出,当前智算中心深陷无序建设、架构封闭、远离业务场景三重困局,导致区域算力闲置、资源利用率不足。
8、趋动科技张增金:通用行业GPU利用率不足30%,软件定义AI算力成必然趋势
趋动科技技术总监张增金指出,尽管生成式AI算力市场热度高涨,但非生成式AI的规模仍是其两倍,从运营层面来看,蕴藏着巨大的收入潜力(IDC 2025)。在国内众多智算场景中,GPU平均利用率低至5%左右,主要原因在于异构资源分配方式粗放、调度机制缺失以及管理效率低下等问题。
在中美博弈的背景下,国产大模型们强势突围,带动了国内AI算力需求的持续增长,算力需求发生结构性变化、推理算力需求增速远超预期,中国AI算力产业不断迎来新的机遇和挑战,诸多优秀企业通过技术创新破解算力难题,加速AI的产业化落地。
猜你喜欢
- 06-05非小号中外专家共话“科学突破
- 05-13非小号区块链:重塑信任引领数
- 05-22非小号佳华科技等在北京成立新
- 06-30非小号21评论丨香港稳定币条例更
- 03-08非小号Matrixport:比特币ETF资金流
- 06-04非小号利好突袭 港股数字货币概
- 03-10非小号zkLend 在加密货币盗窃案中
- 12-13非小号比特币历史新高!超91万人
- 05-30非小号斯坦福毕业生成立2800万美