为国产算力造“桥” 深企攻坚破解AI时代“算子之困”

AI视界(以下内容由AI生成,仅供参考)

  • 关键词
  • 简介
  • 重点
  • 分析
  • 猜你
    想问

深圳新闻网2026年2月2日讯(深圳特区报记者 马小晗)近日,某数据中心面临一项典型困境:新采购的国产AI算力设备在运行最新大模型时,实际效率不足硬件理论峰值的10%。超过九成的算力因底层“算子”缺失而被“封印”,昂贵的芯片面临沦为“算力废铁”的风险。这并非孤例,而是当前国产AI算力生态普遍存在的关键瓶颈。

几乎同时,在深圳星河WORLD园区,初创企业智子芯元从深创赛龙岗区预选赛中脱颖而出,其“高性能算子自动发现与优化”技术夺得头筹,为破解这一困境提供了全新思路。

瓶颈:生态壁垒与人才浪费

算子,是算法与底层硬件之间的“翻译官”,决定了数据如何流动与计算。英伟达凭借CUDA生态,积累了近600万开发者与完备算子库,构筑了巨大优势。相比之下,国产算力生态的活跃开发者仅数千人。

“没有完善的算子生态,国产芯片就像没有操作系统的手机。”智子芯元联合创始人丁添指出。传统算子开发是智力与劳动双密集的工程:一位顶尖算子工程师需精通软硬件、计算加速与优化,却常将大量时间耗费在反复调参测试中。

适配一个主流大模型,某国产芯片厂商曾需百人团队攻关三个月;每更新一代芯片,基础算子开发周期可长达两年。更严峻的是,大模型以“周”为单位迭代,芯片硬件每年快速更迭,传统“人海战术”动辄数月的开发周期,已难以跟上产业步伐。

破局:“AI+数学”驱动自动优化

智子芯元提出了“AI+数学”双轮驱动的解决方案。该系统将大模型的生成能力与运筹优化的推演能力结合,实现算子的自动发现与优化。

在2025年华为全联接大会上,其发布的ModelBridge工具展示了惊人效能:将Qwen3-14B大模型在国产芯片上从零适配的时间,从数天缩短至30分钟。经2小时自动优化后,推理吞吐量比社区最佳方案提升40%。

“算子优化本质是万亿级组合空间的数学搜索问题,复杂度远超人类穷举能力。”丁添解释,人类的优势在于经验灵感,AI的优势在于不知疲倦的搜索验证。

定位:连接算力“岛屿”与应用“海洋”

智子芯元将自身定位为国产算力生态的“连接器”。桥的一端,是华为昇腾、中科海光、寒武纪等多元发展但生态初建的国产算力芯片,如同亟待打通的“算力岛屿”;另一端,则是DeepSeek、Qwen等大模型及自动驾驶、生物医药等“快速迭代且极度饥渴”的AI应用“海洋”。

“目标是让开发者不再被硬件定义。”丁添描绘未来:开发者专注算法创新,底层适配由自动化工具完成。

根基:深圳沃土孕育“攻坚队”

智子芯元的团队与发展路径,体现了深圳产学研融合的强大孵化力。丁添是华为2012实验室前技术领军,核心团队包括前大模型公司CTO、头部芯片厂商算子专家,近半数研发成员拥有国际数学与计算机竞赛金牌背景。

“我们在探索数学与AI最本质的结合如何转化为产业生产力。”丁添表示。这种顶尖学术与产业需求的深度融合,正是深圳创新生态的典型特征。

深圳是全球硬件制造与芯片设计中心,但迈向“智算高地”必须补强软件生态短板。龙岗区将人工智能作为核心战略,提供了从研发空间到创新政策的全方位支持。智子芯元从港中大(深圳)的创新土壤萌芽,在龙岗的产业环境中成长,成为深圳“基础研究+技术攻关+成果转化”创新体系的生动案例。

丁添说,自己已从解决尖端问题的“国家队队员”,转变为解放底层效率的“造桥者”。这座无形的“桥”每延伸一段,国产AI算力生态的“天堑”就变通途一分。


编辑:谭悦

AI视界(以下内容由AI生成,仅供参考)

关键词

简介

重点

分析

猜你想问