深圳新闻网

原创新闻

联想发布《AI大模型算力解决方案手册》,助力企业突破技术瓶颈

2025-07-24 18:26 来源:深圳新闻网

人工智能朗读:

深圳新闻网2025年7月24日讯(记者 张俊达)在AI大模型以70%年增速重塑千行百业的当下,企业面临算力效能与落地成本的双重挑战。近日,联想发布《AI大模型算力解决方案手册》,凭借30年算力基础设施积淀,推出全栈式AI解决方案,助力企业突破技术瓶颈,实现AI从“可用”到“好用”的跨越,推动智能应用在各行业的规模化落地。

AI大模型落地:从技术普惠到产业赋能的关键挑战

大模型下半场,推动AI普惠成为行业共识。DeepSeek等技术通过全球化生态布局、开放API与工具等方式,降低成本和技术门槛,如以较低成本训练出V3版本并免费开放模型结构和权重,实现技术和价格双重普惠。然而,企业在实际落地中仍面临多重挑战。

算存网协同与平台转型方面,企业需设计IB网络与RDMA网络解决拥塞带宽问题,统一部署平台构建异构GPU卡管理平台,推动智能体平台向“开放协同”转型。部署与算力层面,DeepSeek模型在通用基础架构平台快速部署门槛高,国产化环境中需性能调优,还需提升单节点算力效率和集群性能。此外,一体机性能选型需从用户和技术维度综合考量,平衡输入输出能力、并发访问量及未来微调的算力需求。

联想全栈技术体系:九大优势破解智算效率难题

联想DeepSeek AI解决方案以多层协同架构为基石,构建从核心管理层、AI算力层到网络连接层、数据存储层的完整体系。核心管理层如“数字大脑”统一管控系统,AI算力层提供强大计算与推理能力,网络连接层确保数据高效传输,数据存储层保障数据安全可靠。

在此基础上,联想打造全栈技术体系,通过算力层、平台层、开发层与管理层的垂直整合,实现异构算力高效调度,提供标准化工具链和开放生态。其万全异构智算平台3.0版本推出九大差异化技术,突破智算效率极限。多维智能算力匹配技术构建知识库,自动规划最佳算法与集群配置;GPU内核态虚拟化技术提升vGPU利用率至95%;集合通信算法库技术提升千卡规模集群网络通信效率超10%;AI高效断点续训技术实现分钟级断点续训;AI与HPC异构集群调度技术破局算力孤岛。

此外,AI推理加速算法集提升推理性能5至10倍,AI编译优化器降低训练和推理成本15%以上,AI训推慢节点故障预测与自愈系统实现万卡十分钟级故障自愈,专家并行通信算法降低推理延迟3倍以上。同时,联想推出问天WA7880a G3和WA5480 G5两款创新服务器,前者支持OAM 2.0模组,后者为训推一体设计,均具备高效散热和灵活扩展能力。

场景化方案与产品矩阵:加速AI从技术到价值转化

联想基于企业级AI需求,推出从集群部署到轻量化一体机的全周期方案矩阵。集群部署方案优化计算、存储、网络和软件层,满足高性能计算与复杂模型训练需求;一体机方案深度优化异构智算平台,预装DeepSeek大模型,支持可视化对话、Prompt定制等功能,提供“开箱即用”的本地化AI解决方案。

联想万全AI一体机作为核心产品,通过调度层、算子层、推理引擎层三层深度调优,显著提升硬件资源利用率,单机极限吞吐量突破12000 tokens/秒,综合性能提升5至10倍。其具备深度调优、验证可靠、软硬协同、友好交互、快速交付、极致性价比等亮点,支持代码生成、问办助手、财务报表等多场景应用,适配不同用户规模与算力芯片的产品矩阵,满足多样化AI开发与应用需求。

行业实践与未来蓝图:智算赋能千行百业

在制造领域,联想为联宝科技定制WA7785a G3集群等方案,攻克满血版DeepSeek部署难题,实现生产流程优化效率提升和运营成本降低,为企业自研制造行业大模型提供底座。在金融领域,为某知名金融企业提供NV解决方案,通过万全平台提升GPU利用率,简化运维流程,提升资源利用率及模型推理效率。

面向未来,联想勾勒AI生态全景蓝图。“算法-算力”协同方面,与DeepSeek深化合作,目标实现推理能耗降30%,模型参数量减少50%以上,硬件资源利用率提升40%。绿色智算领域,推广液冷技术,将数据中心PUE降低至1.2以下,散热能耗减少50%,动态功耗管理系统降低30%运行能耗。生态共建方面,深化开源社区贡献,推动国产AI标准体系建设,打造开放共赢新生态。

从技术突破到场景落地,再到生态构建,联想以全栈AI解决方案助力企业在智能化转型浪潮中抢占先机,推动AI技术从“可用”迈向“普惠”,为数字经济高质量发展注入持续动力。

(本文图片由受访单位提供)

[编辑:田志强 周浩桦] [责任编辑:单铭捷]