现实主义理想者的回答
东数西算工程,简单来说是指通过构建新型算力网络体系,将东部算力需求有序引导到西部,促进东西部协同联动。
东数西算工程在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。
说实话,相比“北上广深”这些一线城市,芜湖这种强二线城市讨论度一直不太高。
我估计知乎很多人对芜湖的印象跟蚌埠差不多,都是主要靠网络流行梗。
但在东数西算战略规划中,长三角枢纽的芜湖集群是十大数据中心集群之一。
在AI算力逐步崛起的时代,这波确实可以说是“芜湖起飞”
关于芜湖的算力枢纽建设,估计很多人还是会有疑惑,这篇回答将一一解答。
为什么要建设云化算力集群?
近期人工智能发展如火如荼,AI大模型的浪潮更是席卷各行各业。
AI时代流传着一句话:算力即权力。
算力的多寡,直接影响大模型的训练和应用效率。
中国AI与大模型的发展,首先受到算力基础的制约,国内算力的不足直接影响了大模型的训练和应用效率。
尤其是近期某些国家加强了AI计算卡等方面的技术封锁,国内AI算力稀缺的问题自然更加突出。
如果说一般用户或者普通研究者还能买块消费级显卡凑合用,那么企业对人工智能算力的需求恐怕不是几块GPU就能解决问题。
但让所有企业用户——特别是中小企业——都构建自己的算力体系,技术难度和成本都太高,明显不现实。
而且,大量中小企业重复建设也不利于发挥规模效应。
因此,构建规模化的智算中心和数据中心,可以说是行业发展的必然趋势。
为什么在名不见经传的芜湖设立算力枢纽?
这方面其实涉及到很多,我就提一点吧:
用马太效应对抗马太效应,扶持一批有产业升级潜力的强二线城市与一线城市竞争,已经是大势所趋。
而产业升级需要各方面要素配合,全国范围内也仅有少数强二线城市比较有把握。
芜湖与长三角经济带关系紧密,交通发达,建设用地充裕,构建算力中心有区位优势。
尤其是可再生能源及水资源相对丰富,这意味着供电稳定且成本低廉,可以为数据中心及上下游企业提供充足的能源保障。
目前芜湖集群算力计划规模占全省算力规模90%,预计能够承接长三角和中部地区三分之一甚至更多的算力需求。
而国家级“东数西算”的战略规划中,到2024年底前芜湖智算规模要达到10000P!
这不叫起飞?什么叫起飞?
为什么选择华为云?
这方面能说的就更多了,用一句话总结的话:
华为云为解决算力紧缺问题提供了全套方案,相关配套服务更是一站式解决,非常方便下游用户上手。
如此一来,华为云不仅能为长三角乃至全国的AI企业提供巨量AI算力支持,更能为下游应用节省大量时间成本和沟通成本。
尤其是在某国加大封锁力度的大背景下,能够迅速启用的芜湖数据中心更显得尤为重要。
事实上,华为云在全国建设的智算中心远不止芜湖一个。
具体而言,我认为华为云在构建自主AI算力集群方面至少有三方面优势:
1、华为云有昇腾AI计算卡等全栈自主解决方案,6A级算力即开即用
一谈起自主可控,知乎某些理中客可能就要强调“拥抱全球”、“不能闭门造车”云云。
我现在也懒得讲大道理,我就问一个最简单的问题:
就算你要买海外巨头的旗舰级AI计算卡,现在还能买得到吗?
某些国家强行以行政命令阻断市场,结果既伤害本国巨头苦心栽培多年的CUDA生态,更是白白把市场让给海思和昇腾。
下游大量企业已经全面动员起来,与海思驻场人员通力协作,完成昇腾生态下大量算子的重构;
BATJ等等互联网巨头,已经全面加速基于昇腾计算卡的推理和训练。
昇腾计算卡持续热销,连手机圈内粉丝一贯跟华为不对付的友商,也向华为下了大单。
甚至就连AI计算卡领域的全球龙头,都在自家的财报和沟通会中将华为海思列为“最强竞争对手”。
这还不算,华为云不仅有昇腾计算卡,更有全栈自研的系统底座,可以为下游客户提供近乎“无微不至”的全套服务。
垂直行业企业基础大模型研发能力相对欠缺?
没关系,华为云提供了自家的盘古大模型:
华为云的盘古大模型自始至终都非常重视B端的需求,气象大模型还拿到过《Nature》顶刊。
而且盘古大模型采用“5+N+X”三层架构和分层解耦设计,可以快速适配各个不同行业多种多样的需求。
新兴企业缺乏完善的软件工程套件?
没关系,华为云提供了一站式大模型工程套件
所谓“一站式工程套件”,包括数据工程、模型开发和应用开发三大套件。
加上华为云上丰沛的昇腾AI算力,完成千亿参数的AI大模型开发的时间,(理想状态下)从过去的5个月缩短到现在1个月,速度足足提升5倍。
目前AI竞赛之激烈大家有目共睹,开发效率的重要性大家懂的都懂。
创业企业GPU训练的时候显存不够?
没关系,华为云有业界独家的AI-Native Storage,能用内存存储实现PB级HBM扩展,不用堆卡,再大的稠密模型(万亿级参数级别),都没问题。
大带宽内存能力、大并发缓存能力、大容量知识湖存储能力、大容量知识湖存储能力……华为云的AI-Native Storage有大量业界独家技术。
别的不多介绍,我就提一点吧:
数码圈很多人都知道,华为旗舰手机从前些年开始就上了自家的SFS超级闪存,极大强化了读写速度。
别忘了华为可是B端起家,消费端恐怕尚属小试牛刀。
按照权威咨询机构Gartner发布的2023年Q3外部存储市场报告,在全闪存(SSA)领域华为市场份额全球第一。
而华为推出的OceanStor Pacific 9950高密高性能全闪产品,在HPC存储领域最权威榜单IO500中成功登顶,刷新了世界记录15倍。
要知道,高性能计算HPC领域,可是被不少人称作计算机工程领域的王冠明珠。
能在这个榜单上大杀四方,单从存储领域的技术储备,华为就是一个很吓人的存在。
总之,智算一张网与昇腾云的结合,不仅能保障底层算力的安全性,也为国内AI行业的快速发展提供强有力的支撑。
2、高可用、高安全、业界最低PUE,华为云AI技术水平业界领先
简单来说,采用华为云的芜湖数据中心可靠性高、安全性好,能效也非常优秀。
可靠性方面,芜湖数据中心配备500kV特高电压等级双路双源供电制冷冗余设计,同时还叠加了应急接口,为数据中心提供多重保障。
而且华为云还采用了数字化运维软件,全链路可视化管理,能够主动识别风险,快速定界并恢复。
业内平均的可用性SLO大约是99.982%,而华为云最高能做到99.999% 。
安全方面,华为云芜湖中心有园区级、楼宇级、机房级、机柜级共计4层物理防护,满足Swift金融最高安全等级,保障全生命周期数据安全。
能效方面,华为云通过产业链全栈自研的垂直整合,深度优化各个环节,达成了业界超低能耗。
芜湖数据中心还实现了直通风+液冷的协同应用,堪称业界首创。
而且华为云软件有实时智能调节,通过AI智能调优避免过制冷,积累了大量算法。
通过锂电池储能+市区电力,实现电力削峰填谷,机柜电力利用率从业界平均60%提高到最高达90%
直通风+液冷+云软件实时智能调节,最终实现液冷数据中心PUE1.1,堪称业界最低!
大家可别忘了,这里是芜湖,年平均气温比贵安、乌兰察布是要高不少的。
能做到这种PUE,华为在数据中心上的技术能力可见一斑。
3、全套开发平台高效易用,目前已经有包括知乎在内大量成熟案例落地
华为云近些年发展速度很快,市场占有率也是业界前列,积累了大量成熟案例。
举个最简单的例子,你我如今正在使用知乎平台进行讨论。
知乎的AI大模型“知海图”,主体应该是自己做的,但背后的算力就有跟华为云合作。
还有美图自研的AI视觉大模型MiracleVision,也是跟华为云合作部署。
其他还有网易伏羲、HKGAI、合合信息等等公司的AI业务,都有跟华为云合作。
作为电动汽车坚定支持者,我尤其想着重提一下华为云在汽车领域的建树:
Top30车企中90%采购,国内市场占有率第一,全球超5000万辆车使用相关服务……华为云在汽车圈已经结下累累硕果。
更进一步说,华为ADS智驾的领先如今已经是深入人心,但很少有人关注到幕后功臣。
余承东发布会上多次提到华为用于训练智驾的算力极其庞大(比如最新的数据是高达3.5E Flops),背后就是华为云在默默支撑。
可以说,正是华为云持续训练和迭代,有力支撑了华为ADS智驾持续领先业界。
另外,华为云在汽车领域的作用也不仅是智驾。
目前华为云芜湖中心已经在长三角构建10ms时延圈,最低时延甚至能达到2ms。
更低的时延,意味着云端DMS能更快检查到电池异常,智能电动车发生事故或故障也能更快反馈。
同时,更低时延也意味着5G车联网体验更上一层楼。
我个人对VTX商业模式有一定疑虑,但技术层面低时延对于VTX的指挥调度本身肯定是好事。
以上还仅仅只是智驾、车联网、互联网平台的部分案例,事实上华为云已经落地的案例还有很多。
可以看到,华为云芜湖中心的建设,对地区乃至国家经济、社会、生活等各方面都有深刻的影响和助益。
最后做个总结:
可以看到,历经多年发展的华为云,如今已经为AI大模型开发提供了全套完善的解决方案。
不论是训练还是推理,不论国内企业还是海外巨头,在开发AI业务时都可以考虑跟华为云合作。
事实上,华为云已经为国内AI业务开发提供了大量支持,知乎、网易、美团等等企业都有成熟案例。
华为云芜湖数据中心与贵安、乌兰察布一起构成的算力“铁三角”,是华为最高规格、最大规模、最新技术的数据中心。
芜湖数据中心的建设,不仅能承载长三角乃至全国的算力需求,更标志着中国在自主AI算力领域迈出了坚实的一步。
宏观一点说,芜湖数据中心为长三角乃至全国的AI研发提供算力支持,不仅能够加速AI产业的发展,更是为"东数西算"的宏伟蓝图贡献重要力量。
所以我坚信,未来芜湖、长三角乃至全国的产业升级,都能如网络流行语那样“芜湖起飞”!