首页资讯正文

AI算力需求涌向模型推理，国产芯片站上竞技台了

体育正文 2025-05-31 21:21:34 165 0

AI算力需求涌向模型推理，国产芯片站上竞技台了

AI算力需求涌向模型推理，国产芯片站上竞技台了

刚刚结束(jiéshù)的COMPUTEX电脑(diànnǎo)展上，英伟达CEO黄仁勋笑着对听众说，“你（芯片）买得越多，赚得越多。”引来一阵笑声。这句话的背景是，全球科技厂商在AI热潮下继续重金投入建设数据中心(zhōngxīn)或算力中心。黄仁勋在演示文档上写着，英伟达正在驱动全球万亿美元(wànyìměiyuán)级别的企业(qǐyè)AI IT投资。数据中心建设热潮下，现在(xiànzài)看来，AI算力需求的变化与年初一些(yīxiē)业内人士(yènèirénshì)预计的不太一样。DeepSeek对训练算力资源的节约，并未让整体算力需求减少。不过(bùguò)，还有一个变化发生了，随着DeepSeek推动AI走向应用，用于推理的AI芯片(xīnpiàn)占比正在升高。市场研究机构IDC中(zhōng)国副总裁周震刚(zhōuzhèngāng)告诉第一财经记者，2024年中国数据中心加速卡中已有半数以上是推理卡，DeepSeek出现后，今年推理芯片占比预计还会(háihuì)增加。这种(zhèzhǒng)芯片(xīnpiàn)结构变化，可能会对AI芯片市场造成深远影响，特别是在中国市场。推理环节对AI芯片性能等的要求较(jiào)低，国产AI芯片也可以使用，在英伟达出口受到限制的情况下，可能促成国内AI芯片的组成(zǔchéng)发生变化。周震刚透露，去年国内数据中心加速卡市场中，国产算力占(zhàn)比大约三成(sānchéng)，预计今年上半年占比应该会超四成。第一财经记者了解到，这波(zhèbō)数据中心或算力(huòsuànlì)中心建设潮中，需求方来自高校、企业等，AI应用(yìngyòng)十分多元。而面向算力需求的变化，已有算力中心在计划调整芯片，使芯片组成更加多元、向模型推理倾斜。数据中心(shùjùzhōngxīn)或算力中心建设还在进行。IDC数据显示，中国加速计算服务器(fúwùqì)市场出货量2024年(nián)同比增长97.3%，预计2025年增长52.9%。在中国招标投标公共服务平台，第一财经记者以智算中心为(wèi)关键词搜索中标信息发现，截至今年5月26日，今年国内智算中心中标信息123条，是去年前5个月的2.2倍。这些信息围绕智算服务器(fúwùqì)设备采购、运维服务、电力(diànlì)模块采购、勘探、基建(jījiàn)供配电工程施工等。从(cóng)中标信息(xìnxī)(xìnxī)数量看，国内智算中心建设提速是持续的过程。2023年国内智算中心中标信息53条，2024年猛增至213条。2024年上半年中标信息71条，下半年增加至142条，显示当年(dāngnián)建设项目也在增多。记者了解到(dào)，一些企业和高校(gāoxiào)有了更多算力需求，部分高校自购算力卡，部分购买云算力或超算中心算力。香港科技大学冯诺依曼研究院(yánjiūyuàn)院长贾佳亚告诉第一财经(cáijīng)记者，学校此前购买了一批英伟达H800计算卡，香港只有香港科技大学有相对较多的H800，这是(shì)能将该研究院做成较大规模的背景。即便如此，有算力(suànlì)提供方(fāng)告诉记者，该校在训练大模型，需求比较大，自己的算力不够，也需要其他算力来源。近日华东理工大学(huádōnglǐgōngdàxué)则与腾讯云(yún)合作，推动(tuīdòng)AI与学科融合及科学研究降本增效等。该校(gāixiào)副校长王慧锋告诉记者，高校科研对AI算力的需求增长是必然，该校也在探索(tànsuǒ)AI+科学研究，例如有(yǒu)化学老师(lǎoshī)将AI算法用于锂电池催化设计，并将设计理念提炼出来做成智能体知识库，用于实践教学。目前学校(xuéxiào)采用混合云架构，部分算力本地化部署，另有大量计算放到云上，上云而不是完全自建机房的做法成本更优。王慧锋告诉记者，考虑到需求和数据安全等，目前高校采用私有和混合架构的模式是主流。去年12月，香港(xiānggǎng)规模(guīmó)最大的数码港人工智能超算中心(zhōngxīn)投入服务，香港为申请使用者提供资助。记者了解到，申请使用该超算中心首阶段算力的主体就包括大学和科研机构。数码港行政总裁郑松岩(zhèngsōngyán)告诉(gàosù)记者，该超算中心目前有1300PFLOPS算力(suànlì)，第二阶段规划算力是1700PFLOPS，今年10月(yuè)该超算中心算力将提升到3000PFLOPS。目前已审批通过10个申请，这些申请来自大学、科研机构、企业，用途包括学术研究、生物医疗、材料分析(fēnxī)、大模型应用等，到本月底，第一阶段的算力使用率将超95%，预计接下来(jiēxiàlái)的申请会越来越多。 “一些(yīxiē)大学在做教学相关项目，一些在研究可商业化的项目。有的大学在研究生物科学相关领域，也需要(xūyào)比较大的算力。目前不少大学是以开发项目为主(wéizhǔ)来申请，个别大学会捆绑几个小(xiǎo)项目一起申请，让学生做一些研究。现在有算力基本是先到先得。” 郑松岩表示。企业也需要算力。郑松岩告诉记者，企业应用处于(chǔyú)刚开始尝试的(de)阶段，可以感受到(dào)很多企业还没有(méiyǒu)下很大决心要完成整个机构的转型，或为此(wèicǐ)拟定非常严格的时间节点。“前段时间处于一种想(xiǎng)用AI，但很多企业还没启动的阶段。很多企业都想用AI来提高效率、降低成本，但AI要直接嵌入企业日常流程中，企业实际上缺乏相应人才配套。”郑松岩表示(biǎoshì)，香港的人工智能应用爆发期还没到来，随着业界对AI越来越熟悉，接下来预计应用会越来越多。 DeepSeek带来的算力需求(xūqiú)增长(zēngzhǎng)，是大模型(móxíng)推理对大模型训练的一场(yīchǎng)“胜利”。过去两年，大模型业界最受关注的一直是训练环节。但开源且性能出众的DeepSeek-R1面世后，更多人开始真正将大模型用起来，促使推理需求增长。这让一些适合推理的芯片用了起来。周震刚(zhōuzhèngāng)向(xiàng)记者表示，去年国内互联网公司(gōngsī)、电信运营商采购了大量国产(guóchǎn)(guóchǎn)算力卡，但去年采购方发现，国产算力资源不是很好出售。而随着今年上半年DeepSeek应用推开，尤其是国产算力适配DeepSeek后，此前它们采购的国产算力在(zài)今年第一季度已经被DeepSeek占有了。目前电信运营商已在建设新的大规模(dàguīmó)算力中心，包括基于国产算力的万卡集群。腾讯是国内最早接入DeepSeek的互联网厂商之一(zhīyī)。该公司在5月的业绩交流会上释放过推理需求增长的信号(xìnhào)。腾讯(téngxùn)管理层表示，腾讯有足够(zúgòu)的高端芯片来继续训练模型，公司看到对GPU更(gèng)大的需求是在推理侧。用户推理需求逐渐增长，推理token（词元）的需求比之前预计(yùjì)的更多，AI需求已经超过了GPU资源（所能提供的算力）。周震刚也发现，DeepSeek出现确实让算力需求改变(gǎibiàn)了，主要是改变了算力需求的结构(jiégòu)。他告诉记者，2024年，中国数据中心加速卡(kǎ)有57.6%是推理卡，33%是训练(xùnliàn)卡。而在DeepSeek出现后，一些小型公司的算力从训练转到推理。腾讯、百度这类平台接入DeepSeek也大大(dàdà)推动了推理芯片(xīnpiàn)的增长，因此预计2025年推理芯片占比还会进一步大幅增加。郑松岩告诉记者(jìzhě)，数码港(shùmǎgǎng)的人工智能超算中心也在考虑改变算力组成。 “一开始我们主要面向模型训练需求(xūqiú)，包括很多大学那(nà)时候要做模型训练，但实际上，近一年来模型变化很大。” 郑松岩告诉记者，此前很多机构在做基础(jīchǔ)大语言模型，但在DeepSeek出来后放弃了这一路线，转向使用DeepSeek等基础大模型，“我们认为未来做基础大模型的团队会(huì)逐渐减少(jiǎnshǎo)，转向以推理为主，人工智能超算中心(zhōngxīn)的第二阶段正在建构中，接下来做安装、配置、设计时会更多考虑这部分(zhèbùfèn)需求。” 郑松岩告诉记者，推理环节对芯片算力的(de)要求相对没那么大，因此，算力不及英伟达(wěidá)H100、H800的芯片都有可能引进。推理需求增长让国产(guóchǎn)算力站上竞技的舞台了。周震刚告诉记者，2022年(nián)和2023年，英伟达占中国数据中心加速卡市场(shìchǎng)的85%~90%，国产算力没有太大空间，但(dàn)在美国政策、国内市场变化等因素影响下，国产算力占比已有大幅提升。具体而言，2024年中国数据中心加速卡市场中，有65.2%是英伟达，34.6%是国产算力(suànlì)。“我们现在(xiànzài)看到，今年(jīnnián)上半年国产算力占比应该(yīnggāi)会超(huìchāo)四成，很可能在很短的时间内，国产算力会成为主流，占比超50%。这个比例在两年前是无法想象的。”周震刚表示。在(zài)大模型(móxíng)算力(suànlì)需求以(yǐ)训练为主的时候，之所以国产芯片还难以挑战英伟达的地位，既有英伟达芯片算力高、生态好、集群大等原因，也有训练难以兼容异构芯片的原因。周震刚向记者(jìzhě)解释，训练时难以同时用英伟达+国产芯片组成的资源池，只能将训练分成两部分，一部分用英伟达卡，一部分用国产卡，但这种训练的效率较低，因此(yīncǐ)大部分训练现在仍跑(pǎo)在英伟达卡上(shàng)(shàng)，只有少数AI厂商基于国产卡算力平台，更多厂商还是在用国产芯片做测试性工作，作为备用方案。但推理可以跑在国产芯片上，“可以根据需求，把面向某个应用的推理或面向某个区域用户的推理放到国产芯片上，可以这么分解。” “过去(guòqù)别人会问（国产芯片厂商），你跟(gēn)英(yīng)伟达H100相比优势在哪里、性价比如何、生态(shēngtài)能否兼容？现在这些问题已经没有太大影响了(le)。”有业界分析人士向记者形容，云厂商或AI厂商现在需要(xūyào)英伟达之外的(de)更多国产芯片方案。除了华为与运营商合作，其他国内芯片厂商也基本都有芯片出来了，云厂商也在推进自研。周震刚表示，今年一季度需求火热的DeepSeek一体机中，英伟达芯片占比还是较大，但已有不少基于寒武纪、沐曦等国产芯片。需求也反映在国产AI芯片厂商业绩上。此前陷于亏损的寒武纪，2024年第四季度开始盈利。今年第一季度，寒武纪营收(yíngshōu)11.11亿元(yìyuán)，接近去年全年营收，净利润3.55亿元，实现同比(tóngbǐ)扭亏。还有算力(suànlì)中心正在(zhèngzài)考虑国产芯片方案，郑松岩告诉记者，推理不(bù)需要用到太“高级”的芯片。数码港有一个人工智能实验室(shíyànshì)，正在测试不同的芯片，除了英伟达，还测试国产的华为、沐曦、壁仞、昆仑芯等(děng)。同时，实验室也在测试异构算力调度平台，希望能通过一个平台统一调度不同芯片算力。腾讯高管则在5月的(de)(de)业绩交流会上表示，公司会同时看进口芯片和国内市面上可用(kěyòng)的芯片，在某些情况下，其中一些芯片能做较小模型的推理。作为AI芯片巨头，英伟达(wěidá)近期感到紧张不是没有道理的。今年4月，英伟达公告称，美国政府已告知，对于H20芯片及达到H20内存带宽等的其他芯片，若(ruò)出口至中国等国家和地区需获得许可证。H20是英伟达针对中国市场推出(tuīchū)的“特供”版本(bǎnběn)。黄仁勋近日表态称，这种人工智能(réngōngzhìnéng)芯片出口管制是失败(shībài)的，“事实证明(shìshízhèngmíng)，最初制定人工智能扩散规则的那些基本假设存在(zài)根本性缺陷”。他(tā)表示，英伟达在中国市场的份额已从美国前总统(zǒngtǒng)拜登执政初期的95%降至目前的50%。中国人工智能市场规模可能在未来两到三年内达到约500亿美元，对一家美国公司来说，无法进入这一市场将是巨大的损失。英伟达还在尝试应对中国市场上的竞争(jìngzhēng)。近日有消息称，英伟达拟新推出一款面向(miànxiàng)中国市场的AI芯片，采用最新的Blackwell架构，定价低于H20，最早于今年6月量产，英伟达官方(guānfāng)尚未证实该(gāi)消息。 (本文来自第一财经(cáijīng))

标签

白茶清欢无别事 165 0

0

相关推荐

取消回复欢迎你发表评论:

评论列表

暂时没有评论

暂无评论，快抢沙发吧~