2024英伟达GTC大会在整个科技史中的意义,被认为超过了当年史蒂夫·乔布斯的iPod和iPhone发布。在AI将永久改变人类的共识下,GTC 2024在广度、愿景、生态系统等方面都有着深远影响。无独有偶,市场咨询公司IDC在2024年4月和5月分别在深圳与北京举办的2024中国ICT市场趋势论坛,也将定义新的科技史里程碑,特别是云、算力和AI的里程碑。正如同IDC中国区总裁霍锦所言:AI已经改变了IT行业,未来的一切都会不同。

  自从2023年大模型与生成式AI在全球迅速出圈以来,几乎每天都在发生着刷新人们认识的新科技。IDC中国区总裁霍锦表示,因为AI转型的原因,科技圈里几乎每一天都在发生不一样的事情,现在每天在考虑的就是“下一个大事件”。以前,IDC经常讲“DX数字化转型”,但“数字化转型”这个词在日新月异的大模型与生成式AI面前似乎失去了魔力。从今年开始,IDC将“数字化转型”统一改为“下一个大事件(The Next Big Thing,TNBT)”。

  在大模型与生成式AI的世界中,云仍是关键性的转型力量。根据IDC的调研:2023年,41%的企业将云提供商视为其战略通用人工智能合作伙伴;2023年,60%的企业在通用人工智能基础设施上的支出是通过IaaS实现的;而SaaS交付模式使得消费者和企业能够在几个月而不是几年的时间内掌握通用人工智能。

  IDC中国区总裁霍锦强调:对于企业的AI策略来说,第一步就是选对云合作伙伴,而今年所有云公司都需要讲好AI的故事,云公司不仅是云合作伙伴,更是AI转型策略伙伴。

  那么,大模型与生成式AI将带来多大的市场机会呢?IDC的2022-2027全球生成式AI市场预测显示,2023年该市场为194亿美元、2024年将达403亿美元、2027年将达到1510亿美元;从细分项来看,2024年,生成式AI基础设施市场将达183亿美元,生成式AI服务市场将达110亿美元,生成式AI应用市场将达63亿美元,生成式AI模型、平台和AD&D(应用开发与部署)市场将达47亿美元。

  与此同时,就全球ICT市场来看,根据2024年2月的IDC全球(2024年2月),2023年到2024年,预测增长最多的ICT市场(为按固定汇率计算的增长,不包括电信支出和商业服务)仍是IaaS,将达到22%的增长;其次是软件,将达到12%的增长;第三是服务器与存储,将达到10%的增长;IT服务与手机排名第四,仅将达到4%的增长;PC和平板电脑仅达到3%的增长,网络和外设的增长均为负数。

  当前全球经济处于下行阶段,然而对于全球ICT市场来说,无论经济情况如何,都不会受到预算削减影响的ICT领域都有哪些?IDC指出分别是:安全、风险与合规;基础设施和IT运营优化计划/项目;AI和自动化措施;应用发展;工作场所解决方案。

  展望2025年到2026年:40%的新应用将实现智能化,开发人员将利用人工智能来增强现有应用并创造新的应用案例;60%的企业由于未能设计数据、AI模型和应用程序之间的连接,因此在GenAI(生成式AI)方面表现不佳;对GenAI的更大需求,将迫使市场导向型市场,重新改变目前由单一供应商主导的GenAI芯片市场,并推动终端用户系统价格下降25%;40%的服务项目将包括GenAI支持的交付,从而引发战略、变革和培训方面的人力交付服务的转变,使企业为无处不在的人工智能做好准备;75%的G2000公司将设立审查委员会,对道德和负责任的AI使用进行管理监督。

  从IDC的数据和分析来看,IaaS作为云计算的一种主要形式,仍处于增长态势,也是人工智能转型的关键基础设施,IaaS服务商还将是大模型和生成式AI的转型伙伴。同时根据IDC的一项用户调研,在训练大模型时首选私有化部署方式,这也为私有云IaaS带来了新的发展形态。在大模型的席卷下,云智融合的IaaS又是AI算力即服务的重要组成部分,正在孕育新的技术变革。

  自从大模型与生成式AI成为了“下一个大事件”,就给云与IT基础设施带来了巨大的颠覆。现在,ICT行业已经取得共识,大模型与生成式AI带动了现代计算体系,从以CPU为核心的通用计算,迈进了以GPU和加速芯片为核心的加速计算时代。

  加速计算已经引发了整个现代计算机体系的深刻变革,多位现代计算机体系的奠基性专家纷纷表示:随着摩尔定律接近极限、登纳德缩放定律失效,自20世纪60年代起源的现代计算机架构正面临着新一轮进化的黄金机遇,而与飞速发展的新硬件和高级语言相匹配的下一代编译器和编译语言,则带来了编译器的黄金时代。

  大模型与生成式AI所需要的AI基础设施,不仅仅引发了芯片、服务器等传统硬件的深刻变革与进化,也引发了传统数据中心的进一步质变。在大模型“大力出奇迹”的指导思想下,大算力、大算法加大数据正成为大模型主要的进化路线,而这对集群高速互联、大容量并发存储技术等提出了全新的要求。

  IDC认为值得关注的2024大模型发展趋势之一是新一代AI基础设施可能成为下一个“战场”。所谓上一个“战场”,当属大模型算法本身,经过2022年到2023的“百模大战”,IDC认为基础大模型的种类和数量已经趋于收敛,用户对于开源模型和商业化模型的选择各占半壁江山,大模型算法的正“卷”向产业与行业领域,例如金融、教育、工业、医疗等,但在这些细分领域的大模型仍处于探索阶段。

  随着大模型算法“战事”进入尾声,面向大模型的AI基础设施正在成为下一个“战场”。根据IDC对于企业大模型用户的调研,企业用户倾向于本地部署计算资源进行大模型训练占58%、模型微调占49%、推理34%,倾向于用公有云进行大模型训练占42%、模型微调占56%、推理42%,倾向于用私有云进行大模型训练占45%、模型微调占51%、推理45%,倾向于用数据中心进行进行大模型训练占36%、模型微调占46%、推理32%。

  综合来看,企业更愿意采用本地部署计算资源进行大模型的训练,采用公有云进行模型微调,采用私有云和数据中心进行推理。无论是哪一种部署方式,再结合IaaS的基础设施即服务模式,都带动了整个ICT基础设施向IaaS演进。

  那么,什么是新一代AI基础设施呢?实际上自2023年到2024年以来,陆续有多家机构提出了新一代AI基础设施的概念和定义,其中也包括智算中心。例如中国信息通信研究院云计算与大数据研究所、中国智能算力产业联盟、人工智能算力产业生态联盟等机构联合发布了《新一代人工智能基础设施》,提出新一代AI基础设施的定义——以大模型能力输出为核心平台,集成算力资源、数据服务和云服务,专门设计用于最大限度提升大模型和生成式AI应用的表现。而新一代AI基础设施,将降低大模型开发和应用门槛。

  工信部等六部委印发的《算力基础设施高质量发展行动计划》指出,智能计算中心是指通过使用大规模异构算力资源,包括通用算力(CPU)和智能算力(GPU、FPGA、ASIC 等),主要为人工智能应用(如人工智能深度学习模型开发、模型训练和模型推理等场景)提供所需算力、数据和算法的设施。智能计算中心涵盖设施、硬件、软件,并可提供从底层算力到顶层应用使能的全栈能力。

  IDC给出的新一代AI基础设施包括了六大方面:新架构、私有云、边缘计算、多云集成、高性能与深化合作伙伴关系。新架构指的是灵活调配CPU和GPU资源;私有云用于解决数据和运营的合规性问题,边缘计算将云服务扩展到远程,多云集成为促进管理和安全的工具,高性能是针对高性能计算和人工智能优化的计算与存储服务,深化合作伙伴是与行业用户、基础设施提供商和ISV搭建桥梁。IDC认为,AI基础设施将主要分为两大市场,分别是集中于大模型训练的公有云,以及于推理的边缘计算,

  在新一代AI基础设施的带动下,企业IT基础设施也将向下一代数字化基础设施进化,包括:AI就绪、自主操作、混合和多云以及边缘优化等四大特征,从而为企业提供可信、高弹性、可持续和更加安全的整体基础设施。

  在另一项IDC的调研中,面向AI工作负载的混合基础架构选择方面,选择共享公有云的占31%,选择专用非云计算IT基础设施的占26%,选择专用私有云的占22%,选择边缘IT基础设施的占21%。可以看出,专用非云计算IT基础设施包括了当下十分流行的各类智算中心,而共享公有云则纷纷推出大模型AI融合云产品,这两大类主要用于大模型的训练任务,而专用私有云与边缘IT基础设施则主要面向推理场景,当然也有用专用私有云进行模型训练任务,但其造价十分昂贵。

  IDC认为,新一代AI的基础设施包括了7大技术方向,分别是适用于特定用途的高级协处理器和加速器、下一代存储、高级超级融合系统、高性能GenAI网络结构、机密计算、可持续的数据中心技术和量子技术。

  新一代AI基础设施代表了下一代IaaS,下一代IaaS又可称为AI算力即服务,包括了公有云算力服务、智算中心、私有云和一体机等多种形态。

  2024年4月,根据一项IDC对于企业部署生成式AI的调研,在未来1年内,超过1/3的组织将投资GPU来微调和生成AI模型。也就是说,AI算力的建设将迎来新的高峰。然而大部分中国企业对于AI算力能力的了解并不深入,也就很难对后续的运维、运营服务以及所需要的能耗作全面前瞻的考量:市场需要建立算力建设、验收与运营的评估标准。相应的,整个算力产业链,也面临着重塑或重整。

  整个算力产业链分为上游的数据中心、中游的公共云服务厂商以及下游的云和算力服务,在整个算力向大模型AI转型的过程中,也引发了产业链上中下游形态与厂商的巨变。

  首先是上游的传统数据中心,需要升级或转型到智算中心,引入更多的GPU算力或国产加速算力,处理通用计算和加速计算的工作负载分配、通信互联以及网络架构升级问题,同时还要考虑像数据中心单个机柜的功率密度以及新的软件技术,例如液冷技术。

  其次是中游的通用算力即服务,即公共云服务通过虚拟化技术实现共享算力,现在已经很难满足大模型所需的独占式、长时间、大规模集群式应用,因此要求算力即服务供应商不断提供定制化或更优化的基础设施能力,实现从通用算力即服务到AI算力即服务的转变。

  第三是下游的云服务生态,以前IDC每半年都会发布云专业和管理服务,围绕云的建设、迁移、开发和应用等跟踪市场变化,未来也将更加关注围绕AI算力的建设、调度和运营以及模型或平台的部署、调优等服务生态的发展。

  在上游的传统数据中心领域,智算中心建设正在掀起一波热潮。智算中心的建设方主要为政府和企业。2013年底国家工信部和六个部委发布《算力基础设施高质量发展行动计划》明确提出我国智算算力建设目标——2023年为55EFlops,到2025年翻一倍达105EFlops。

  据不完全统计,截止到2024年4月,全国政府主导的智算中心已投产项目数量超过40个,基于半精度FP16算力测。


必一运动体育
上一篇:无线麦克风行业首个旗舰性能“10维标准”发布 定义 下一篇:ACT为骨库洛想用《鸣潮》定义“开放世界动作游戏”