官网动态

　近年来，随着ChatGPT的问世，大量AI大模型不断涌现，并由此延伸出了一系列大模型上层应用，也促进了通用人工智能产业蓬勃发展。　　ChatGPT等大模型训练，首先需要对海量数据进行并行处理；其次，大模型应用也带动了终端用户使用频率大幅提高，数据流量暴涨，从而对服务器的数据处理能力、可靠性及安全性等要求出现显著提升；再次，在大模型新的应用场景中，数据的质和量均发生显著变化，非结构化数据占比激增

九游体育大模型的“芯”跳——人工智能芯片发展概述

作者：小编　日期：2024-06-21 12:14:12　点击数：　

　　近年来，随着ChatGPT的问世，大量AI大模型不断涌现，并由此延伸出了一系列大模型上层应用，也促进了通用人工智能产业蓬勃发展。

　　ChatGPT等大模型训练，首先需要对海量数据进行并行处理；其次，大模型应用也带动了终端用户使用频率大幅提高，数据流量暴涨，从而对服务器的数据处理能力、可靠性及安全性等要求出现显著提升；再次，在大模型新的应用场景中，数据的质和量均发生显著变化，非结构化数据占比激增，数据规模也明显增长。

　　因此，基于传统CPU的服务器已无法满足算力需求，转而对基于AI芯片的服务器需求迅猛增长。据公开数据显示，2025年全球AI服务器市场规模预计将达到288亿美元。AI服务器的快速增长，大力拉动了对AI芯片需求的增长。从大模型的训练到推理，先进的人工智能芯片扮演着重要角色。近期，英伟达等GPU芯片企业股价飞涨，我国则出现了“一芯难求”的局面。因此，对底层AI芯片的开发研究变得至关重要。

　　面对灵活多变的大模型应用场景，以GPU、FPGA、ASIC等为代表的AI芯片被广泛应用于AI服务器中，与CPU组合来满足高吞吐量、高并发和并发互联的需求；传统CPU也从单核心向多核心转变，满足并发处理能力和速度提升的需要。

　　当前，我国AI芯片产业不断探索，初步形成了GPU、FPGA、ASIC、CPU芯片增强等AI芯片技术路线，但目前自主技术研发程度还较低、产品性能较低、产业链各环节协同度不高、芯片制造环节能力较弱等。与此同时，以美国为代表的发达国家一直对中国芯片产业采取限制措施，限制向中国企业出售最顶尖的芯片，进一步导致中国生产的AI芯片竞争力不足，人工智能领域高端芯片紧缺。

　　GPU提供了多核并行计算的基础结构，核心数多，可支撑大量数据的并行计算，拥有更高浮点运算能力。GPU非常适合AI模型构建，在计算训练过程中，GPU的并行计算高度适配神经网络；在推理过程中，多实例 GPU技术允许多个网络同时运行，从而优化计算资源的利用率。但GPU也存在管理控制能力弱、功耗高等缺点。目前，全球主流的GPU芯片生产厂商有英伟达和AMD。

　　英伟达的GPU以其高性能、高能效、支持光线追踪、深度学习超级采样等高级功能而闻名，这些功能可实现更逼真和身临其境的游戏体验，也可用于科学研究和机器学习。英伟达的GPU使用其专有的CUDA架构，该架构针对并行处理和AI进行了优化。目前主流的英伟达AI芯片包括A100和A800。AMD的GPU设计方法涉及其专有的RDNA架构，该架构针对性能和能效进行了优化。AMD拥有Radeon、FirePro等多种GPU产品，最新的基于RDNA 2架构的GPU 还支持光线追踪和FidelityFX等高级功能，可提高游戏的图像质量和性能。

　　中国的GPU产业规模相对较小，产业链也不完善。同时，由于国外厂商积累了大量的专利和技术，对我国GPU产业发展形成了相应的技术壁垒。为解决芯片卡脖子的技术难题，我国政府也加大了对GPU产业发展的支持和投入，并促进与其他产业的协同发展，提高了GPU产业的竞争力。目前，中国主要的GPU厂商有景嘉微、芯动科技、摩尔线程、沐曦科技、龙芯中科、芯瞳半导体等。

　　FPGA可以无限次编程，延时性较低，灵活性高，可以进行流水线并行计算，适用于研发阶段。它可以通过深度学习和分布式集群数据传输赋能大模型，多应用在通信、数据中心、工业互联网、人工智能、自动驾驶等领域。但FPGA开发难度大，只适合定点运算，价格比较高。FPGA的高门槛使得众多厂商望而兴叹，没有坚实的技术功底，很难形成有竞争力的产品。目前国内使用最多的还是Xilinx和Altera的FPGA产品。

　　Xilinx首创了FPGA这一创新性的技术，目前Xilinx已被AMD收购。由于Xilinx FPGA器件是只需要进行编程的标准部件，其产品已被广泛应用于数字电子应用技术中。Altera结合带有软件工具的可编程逻辑技术、知识产权(IP)和技术服务，在世界范围内为14000多个客户提供高质量的可编程解决方案，但Altera公司也已被英特尔收购。Altera将可编程逻辑的灵活性和更高级性能以集成化方式结合在一起，专为满足现今大范围的系统需求而开发设计。

　　九游体育

　　长期以来，FPGA市场都被美国多垄断，为了满足经济发展和国防需求，近年来我国也加大了对FPGA发展的支持。但由于知识产权、生产工艺和软件技术等多方面的限制，还难以满足国家安全的需要。国内FPGA厂商如紫光同创、复旦微电子、华微电子等，虽然积累了一定的技术和产业基础，在FPGA国产化方面有所突破，但产品还未能进入主流市场，与国际巨头还存在较大差距。

　　ASIC与通用集成电路相比功耗更低、性能提高、成本更低，并针对AI设定了特定架构，可进一步优化其性能与功耗，但缺点在于灵活性不高。基于ASIC在数据处理时的优势，国内外龙头企业纷纷布局，谷歌和英特尔作为头部厂商带动ASIC芯片的发展。

　　谷歌是ASIC芯片的先驱者，于2015年发布第一代TPU产品，大幅提升了AI推理的性能；2017年发布TPU v2，在芯片设计层面，进行大规模架构更新，使其同时具备AI推理和AI训练的能力；在2021年发布TPU v4，采用7nm工艺，峰值算力达275TFLOPS，性能表现全球领先。英特尔在2022年发布Gaudi 2 ASIC芯片。从架构来看，Gaudi架构拥有双计算引擎，可以实现MME和TPC并行计算，大幅提升计算效率；同时，其将RDMA技术应用于芯片互联，大幅提升AI集群的并行处理能力；从性能来看，Gaudi 2在模型训练的吞吐量上优于英伟达A100，性能表现优异。

　　我国ASIC芯片行业发展迅速，国内已有部分ASIC芯片产品技术已达到国际领先水平，如在BF16浮点算力方面，华为海思的昇腾910已超过谷歌的最新一代产品TPUv4。国内ASIC芯片企业主要有华为海思、阿里巴巴、百度、寒武纪、比特大陆、燧原科技等，随着企业技术不断升级，ASIC国产产品未来市场发展潜力巨大。

　　CPU作为计算机系统的运算和控制核心，是信息处理、程序运行的最终执行单元，它拥有大量的缓存和复杂的逻辑控制单元，具有强大的调度、管理、协调能力，应用范围广、开发方便灵活，擅长逻辑控制、串行的运算，在人工智能深度学习中可用于推理、预测。但计算量相对较小，且不擅长复杂算法运算和处理并行重复的操作。在芯片市场，最主流的CPU生产厂商是英特尔和AMD。

　　英特尔是全球最大的CPU厂商之一，专门从事微处理器和芯片组等核心硬件的研发和制造，是全球PC市场的领导者。英特尔公司的产品广泛应用于个人电脑、服务器、工业控制等领域。近年来，英特尔公司更是积极拓展人工智能、自动驾驶、5G等新兴市场。

　　AMD在计算机CPU厂商中，是唯一能与英特尔抗衡的对手。早期的AMD CPU主要是以价格和核心数目多的优势来吸引用户。近年来，AMD一直致力于研发新技术，如7纳米工艺和Zen 3架构。这些技术的引入使得AMD的CPU性能获得了质的飞跃，进一步增强了AMD在市场上的竞争力。

　　目前，中国的国产CPU正处于快速增长阶段。为了逆转芯片卡脖子的困境，我国也加强芯片自主研发。在国产CPU市场，已初步形成有三大完善的自主研发路线，分别为IP内核授权模式、指令集授权模式和授权自主研制指令集模式。

　　一是IP内核授权模式采用Intel或AMD提供的IP内核，通过自主设计、验证、排布、加工和封装，制成CPU，主要以上海兆芯、海光信息等为代表的企业使用该模式进行研发。这种模式主要依赖X86架构，采用这种模式是因为其生态迁移成本小、性能高，但存在自主化程度低，安全基础不牢靠问题。

　　二是指令集授权模式主要采用ARM架构，公司通过购买ARM的指令集授权、参加板块等方式来拥有ARM指令集授权的自主研发能力，代表企业有华为鲲鹏、天津飞腾。这种模式自主度较高，能够更容易地获得自主知识产权，安全基础相对牢靠，缺点是生态构建较为困难。

　　三是授权自主研制指令集模式，通过研发并拥有自主的指令集架构，能够实现更高程度的自主可控性。龙芯中科、申威科技依据此模式研发，其中申威科技已基本实现完全自主可控。该模式性能最强，自主可控度最高，但技术要求和成本相对较高，生态建设也相对困难。

　　这三种自主研发模式各有特点，各有侧重，但是还不足以完全实现CPU国产化，未来还需要进一步摸索实践。由此可见，我国CPU芯片领域正处于发展的过程中，为推动芯片发展，我国还需要进一步实现高端芯片国产化，同时对产业链进行升级改造，积极引进创新人才。预计未来几年，国产化CPU将取得显著进展，生产成本也将大幅降低，从而具有更强的市场竞争力。

　　GPU、CPU+FPGA、ASIC等芯片的出现已经对现有模型构成底层算力支撑，但面对未来潜在的算力指数增长，芯片的配置仍需做出改变。

　　未来，在短期内可使用Chiplet技术对底层芯片异构，加速各类应用算法落地。Chiplet异构技术不仅可以突破先进制程的封锁，并且可以大幅提升大型芯片的良率、降低设计的复杂程度和设计成本。AMD、英特尔、华为海思、龙芯中科等企业已将Chiplet技术应用于服务器芯片。

　　长期来看，需要打造存算一体的芯片，即在存储器中叠加计算能力，以新的高效运算架构进行二维和三维矩阵计算。存算一体打破“存储墙”限制，同时技术不断迭代演进，从查存计算、近存计算、存内计算到存内逻辑，最终满足了大模型计算精度要求。存算一体使AI服务器具有更大算力，提升效率的同时又降低了成本。

　　随着人工智能芯片产业飞速发展，芯片种类不断丰富，技术不断升级，AI芯片将成为人工智能产业发展坚实的基础，为人工智能大模型的研发提供强有力的支撑，并创造出更丰富、更先进的应用创新成果。

　　本文来源：本文摘自赛智产业研究院人工智能大模型研究团队赵紫玥（助理研究员）、邓道正（副院长）完成的研究报告，转载请标明出处。

　　为响应“数据二十条”的出台的重大意义，加快推荐数据要素市场的建设工作，赛智产业研究院围绕数据基础制度、数据要素产业研究、数据共享开放研究、数据交易规则研究、数据治理研究等开展研究分析，专门推出了以下数据咨询服务产品。

　　1、数据基础制度研究。围绕“数据二十条”，开展数据产权、流通交易、收益分配、安全治理等制度研究。

　　2、数据要素产业研究。围绕数据需求侧与供给侧，开展数据交易流通、数据资产、数据产业研究。

　　3、数据共享开放研究。开展数据基础设施、公共数据开放共享、公共数据授权运营、社会数据流通、政企数据融合研究。

　　4、数据交易规则研究。开展新型数据交易主体认证、新型数据交易标的产品、新型数据交易生态服务、数据跨境流动、新型数据交易安全保障等规则研究。

　　5、数据治理研究。围绕数据伦理、立法、战略、组织、流程、标准、技术、资产、质量、安全等能力域和数据编目、数据获取、数据归集、数据存储、数据清洗、数据流通、数据计算分析、数据应用服务等数据全生命周期开展研究。

　　北京赛智时代信息技术咨询有限公司(简称赛智时代)是国内知名的数字经济等新兴产业的咨询规划、大数据分析和产业生态体系建设的创新型公司。业务范围涵盖了智库咨询、数据服务、软件平台以及会议培训等方面。其中智库咨询服务依托于赛智产业研究院丰富的行业资源和高端专业化人才等竞争优势，面向政府、园区和企业，提供发展战略与规划、政策研究、招商引资策略研究、智慧城市规划、运营模式研究等现代咨询服务。研究领域涵盖大数据、人工智能、区块链、5G、战略性新兴产业等行业领域。

　　饮鹿网(Innov100)是赛智时代旗下的产业创新创投数据平台，覆盖新兴产业近20万创新型企业，为客户提供创业孵化、投融资等服务。

　　赛智区块链(北京)技术有限公司简称(赛智区块链)，是一家专注于企业级大数据区块链产品与应用服务的高科技企业。

九游体育大模型的“芯”跳——人工智能芯片发展概述(图1)

　　贵阳市大数据五大新领域（人工智能、量子信息、区块链、物联网、5G移动网络）产业规划

　　饮鹿网精准招商大数据云（平台）是赛智产业研究院联合饮鹿网开发的针对产业招商的最新产品。涵盖大数据、人工智能、区块链、5G、智慧城市、工业互联网等 30 多个领域，为招商部门、产业主管部门、园区管委会和产业地产提供大品牌招商、产业筛选招商、产业生态链招商、重点产品招商、资本注入式招商、区域一体化协同招商、原籍创业人才招商等招商数据分析服务。

　　政府提供新兴产业的产业链、企业、技术、投资等数据分析服务的平台，主要为各地发改部门、工信部门、产业分管领导提供产业仪表盘、产业链分析、产业地图、产业发展要素分析、产业政策、产业洞察等产业数据分析服务。

　　服务于创业投资领域，为母基金、头部投资机构、地方政府产业基金或引导基金提供绩效考核的专业化平台，主要提供投资数据（投融资仪表盘:与投资趋势洞察融合）、投资绩效分析（投资绩效分析、融资日报、投资机构百强、投资人百强）、项目分析（重点项目、产业链投资、细分图谱投资）、投资布局（投资地图）、投资要素分析、投资管理等服务。

上一篇 : 九游体育2023年中国人工智能芯片行业市场现状及发展前景分析
下一篇 : 九游体育人工智能芯片竞争加剧英伟达还“有戏”吗？