官网动态
特斯拉的自动驾驶FSD芯片中,神经网络加速器(NPU, Neural Processing Unit)也成为面积最大的组件 —— 从分类上,特斯拉FSD芯片属于AI芯片。 带着这个疑问,小编请教了相关专家、进行了大量调研,才得到一个粗浅的理解:所谓AI芯片就是在传统芯片基础上,针对AI算法进行硬件设计优化的专用芯片,是更加强调「软硬结合」的芯片。 童年史蒂夫·乔布斯在参观农场时,看到小牛犊
特斯拉的自动驾驶FSD芯片中,神经网络加速器(NPU, Neural Processing Unit)也成为面积最大的组件 —— 从分类上,特斯拉FSD芯片属于AI芯片。
带着这个疑问,小编请教了相关专家、进行了大量调研,才得到一个粗浅的理解:所谓AI芯片就是在传统芯片基础上,针对AI算法进行硬件设计优化的专用芯片,是更加强调「软硬结合」的芯片。
童年史蒂夫·乔布斯在参观农场时,看到小牛犊在出生几分钟后就能挣扎开始走路,这让他大为震憾:「这不是通过学习获得的技能,而是与生俱来的」、「就像是设计好的,身体与大脑在出生后立刻协同作用」。
几十年后,在 2007年第一代iPhone发布会上,乔布斯以图灵奖得主、图形用户界面发明人艾伦·凯(Alan Kay)的一句话强调了「软硬结合」思想的重要性:「真正认真对待软件的人应该做自己的硬件」。
2020年底苹果推出的M1芯片之所以能同时实现狂暴性能与超低功耗,统一内存架构设计和软硬件协同优化功不可没,这正是「软硬结合」思想的集中体现。
那么,芯片的「软硬结合」到底是指什么?通俗地讲,就是芯片计算架构要针对算法模型的特点来设计,算法模型与编译要根据芯片计算架构进行优化,以实现高性能、低功耗、低延时的设计目标。
剃头挑子一头热的感情,常常走不到最后。相反,你心中有我,我心中有你,这才是和谐的恋人关系。芯片设计也是如此,软中有硬,硬中有软,「软硬结合」协同优化的芯片,综合性能肯定强于那些「单方面苦苦付出」的芯片。
「软硬结合」也并不是一个新概念。事实上,在浮点型运算量巨大的图像处理领域,通用型CPU心有余而力不足,而针对这种算法特点「软硬结合」协同设计的GPU,就能实现超高的性能。
图像处理领域的「软硬结合」 上:CPU串行运算、速度慢 下:GPU并行计算、速度快
有句俗话叫「大力出奇迹」—— 如果我偏不信邪,软件上把算法模型优化到极高的水平,是不是可以超越「软硬结合」的硬件呢?
您别说,还真有人这么干过。在AI芯片尚未诞生的2012年,使用GPU做深度学习计算比CPU快40倍。谷歌大脑项目使用CPU做深度学习算法,它集结了世界上最优秀的算法工程师,拼尽全力也只能将40倍的差距缩小到6倍。但这已经是强弩之末了,实在扛不住,谷歌也开始大规模使用GPU。
后来,谷歌还针对卷积神经网络CNN(Convolutional Neural Networks)存在大量矩阵“乘积累加”(MAC,Multiply Accumulate)运算的计算特点,将GPU的通用运算单元改成MAC专用运算单元,并于2016年通过「软硬结合」设计高度定制化的AI推理芯片TPU,最终以强劲算力支撑AlphaGo击败世界围棋冠军李世石。
这些在芯片层面「软硬结合」的前沿性技术探索,似乎没中国什么事吗?事实并非如此。这里讲一个小插曲,国内有一家AI芯片公司叫地平线年创立之初就提出研发AI专用芯片,比谷歌正式披露TPU早了近一年。
当前,AI计算需求也已经从最早的云端数据中心扩展到了自动驾驶领域,特别是特斯拉已经开始使用自有高度定制化的AI推理芯片FSD。截至2019年,全世界已经约有100家组织推出或正在研发AI推理芯片,这个数字到今天已经变得更大。
近年来,AI算法对芯片算力的要求急剧增长,过去7年间提升了7个数量级。特别是在智能驾驶,从L1、L2所需要的个位数TOPS,急剧上涨到为L4预埋的1000TOPS,短短3年提升了3个数量级。
传统摩尔定律依靠「提高晶体管数量」、「增加核心数」两种武器来提升CPU算力。
从1990年到2005年的单核时代,主频就是CPU算力的代名词;2005年到2020年的多核时代,主频的增长遇到瓶颈,CPU又通过增加核心数,以多核架构来提升整体系统的吞吐量。由图可见,受物理制程的限制,CPU算力的增长速度在迅速放缓。
面临旧摩尔定律已经无法支撑今日AI计算快速增长的算力需求,2020年6月科学杂志MIT学者论文提出了第三种武器「软硬结合」 —— 通过软件、算法、硬件架构的联合优化,来开启「新摩尔时代」。
如果说「软硬结合」是CPU延续摩尔定律的「续命武器」,那人工智能专用AI芯片可以说自诞生之日就刻下了「软硬结合」的基因 —— CPU是通用芯片,GPU是做通用运算的并行计算芯片,而AI芯片则是针对卷积神经网络CNN计算特点设计的并行计算芯片,能够低延迟、高效率地执行AI算法,擅长应对图像识别、语音识别、自然语言处理等任务。
从下面三张形象的GIF动画可以看出,针对人工智能常用的卷积神经网络CNN计算特点,从CPU到GPU再到TPU,「软硬结合」水平依次上升,运算性能提升显著。
卷积神经网络CNN运算的「软硬结合」 上:CPU 中:GPU 下:TPU(AI芯片)
针对目标场景的差异,逐渐细分出不同的AI专用加速器,以达到更深的「软硬结合」程度。比如,英伟达、谷歌、华为主要面向数据中心设计计算架构,而地平线专注于边缘侧的AI计算。
数据中心需要处理海量数据,要求高吞吐率和限定时间的响应;另外,云端计算本身限定在虚拟世界,任务相对封闭、九游体育定义单纯,所以模型加速就是最核心的负载。
相较于数据中心场景,自动驾驶的计算需求则会非常不同——自动驾驶处理的是流数据 ,感知数据源源不断的通过各种传感器到达车上,芯片必须对数据进行马上处理,而且延迟越低越好。延迟越低就越能根据周围的情况作出反应,及时刹车并控制车量,来保证安全。
自动驾驶与数据中心场景不同,导致了芯片架构设计取舍的不同。从设计上看,地平线的征程系列芯片和特斯拉FSD是类似的,是专门为智能驾驶应用设计的。
聚焦到智能驾驶领域的AI芯片,便需要将「软硬结合」水平再推进一步:从针对CNN计算特点的设计,进化到针对智能驾驶应用场景的设计。
以这种方式来讲「从场景出发」→「前瞻性算法」→「软硬件协同」的设计理念未免有些笼统,大家可能听得云里雾里,那下面咱们就举一个具体的应用场景实例。
一般的AI芯片需要先获得完整的图像再开始处理,而贝叶斯则选择输入帧的关键帧实施即时的数据处理。另外,通过时间切片优先调度关键任务进行数据处理,从而可以显著降低延迟几十毫秒甚至上百毫秒。
大部分应用场景下,节省100毫秒的意义并不大。但是在紧急制动的应用场景下,100毫秒意味着1.7-3.3米的刹车距离,可能会决定一条生命的生与死。基于征程5 实测,8M 单目前视感知结构化输出延迟小于 60 毫秒,这一指标远优于行业,将极大提升驾驶安全性。
在这个例子中,「从场景出发」是指智能驾驶对低延迟特别敏感,因而在「算法」设计时要考虑即时处理模式、灵活的优先级调度机制,「硬件」上也要配合算法进行相应优化。
如此一来就贯彻了「场景」→「算法」→「硬件」的设计理念,实现了极致流水压缩的「软硬件协同设计」。
从CPU → GPU → AI芯片 → 车用AI芯片,「软硬结合」程度依次上升:
·GPU → AI芯片:针对卷积神经网络(CNN)的MAC等AI运算进行硬件优化。
“消费能力不如狗的男人”,在直播间被一位“女大佬”拿下了!消费界一直有一条不成文的鄙视链,调侃“男人的消费力不仅排在女人后面,甚至排在了狗后面”,但如今,这个“最难被撬动的消费群体”也开始坐不住了。
以色列军方电台:伊朗已向以色列发射大约200枚导弹,目前以全境机场暂停飞机起降
来源:CCTV国际时讯微博 据以色列军方电台消息,伊朗已向以色列发射了大约200枚导弹。目前以色列全境机场暂停飞机起降。
多家航司通知:自2024年10月5日起。下调国内航线燃油附加费。航空燃料与平常汽车使用的汽油柴油不一样,生产成本和运输成本都很高,价格受国际油价影响,所以航运公司会根据国际油价的变动来收取燃油费。
“我是去找人讨债,怎料遇上了民警抓赌,自己被当做赌徒,治安拘留十天。”湖北咸宁59岁的余女士向华商报大风新闻投诉,“期间遭到了民警粗暴对待。”4月27日治安拘留期满释放次日,余女士在家人的陪同下经咸宁市第一人民医院诊断,右侧第4-6根肋骨骨折,多处挫伤。
自1984年重返奥运赛场以来,40年间,中国体育代表团在十一届夏季奥运会中拿下303枚金牌、诞生322名奥运冠军。
17岁女子退婚不退彩礼,男方举牌喊退钱……知情人:38万元彩礼已退回33万元
来源:大河报 男方家属在讨要彩礼钱引发围观近日,山东济宁市梁山县一女子收38万彩礼后退婚不退钱,遭男方家庭多次声讨引发全城关注。
9月12日,湖北省公安厅召开新闻发布会,通报五年以来湖北警方打击违法犯罪实绩实效,并对当前电信网络诈骗犯罪新特点作出分析。据了解,随着互联网和通信技术的快速发展,电信网络诈骗犯罪手法步步紧跟社会热点,不断升级变异。
交通银行湖北省分行 坚守国有大行职责使命担当 为推动中部地区加快崛起贡献力量
来源:【人民日报】近年来,交通银行湖北省分行(简称“交行湖北省分行”)积极服务新时代推动中部地区加快崛起相关部署,充分发挥金融“国民经济的血脉”作用,聚焦产业结构优化升级,推动新旧动能转换,强化对“三农”、小微企业和社会民生领域的金融支持力度,全力做好科技金融、绿色金融、普惠金融
在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!写作不易,作者每天辛苦写稿,只是为了养家糊口,希望各位观众老爷多多理解。文中加入5s广告解锁,观看5s后便可免费阅读全文啦,感谢各位观众老爷的理解与支持!
文 不似少溓游编辑 不似少溓游犹记得2021年年底,影后陈冲的母亲病危,闻讯的她从美国旧金山火速回国。但由于老人病势沉重,这对母女终究没能见上最后一面。陈冲的母亲在此之前就已经被认知症折磨多年,这病也就是人们口中的“老年痴呆”。然而,即便人生的大部分回忆已经模糊不清。