0
联系电话:4001-158-698EN

公司新闻 行业动态 产品知识

710公海寰宇(中国)有限公司- 仅需28nm工艺,提升AI芯片十倍能效,国产存算一体「超速前进」

导语:存算一体时代,半导体「不合错误称战役」闭幕。

仅仅于5、六年前,人工智能还有只存于在人们的想象。雷峰网(公家号:雷峰网)雷峰网

短短几年间AI快速扩张,AI算力及运算数据量每一年都于以指数级增长,对于算力的需求空前,但摩尔定律却已经靠近极限。

于能耗墙及存储墙的拦截下,半导体越来越盘跚的算力晋升已经经追不上疾走的AI。

存算一体架构有时机让AI面对的问题水到渠成。时代的海潮下,一批摸索存算一体的企业接踵建立。

于这个范畴中,海内外研究险些站于统一起跑线上。

此中亿铸科技是将新型存储器ReRAM用在存算一体赛道的“先行者”。建立仅仅两年,亿铸科技就已经可以或许设计出能效比跨越主流计较卡十倍的基在ReRAM的存算一体AI年夜算力芯片。

于行将到来的存算一体发作期,国产厂商们将要迎来的,是一场与外洋巨头们堂堂正正的对于决。

名为GPU的马,拉不动AI的车

自1956年约翰.麦卡锡于达特茅斯集会上提出人工智能的观点,AI已经经成长了70年。

70年间,AI曾经经发作过三次海潮。

于前两次海潮中,AI因为种种缘故原由,终极未能普和。

直到第三次海潮中,深度进修技能的鼓起,解决了AI普适性与可维护性的问题,这一赛道才真正迎来曙光,培养了现代意义上的基在深度进修的“人工智能”。

跟着深度进修的广泛运用,对于算力的需求日趋增长,这让可以或许提供年夜范围算力的GPU于AI范畴变患上愈来愈主要。

然而GPU究竟不是专为人工智能而生,跟着人工智能成长走入深水区,GPU的问题逐渐浮现,特别是AI成长中的“存储墙”、“能耗墙”问题,GPU没法冲破。

不管是CPU还有是GPU,采用的都是存算分散的冯诺依曼架构。

于冯诺依曼架构下,80%-90%的功耗发生于数据传输上,99%的时间耗损于存储器读写历程中,致使了“存储墙”及“功耗墙”问题。

冯诺依曼架构的芯片于事情时,计较单位要先从内存中读取数据,计较完成后再存回内存,才能终极输出。

但于已往几十年中,存储器与处置惩罚器的成长严峻掉衡,自上世纪八十年月以来,存储器读取速度的晋升远远跟不上处置惩罚器机能的增加。

这致使了计较畸形的漏斗布局:不管处置惩罚器地点的漏斗“进口”一端处置惩罚了几多数据,也只能经由过程存储器狭小的“出口”输出,严峻影响了数据处置惩罚的效率。

曾经于AI芯片公司Wave Computing事情过的熊年夜鹏博士对于此深有感悟。

2014年摆布,熊年夜鹏正于从事GPGPU范畴的研究,于事情中他深感能耗墙与功耗墙的限定下,人工智能难以连续成长。

熊年夜鹏认为,打破内存与计较隔膜的存算一体架构是人工智能将来的一个可能解。

差别在冯诺依曼架构,存储单位与计较单位一体的布局让数据没必要于二者之间重复“搬运”,从而让“能耗墙”与“功耗墙”问题水到渠成。

谈起对于存算一体技能的初印象,熊年夜鹏说到:“2017年我第一次接触到存算一体技能,其时就震动在怎么会有这么好的工具可以或许刚好解决AI芯单方面临的问题。”

于初识存算一体后,熊年夜鹏兴致盎然,马上最先了着手从财产界到学界进修及调研,对于存算一体成立了体系的熟悉。

其时,把存算一体应用到AI中还有只是一种理论,熊年夜鹏还有没有找到将他于存算一体范畴的大志落实的时机。

熊年夜鹏患上以实现理想的契机是与ReRAM的偶遇,这也是他于2020年创建存算一体AI芯片公司亿铸科技的要害。

存算一体的「天时」、「地利」与「人及」

2018年,熊年夜鹏于事情中接触到了ReRAM的领军企业Crossbar。其时正于苦苦寻觅存算一体技能于AI芯片范畴落处所案的他,刚一接触ReRAM,就近乎直觉地认为ReRAM有解决存算一体落地问题的能力。

存算一体的存储介质选择一般有三种方案:Flash等传统存储介质;相对于成熟的易掉性存储器SRAM;以和ReRAM等新型存储器。

熊年夜鹏说,差别的存储介质有差别的特色,也有各自最适配的运用范畴,而于他看好的AI年夜算力芯片场景下,ReRAM则是最适合的选择。

于他看来,NAND Flash读写延时较年夜,机能相对于掉队,而且工艺节点于40nm摆布,难以随进步前辈工艺继承迭代,没法满意AI年夜算力芯片的计较需求。

SRAM存储器于年夜算力场景下则存于单元密度受限、泄电流及工程落地难度及成本较高档问题。

而ReRAM虽然于运用在模仿存算一体时也存于着精度及数模转换等难题,但于熊年夜鹏看来,亿铸科技选择的基在ReRAM的全部字化存算一体技能,能较好解决精度及数模转换等难题,无疑更合适运用于AI年夜算力芯片的场景中。

ReRAM是一种新型非易掉存储器,其基本存储单位被称为忆阻器,是一种可编程电阻,其特色是于断电以后电阻值依然可以或许持久连结。

忆阻器可编程的性子让其很是合适于ReRAM存储单位上加之计较功效,而断电后连结数据不丢掉的特征也让它可以或许成为靠得住的存储器,这都让ReRAM与存算一体架构的要求不约而合。

于与一家全世界ReRAM新型存储技能领军企业中的老伴侣们,还有有斯坦福年夜学、德克萨斯年夜学奥斯汀分校、上海交通年夜学、复旦年夜学、中国科学技能年夜学等高校的知名科学家们颠末几个月的会商后,熊年夜鹏对于利用ReRAM存算一体技能解决AI年夜算力芯片问题有了开端设法,随即最先组建团队。

用ReRAM及全部字化存算一体技能做AI芯片是一条全新的门路,前人留下的脚印甚少,过河没有石头可摸。

一最先熊年夜鹏也思量过从技能更成熟的SRAM最先,再过渡到ReRAM。

终极是团队的撑持给了熊年夜鹏决定信念。团队组建的历程中,熊年夜鹏找到了已往于Wave Computing共事过的Debu博士。

Debu博士是IEEE Fellow、曾经就职在斯坦福年夜学,其时于Cadence担当首席科学家兼AI部分CTO,也于研究基在SRAM的存算一体IP Core,而且已经经立室。假如接管熊年夜鹏的邀约,于家庭及事业两方面都面对着坚苦。

但Debu于相识到熊年夜鹏决议入局基在ReRAM的全部字化存算一体芯片后,顿觉这是一项面向将来的年夜事业,解决了他于Cadence研究过的基在SRAM存算一体未能解决的技能瓶颈,降服种种坚苦终极还有是决议插手到亿铸科技创业的行列中。

Debu不远千里来投,让熊年夜鹏感触感染到了有识之士对于这个赛道的决定信念,而很多以前曾经与熊年夜鹏有过深切交流的包括工艺器件、电路设计、架构方案及软件生态等各方专家学者的插手,则给了熊年夜鹏技能攻关的底气。

“岂论是ReRAM还有是MRAM都是比力前沿的范畴,单凭企业自身很难乐成,离不开新型存储器范畴领先的互助伙伴企业及一流研究团队的撑持。”熊年夜鹏说。

有了这些的撑持,熊年夜鹏终究下定刻意,决议直接从ReRAM最先。

“咱们的创业团队是‘三老’团队,”熊年夜鹏略带调侃地说,“老同事,老同窗,老伴侣。”

原本就对于AI芯片十分认识的熊年夜鹏及对于基在SRAM存算一体拥有开发经验的Debu让亿铸科技开局已经占地利,而浩繁老友的插手让亿铸科技又添人及。而于熊年夜鹏看来,存算一体的天时也正于当下。

决斗近于咫尺,中国芯此次正面「亮剑」

对于在国产存算一体芯片的企业们来讲,前路依然漫漫,但代表着决斗的鼓声已经经悄然逼近。

创业者的身份外,熊年夜鹏还有是一位于芯片范畴纵横多年的投资人。

作为投资人,熊年夜鹏见证了很多新兴技能的发展。过往的经验告诉他,属在存算一体的时代间隔此刻其实不遥远。

于熊年夜鹏看来,存算一体财产从已经经实现了从端侧小算力到云端年夜算力的全场景笼罩,整个财产链的配套正于成熟。

同时,潜于客户对于存算一体的认知也愈来愈清楚,从“没据说”到“有相识”再到如今已经经对于产物“有期待”。

于国度对于能耗愈来愈严酷的管控趋向下,数据中央对于高能效比的年夜算力产物的需求也于高涨。而存算一体芯片超高能效的特征正好可以满意市场需求。

种种因素相叠加,熊年夜鹏做出判定:“2024年到2025年,存算一体的产物会周全着花。”

间隔存算一体的周全发作,还有有三年时间。对于在国产存算一体厂商来说,这恰是属在他们的“天时”。

亿铸科技仅正式运营两月后,就得到了由遐想之星、中科创星及汇芯投资结合领投的过亿元天使轮融资。于鞭策ReRAM落地的要害技能上,亿铸科技也已经经取患了冲破。

假如用模仿或者混淆方式构建芯片,忆阻器于遭到工艺及情况的影响时,会呈现精度漂移及数模/模数转换能耗问题。这也是ReRAM落地存算一体的要害拦阻。

为了冲破这一难关,亿铸科技选择攻关全部字化存算一体技能。

基在全部字化方式组织芯片,无需模数及数模旌旗灯号转换器,不会遭到信噪比的影响,精度可以到达32bit甚至更高,既不会孕育发生精度丧失,也不碰面临模仿计较带来的诸如IR-DROP等问题。

基在全部字化方式,亿铸科技将开发业界首颗基在ReRAM的全部字化存算一体AI年夜算力芯片,采用chiplet技能,单模组将冲破1000TOPS算力,凌驾GPU 250TOPS算力的四倍多。

熊年夜鹏暗示,亿铸科技的产物落地正于快速推进,第一代芯片将在2023年落地,并于同年投片第二代芯片。

虽然一切顺遂,但不管对于亿铸科技还有是对于存算一体芯片来讲,这都远远不是尽头。

熊年夜鹏认为,于技能上实现存算一体及于贸易上取患上乐成是两种观点。于他看来,存算一体芯片要想年夜范围被运用,起首要成立起本身的生态。

熊年夜鹏告诉咱们,于年夜算力运用场景下,存算一体的竞争力于在构建生态体系。

仅仅“介入”到现有的生态中,这远远不敷,只有跳出传统架构的局限,一最先就以存算一体作为思绪构建总体体系才能真正阐扬存算一体的竞争力。

亿铸科技的方针除了了将存算一体架构于AI年夜算力范畴商用落地以外,还有指望及其他存算一体赛道上的伙伴们共建生态。

而于美国对于我国半导体范畴连续打压的配景下,存算一体芯片还有承载着着突破藩篱的任务。

前段时间,美国出台了对于我国的进步前辈制程及高机能计较设计东西EDA等的出口限定政策,这无疑将对于我国AI研究的将来带来更年夜挑战。

熊年夜鹏认为,于进步前辈工艺短时间内没法实现天下产化的年夜条件下,海内半导体必需具有于机能体现不异的前提下成长与进步前辈制程解耦的技能。

存算一体就是一种冲破进步前辈制程对于机能限定的有用路径:亿铸科技基在成熟的28nm CMOS工艺及海内既有财产配套设计的存算一体AI年夜算力芯片已经经可以实现7nm CMOS进步前辈制程AI芯片10倍以上能效比及机能。

而且,于存算一体赛道上,国产芯片厂商们并不是片面的追逐。

于熊年夜鹏看来,与传统赛道比拟,于存算一体芯片范畴,外洋“巨头们”并无于这条新斥地的门路上领先太多。

“总的来讲,海内外于存算一体范畴差距不年夜,并且于某些方面,咱们做的更快更好。海内做存算一体的基本都是草创公司,草创公司可以年夜干快上地投入,无惧外洋巨头们的竞争,而这些巨头们却未必有拥抱革命性技能来革本身命的刻意,效率也纷歧定比咱们高。”熊年夜鹏总结道。

对于在这场行将降临的决斗的终极成果,熊年夜鹏显患上决定信念统统:“到了存算一体周全着花的那天,咱们必然可以或许战胜他们。”

存算一体赛道上,第一批国产挑战者已经经起跑,信赖于存算一体将来几年内将到来的“将来之战”中,国产芯片公司必然可以或许跑出存算范畴的“领航者”。假如想及作者更深度会商存算一体芯片的话题,可以添加作者微信Soldier7887(注明来意),下一篇文章咱们将讲一讲基在SRAM的存算一体AI年夜算力芯片,接待从业者与作者会商。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-710公海寰宇(中国)有限公司
1210
在线客服
在线客服

Maggie

微信咨询

黎小姐