0
联系电话:4001-158-698EN

公司新闻 行业动态 产品知识

710公海寰宇(中国)有限公司- 十载磨「芯」:云天励飞冲击港股AI推理芯片第一股

导语:云天励飞加码AI推理芯片,抢占第四次工业革命首张入场券。

十载磨「芯」:云天励飞冲击港股AI推理芯片第一股

7月30日,云天励飞发布通知布告,公司已经向中国香港联交所递交了刊行境外上市股分(H股)并于主板挂牌上市的申请。这象征着,继2023年登岸科创板以后,云天励飞正迈向“A+H”两重上市的新阶段。

招股书显示,云天励飞是中国首家实现国产高算力AI推理芯片贸易化的公司;同时,也是全世界规模内第一批推出NPU驱动的AI推理芯片,并实现市场化落地的企业。

按照灼识咨询陈诉,按2024年中国市场相干收入统计,云天励飞是中国排名前三的行业领先全场景AI推理芯片产物和办事提供商;于NPU驱动的AI推理芯片产物和办事提供商中,公司排名中国第二。

雷峰网(公家号:雷峰网)于2014年云天励飞建立之初就最先存眷这家企业,自立立异及与时俱进一直是它的代名词。

“全自研、国产化”,于2025 WAIC云天励飞的展台上,摆放着采用国产工艺和首创“算力积木”架构打造的深界DeepEdge10系列芯片。

作为最早将并行计较处置惩罚器带回海内的一批人,云天励飞始终深耕NPU研发,从架构设计参加景适配连续冲破技能限定。

2020年,于被美国限定以后,云天励飞率先将芯片出产切换至国产工艺,至此,“全自研、国产化”的系统正式形成。

深界DeepEdge10系列产物的打造,代表陈宁此前的选择都对于了。年夜模子进入年夜范围运用落地的海潮之下,云天励飞进一步聚焦营业,押注AI推理芯片。

“云天励飞将进一步加年夜于AI推理芯片范畴的研发及投入,鞭策中国抢占第四次工业革命的第一张入场券。”陈宁于2025 WAIC时期演讲时说道。

陈宁的亮相绝非空言,云天励飞已经经由过程战略调解将公司营业聚焦在AI推理芯片,构建“1+N”营业架构,“1”即总体定位为AI芯片公司,“N”则是公司11年来堆集的N个自力营业板块(内部称BU),包括AI硬件品牌噜咔博士、智能穿着、智算BU、政企BU等,这些BU配合为AI推理芯片平台提供上下流支撑。

自研AI芯片,刻于云天励飞的基因里。这家11岁的企业,为什么选择这条“最有挑战性”的门路?于巨头林立、创业公司扎堆的AI芯片赛道中,云天励飞上风安在?

01 最早把并行计较处置惩罚器带回国的一批人

三获吴文俊人工智能科学技能奖

成为百亿市值的“科创板AI芯片第一股”

鞭策设立超千亿范围的财产基金

...

11岁的云天励飞创造了无数的高光时刻,而故事的最先,还有要从陈宁于美国的履历最先提及。

2001年,陈宁进入顶尖研究型年夜学佐治亚理工学院攻读电子工程博士学位,其时闻名挪动通讯专家斯图伯尔传授(Gordon L.Stüber)是学院的要害技能领头人,于他的领导下,OFDM(正交频分复用)技能实现了冲破。

OFDM的焦点是把高速串行数据拆成多路并行低速数据,其并行处置惩罚逻辑与芯片设计中经由过程多核实现并行算力的逻辑存于相通性,不管是4G通讯的海量数据,还有是AI推理的千亿参数,素质上都需要高效的并行处置惩罚能力。这让陈宁可以或许更深刻地舆解芯片设计。

4年后,还有未卒业的陈宁就被其时的通讯巨头“预订”担当高级体系架构工程师。

进入公司,陈宁领到的第一个使命是设计并研发第四代挪动通讯(4G-LTE)多模态终端基带芯片,原先从事算法事情的陈宁被委派去介入处置惩罚器芯片的事情,这让他有点摸不着脑筋。

于其时的技能演进趋向下,公司的摆设不无原理——让懂通讯算法的人来做通讯芯片。

2G及3G以后,4G尺度最先制订。与此同时,蓝牙、WiFi和UWB等多种短间隔无线通讯技能也于并行成长,这些差别场景的无线技能尺度配合组成了多元化的无线通讯系统。

4G实现了并行数据量的激增,而OFDM作为4G的焦点技能,最年夜特色恰是经由过程多子载波并行传输晋升数据吞吐量。

彼时,OFDM鞭策了通讯芯片于并行旌旗灯号处置惩罚上的技能演进,而与之形成技能呼应的是,英伟达较早结构的GPU多核并行计较,两者别离于无线通讯与通用计较范畴摸索了并行处置惩罚的技能路径。

这段履历让陈宁深刻理解,芯片不是简朴的硬件设计,而是要让算法及硬件联合设计。

4G终端原型体系的搭建,让陈宁作为首席代表介入4G-LTE国际尺度制订,于这时期,陈宁见证了华为、复兴和中国挪动等中国企业代表从最初只能于外围旁听,到位置不停靠前,末了是介入国际尺度的制订。

中国企业成长迅速,赴美的第九年,陈宁恰遇海内通信巨头于美国组建研发中央。

2011年,陈宁承接了一个庞大专项,这个专项,或者是海内第一个关在并行计较处置惩罚器界说的庞大专项。

可以说,陈宁是最早把并行计较处置惩罚器带回海内的那一拨人。

5年间,陈宁提交了近百篇专利申请,完成为了焦点IP和运用芯片的全流程专利结构。此外,陈宁团队推出了全世界第一款基在软件界说无线电的4G-LTE终端芯片、设计出一系列拥有全自立常识产权的矢量处置惩罚器,实现国有处置惩罚器0的冲破。

修业历程中主攻算法,进入职场后,陈宁的重心转向硬件处置惩罚器,如许的发展履历让他很早就堆集了算法与硬件联合的经验,为厥后云天励飞鞭策算法芯片化埋下了伏笔。

02 自研NPU让 「深目1.0」顺遂上线

过往的履历让陈宁对于国际巨头的动作一直保有敏锐的留意,google跟baidu抢Hinton的团队、4亿$收购DeepMind、AlphaGo战胜人类最强棋手,深度进修范畴一个个倾覆性的变化挑动着陈宁的神经。

深度进修是能把矢量处置惩罚器这个技能路径彻底阐扬出来的范畴。那咱们何不针对于深度进修去彻底界说一套指令集?

跟多位业内子士聊完以后,陈宁感觉创业不克不及再等了。

2014年,云天励飞创建,正式投身NPU研发;而这一时间节点,刚好也是中国NPU财产的鼓起之时——寒武纪、深鉴科技等企业纷纷建立,配合开启了NPU研发与商用的摸索之路。

陈宁开发的第一个项目即是“深目”,打造“深目”体系所触及的底层芯片研发让这个创业公司倍感压力。芯片是一个重资产、慢回报的买卖。于2014年,AI还有处在成长早期,一家草创公司说本身要做AI芯片,于投资人看来,无疑是“不切现实”。

但陈宁仍旧坚定地选择走这条路。

深目1.0上线后,软硬件运行顺畅,最担忧的体系卡顿也没有发生,全世界第一套人脸动态辨认+年夜数据检索的智能技能正式运行。

厥后,陈宁向咱们讲述到:“神经收集处置惩罚芯片一直是咱们内部的一个焦点团队,2016年,咱们第一代神经收集处置惩罚器于FPGA上实现,今天可能还有跑于龙岗公循分局的机房里,咱们两台Nova100指令集的办事器替换了几十台CPU办事器。”

NNP100撑持下的深目体系得到乐成,让云天励飞于三四年间,从几小我私家及一间办公室发展为拥有近千员工的人工智能标杆企业。

03 切换国产工艺乐成流片

Nova100只是最先,芯片研发让云天励飞的团队饱受“熬煎”。

其时美国还有没有最先年夜范围地打压抑裁中国科技企业,要用芯片,直接入口是很多企业的选择,但陈宁还有是想本身做出专为深目体系打造的嵌入式视觉AI芯片。

2018年,美国封锁芯片出口,同时,云天励飞推出DeepEye1000视觉阐发SoC芯片,与通用GPU比拟,DeepEye1000单元机能晋升20倍。

2020年5月,云天励飞被美国商务部纳入实体清单。这象征着云天励飞于采购含美国技能的产物和利用相干技能东西时将遭到严酷限定。

这是云天励飞面对的又一次年夜考,公司需要回覆一个要害问题:继承于境外流片还有是切换成国产工艺?

“2020年国产工艺实在不太成熟,绝年夜部门公司于选择工艺的时辰,起首选择的必然不是国产工艺。但也是于那一年,公司决议切回国产工艺。”云天励飞CTO李爱军说道。

国产工艺由于良率的问题,每一次流片的芯单方面积不克不及太年夜,且还有面对算力密度的限定。

国产工艺的限定倒逼出云天励飞的架构立异,其首创了“算力积木”架构以解决国产工艺带来的挑战。计较单位像乐高块同样组合,可实现算力的矫捷扩大、于国产工艺限定下拼出年夜算力的AI推理芯片。

2022年,云天励飞于国产工艺冲破上迎来要害里程碑,自立设计的新一代边沿计较芯片DeepEdge10系列SoC采用海内进步前辈制程工艺乐成流片。

2023年,云天励飞登岸科创板。

04 聚焦AI推理芯片,做难而准确的事

上市,让云天励飞走向新的篇章,更年夜的舞台让陈宁有底气及刻意去打击AI芯片研发事业新的岑岭。

战略聚焦AI芯片,不是一句标语,而需要年夜量的资金及时间投入,更需要对于这件事能成的笃定。

《英伟达之道》所记载的案例,正是汗青给出的左证。

英特尔曾经为迎合华尔街的预期,拒绝采用Arm架谈判GPU。

2006年,英特尔启动的Larrabee GPU项目因恪守x86架构,造乐成耗与成本高企,终极于2010年因“没法实现预期利润”黯然终止。

同期,英伟达在2006年推出CUDA,只管持续多年吃亏,黄仁勋仍执意深耕。

Alexnet的问世,进一步引发了黄仁勋对于人工智能的热忱,几位要害副手都否决进一步投资深度进修的环境之下,黄仁勋仍旧力排众议,对峙“All in AI”。

终极于AI海潮之下,英伟告竣为全世界首家市值冲破四万亿美元的企业。

鞭策云天励飞周全聚焦AI芯片,也许也需要巨年夜的刻意及对峙。

一个芯片研发团队需要10多个子团队,各个团队天天磨合十几个步调,投入年夜、危害年夜。

“有时辰一个BUG就毁失你一年的支付,上亿的资金汲水漂。”陈宁说到。

但AI芯片,是“不能不”做的事。

推理市场处于发作前夕,本年6月,AMD CEO苏姿丰于新品发布会上指出,AI推理计较需求将来几年将以每一年80%以上的速率增加,成为AI计较的最年夜驱动力,且数据中央以外,AI也将部署于每一个边沿体系中。

对于此,巨头们动作几次。

英伟达的Blackwell Ultra GPU及下一代架构Vera Rubin都强化了推理能力。AMD则发布Instinct MI350紧随其后。

云天励飞也于加快奔跑。

推理市场及运用深度绑定,将来AI会于云、边、端无处不于,于陈宁的计划下,云天励飞推出对于应这三个范畴的产物系列:深穹、深界和深擎。

云端推理加快范畴,云天励飞推出了基在国产工艺打造的深穹X6000推理加快卡,拥有超年夜显存、超高显存带宽算力比以和卓着的编解码能力,可以或许为年夜模子推理、图象语义理解等使命提供高推理机能、高性价比的加快卡硬件产物。基在深穹X6000 Mesh加快卡,云天励飞推出了各种推理一体机,可满意各种场景、差别推理使命的需求。

据悉,云天励飞已经经于与潜于年夜客户沟通,此外,下一代年夜算力推理芯片也行将在来岁流片。

边沿计较范畴,十余年的产物实践,让陈宁与团队堆集了年夜量技能Know-how,这是云天跑患上最快的范畴,于高密度视频智能阐发、轻量级年夜模子(蒸馏模子)推理等典型场景中,云天励飞已经落地多个树模项目。

端侧最具想象力的是具身智能,患上益在与十余家头部呆板人厂商互助的成立,云天励飞的边沿芯片产物运用在办事型呆板人已经进入现实部署阶段。

2023年,DeepEdge10进入量产,至今一年多的时间里,DeepEdge10已经经根据陈宁的假想,于一体机、边沿盒子、无人车和无人机等场景中,有序地实现了范围化落地。

技能还有要往前跑的,李爱军告诉咱们,第二代算力积木架构正于研发,将于新型计较、近存计较、NB-Mesh新型互联、新型封装、NB-link通用扩大性等方面实现迭代,满意模子对于在极致推理效率、能效等到性价比的需求。

界说指令集、打造处置惩罚器生态以和十余年的NPU赛道技能沉淀,都是云天励飞做好全自研国产工艺芯片的底气。另外一份厚重的家底,是公司战略投资闪极科技、神州云海、聪明互通、臻识科技等下流公司,以和11年来攒下的客户群。

“AI推理芯片成本降低,AI年夜范围运用就会形成良性的财产轮回,所有的技能成长路径都是如许,今天,全球财产内里最主要的即是打造高性价比、面向各种场景的AI推理芯片。”陈宁说到。

年夜厘革时代,陈宁带着云天励飞驰向属在他们的下一个故事。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-710公海寰宇(中国)有限公司
1210
在线客服
在线客服

Maggie

微信咨询

黎小姐