亿铸科技聚焦国产存算一体AI大算力芯片,28纳米工艺实现10倍能效比

2022-09-24 10:18

  

(原标题:亿铸科技聚焦国产存算一体AI大算力芯片,28纳米工艺实现10倍能效比)

  “数字时代的关键资源是数据、算力和算法,其中数据是新生产资料,算力是新生产力,算法是新生产关系,三者构成数字经济时代最基本的生产基石。”

  2021年9月,中国信息通信研究院发布的《中国算力发展指数白皮书》中,用上述结论强调了算力在数字经济时代的基础性作用。今年2月,多部委联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,这标志着全国一体化大数据中心体系——“东数西算”工程正式全面启动。

  这项被称为数字经济时代的“南水北调”“西电东送”“西气东输”的重大工程受到全社会高度关注。而在热点背后,当上千亿参数的超大规模深度学习模型成为现实,指引整个人工智能产业寻找一条新的可行之路,缩短我们与通用智能的距离之时,海量数据所引发的超大算力需求,导致了目前的一个客观现状:算力的发展始终未能跟上算法的发展,这对芯片半导体领域提出了新的挑战。

  怎样实现“既能低功耗、又能高精度、还能大算力”,已成为“后摩尔时代”全球数字经济体可持续发展的基础与核心。

  创立于2020年,以存算一体AI大算力芯片技术作为突破口的亿铸科技便是其中之一,作为国内首家研发基于ReRAM(RRAM)全数字存算一体AI大算力芯片的企业,在摩尔定律逼近物理极限的情况下,亿铸科技尝试通过架构创新突破冯·诺伊曼瓶颈,成为中国AI芯片创业大军中的革新者,也为解决国内AI算力尤其是大算力的困局提供了新的方向。

  超越“摩尔时代”,亿铸聚焦存算一体架构的AI大算力芯片

  早在1992年,中国工程院院士许居衍就预测,到2014年后,半导体产业将会遇到拐点,并进入“后摩尔时代”。

  这种预测的根据在于,在传统的冯·诺依曼计算系统采用存储和运算分离的架构下,80%-90%的功耗发生在数据传输上,99%的时间消耗在存储器读写过程中,真正用于计算的能耗和时间占比很低,于是造成“能耗墙”和“存储墙”的出现。而存算分离的架构非常容易导致数据搬运过程中发生拥塞,尤其是在动态环境下,对数据进行调度和管理其实非常复杂,导致编译器无法在静态可预测的情况下对算子、函数、程序或者网络做整体的优化,只能手动、一个个或者一层层对程序进行优化,包括层与层之间的适配,耗费了大量时间,于是出现了“编译墙”。

  在“三堵墙”的限制下,采用冯·诺依曼架构的计算系统将严重制约人工智能领域的算力和能效提升。以智能汽车领域为例,十年前,汽车的算力还不足1TOPS,而未来,为满足L5级别的无人驾驶技术,汽车需要达到4000TOPS的算力水平才有可能实现,到那时若仍以传统的冯·诺依曼架构研发芯片,其功耗将非常夸张。

  为解决这一问题,科学家就必须要翻越这“三堵墙”。实际上,早在1969年,斯坦福大学研究员Kautz等人就提出过存算一体计算机的概念,但在当时,一方面受限于芯片设计复杂度与制造成本问题,另一方面由于缺少大数据应用驱动,这些存算一体概念仅停留在研究阶段,并未获得实际应用。直到近年来,伴随GPT-3、“悟道”等人工智能大模型的问世,海量数据所引发了超大算力需求和高能效比的矛盾而开始受到重视,业界逐渐形成一个共识——存算一体架构可能是现阶段基于CMOS工艺能同时满足大算力、高精度、高能效比的最有效途径。

  全球范围内,再度兴起了对存算一体的产业研究,海外巨头诸如英特尔、三星、IBM、东芝、SK海力士等都在进行相关领域的布局和产品研发。在亿铸科技首席技术官Debu看来,由于存储器件以及配套工艺发展等原因,此前的存算一体芯片多基于Flash通过模拟计算的方式实现,后来出现了基于SRAM的存算一体技术。这些技术无疑为存算一体架构和生态发展做出了很大的贡献,他们不仅向业界证明了存算一体技术的可实现性以及价值,同时也为存算一体生态的建设做了很多基建工作。

  但要注意到,既有的存算一体技术仍然主要聚集于小算力、低精度的场景,并未能将存算一体高能效比的优势应用于大算力比如云计算、自动驾驶等领域。因此,亿铸的技术价值在于“将存算一体架构切实向大算力、高精度、高能效比的方向推进和落地,实现这一存算一体架构里程碑式的发展节点”。

  亿铸科技创始人、董事长兼CEO熊大鹏博士表示:“亿铸科技以全数字化的方式将ReRAM 应用于存算一体AI大算力芯片,这么做的优势在于:一, 存算一体架构可以打破传统冯·诺依曼架构下的存算墙、能耗墙和编译墙;二, 存储介质ReRAM在算力潜能、算力精度和算力效率等主要指标上有着数量级优势,是目前最适合做存算一体AI大算力芯片的忆阻器;三,全数字化的技术路径在满足大算力的同时还能做到支持高精度,使得存算一体架构真正在AI大算力方向落地。因此,亿铸科技能够为业界带来大算力、超能效比、低功耗、易部署的AI推理计算解决方案。”

  他强调,ReRAM这一新型忆阻器具有非易失性、面积小、密度高、成本低、功耗低、读写速度快等一系列优点,随着ReRAM的产业配套逐步完善和成熟,该技术无疑已经到了“商业应用爆发前夜”。此外,ReRAM与CMOS工艺兼容,不管是本身密度的发展,还是通过工艺制程的演进以及3D堆叠的技术的使用,均能从多个维度持续推进ReRAM密度和能效比的提升。亿铸相信,亿铸在产品算力与能效比方面的提升在国内属于一流水准。

  “亿铸初代产品可以基于28纳米工艺实现同等算力、10倍能效比,同时拥有更低的软件生态兼容和建设成本,而且选择的忆阻器未来有很大的成长空间,这些都是支撑亿铸未来发展动力以及确定性的重要因素。”

  大算力赛道上,中国企业以技术突围

  随着AI的场景变得越来越普及以及多元化,算法模型也变得越来越复杂,社会对算力的需求远超我们想象。根据《中国算力发展指数白皮书》,2020年,全球算力总规模达到429EFlops,增速达到39%,据IDC预测,2025年全球物联网设备数将超过400亿台,产生数据量接近80ZB,预估未来五年全球算力规模将以超过50%的速度增长,到2025年整体规模将达到3300EFlops。其中,中国2021年的AI芯片市场规模超过400亿元人民币,其中AI推理计算占比超50%,预计未来5年CAGR超40%。

  但国家对碳达峰、碳中和的战略目标设定又要求AI算力在不断攀升的同时,还要实现能效比的快速提升,如此,才能既满足市场对AI算力的要求、又满足国家对能源结构性优化的要求。熊大鹏博士认为,在传统异构AI芯片面临工艺摩尔墙的技术瓶颈、算法模型日益复杂和庞大、能耗使用监管日益严格的大背景下,存算一体AI芯片有着不可多得的历史发展机遇,这也让存算一体这一先进计算架构成为前沿研究热点,存算一体及AI大算力芯片也即将迎来了行业爆发的契机。

  亿铸的全数字化存算一体技术可切实将存算一体架构在大算力、高能效比的芯片平台应用并落地,这一技术通过稀疏化的设计原理以及无需AD/DA(数模转换)部分,将芯片的面积和能耗用于数据计算本身,从而实现大算力和高精度的多维度满足。

  凭借技术实力强劲的团队和国产产业链核心节点的支持,亿铸即将于2023年上半年推出自己的第一代芯片,并于同年投片第二代芯片。

  存算一体架构的AI大算力芯片作为技术领域跨度多、集成度高、创新型强的技术赛道,需要行业资深从业者以及优秀的前沿科学家。

  亿铸团队研发能力覆盖存储器件、存算阵列、芯片架构、芯片设计、软件生态、AI算法和工程落地等全链条,研发团队发表顶会论文40余篇,工程团队成员平均拥有25年以上在高端集成电路设计领域的经验;还拥有20+颗SoC芯片的设计、量产及销售经验,因此,团队在技术定位和技术战略上的深谋远虑,也有对存算一体技术探索的底气。

  芯片作为人类社会各产业信息化、数字化、智能化发展的基本生产资料,其发展根植于人类社会信息化、数字化和智能化发展的要求,这正是美国阻挠中国芯片半导体产业发展,并大力投入争夺头部芯片企业支持的原因。而在AI芯片领域,对算力的需求在未来较长的一段时间内仍将保持较高速度的发展,这一点已经成为整个产业界的共识。

  但从另一角度来看,当前存算一体领域的挑战与机遇并存。2021年,中国芯片进口额超过4300亿美元,随着中国本土工厂扩大产能,去年中国对海外芯片制造设备的采购订单增长58%,若不能通过先进技术实现突破,我国对海外芯片半导体产业的依赖将持续增加,当前局势刻不容缓。

  在亿铸看来,在先进工艺短期内无法完全实现全链国产化的大前提下,国内半导体企业必须具备与先进工艺制成解耦的技术,同时还要实现与基于先进工艺制程的芯片产品同等甚至更好的性能表现,在这方面,亿铸基于传统28纳米CMOS工艺和既有国内产业配套设计的存算一体AI大算力芯片可以实现与先进工艺制程的AI芯片同等算力但10倍能效比。

  此外,亿铸的目标除了将存算一体架构切实在AI大算力领域商用落地之外,还期望和其他存算一体赛道上共同奋斗的创业伙伴们一起共建存算一体生态。

  芯片半导体领域发展至今,已成为全链高度耦合的产业,各个环节唇齿相依、缺一不可。但通过架构的创新,基于可国产化的产业配套,亿铸将为业界提供大算力、超高能效比、易部署的AI大算力芯片产品,在不改变数据中心物理空间和既有基建的前提下,大大提升算力密度,以及能效比,为国内产业的智能化发展贡献出自己的力量。

上一篇:《文档产品碳减排绩效研究报告》重磅发布,数字化工具赋能碳减排效用凸显
下一篇:苹果:iPhone14系列支持的eSIM在旅行时好处多多
图文资讯
返回顶部小火箭