首页
行业动态
网络学院
TCP/IP
RDMA
IGP & BGP
技术博客
AI & 大模型
云 & 计算
交换机
SDN
流量控制
拥塞控制
网络拓扑
接口 & 协议
存储
RDMA
网络仿真
运维&管理
顶级会议
SIGCOMM
NSDI
APNet
ICNP
其他论文
关于我们
当前位置:
首页
>
行业动态
> 正文
【厉害了】首个国产兼容UCIe标准的Chiplet解决方案
行业动态
2022-12-01
1578
更新:2022-12-01 22:55:00
**前言** 2022年3月,芯片制造商英特尔、台积电、三星联合日月光、AMD、ARM、高通、谷歌、微软、Meta(Facebook)等十家行业巨头共同推出了全新的通用芯片互联标准——UCle。
几乎与此同时,中国IP和芯片定制及GPU赋能型领军企业芯动科技宣布率先推出国产自主研发物理层兼容UCIe标准的IP解决方案-Innolink™ Chiplet,这是国内首套跨工艺、跨封装的Chiplet连接解决方案,且已在先进工艺上量产验证成功!
▲ Innolink™ Chiplet架构图 随着高性能计算、云服务、边缘端、企业应用、5G通信、人工智能、自动驾驶、移动设备等应用的高速发展,算力、内存、存储和互连的需求呈现爆炸式增长。但同时,先进工艺芯片迭代也面临着开发难度大、生产成本高、良品率低的窘境,即先进制程工艺下芯片面临着性能与成本的矛盾,Chiplet技术在这一背景下得到快速发展。
▲ 制程工艺发展和晶体管密度增加导致开发成本急剧上升 Chiplet技术的核心是多芯粒(Die to Die)互联,利用更短距离、更低功耗、更高密度的芯片裸die间连接方式,突破单晶片(monolithic)的性能和良率瓶颈,降低较大规模芯片的开发时间、成本和风险,实现异构复杂高性能SoC的集成,满足不同厂商的芯粒之间的互联需求,达到产品的最佳性能和长生命周期。
▲ Chiplet核心技术是多芯粒互联 近年,AMD、苹果和英伟达等国际巨头都发布了标志性的Chiplet旗舰产品,并在各个应用领域取得极大成功,进一步验证了Chiplet技术的可行性和发展前景,使得Chiplet互联这一核心技术日益受到市场追捧!
▲ 多芯粒互联的Chiplet技术是实现高性能异构系统的发展趋势
▲ 苹果自研M1 Ultra芯片应用Chiplet技术实现性能翻倍 **Chiplet早期发展协议混乱 各公司制定自己的私有标准** 此前,众多的芯片厂商都在推自己的互联标准,比如Marvell在推出模块化芯片架构时采用了Kandou总线接口;NVIDIA拥有用于GPU的高速互联NV Link方案;英特尔推出了EMIB (Embedded Die interconnect bridge)接口;台积电和Arm合作搞了LIPINCON协议;AMD也有Infinity Fabrie总线互联技术等等。芯动科技奋起直追紧随其后,2020年在国内率先推出自主研发的Innolink™ Chiplet标准并实现授权量产。 Chiplet技术核心就是Die to Die互联,实现大带宽下的多芯片算力合并,形成多样化、多工艺的芯片组合。显然,如果各家芯片厂商都在推自己的标准,这将导致不同厂商的Chiplet之间的互联障碍,限制Chiplet的发展。因此,实现各个芯粒之间高速互联,需要芯片设计公司、EDA厂商、Foundry、封测厂商等上下游产业链协调配合、建立统一的接口标准,从而实现Chiplet技术的量产应用并真正降低成本,加速整个Chiplet生态的发展。于是,UCIe标准应运而生。 **UCIe的建立将有力推动Chiplet连接标准发展** 前不久,UCIe标准发布引起了业界高度关注与热议,因为这是由一条比较完整的产业链提出的开放的、可互操作性的标准,能有效解决当前先进工艺芯片产业上下游发展的难题,降低成本、提升性能。
Universal Chiplet Interconnect Express (UCIe)® 是一个开放的、行业通用的Chiplet(芯粒)的高速互联标准,由英特尔、AMD、ARM、高通、三星、台积电、日月光、Google 、Meta、微软等十大行业巨头联合推出。它可以实现小芯片之间的封装级互连,具有高带宽、低延迟、低成本、低功耗等优点,能够满足包括云端、边缘端、企业级、5G、汽车、高性能计算和移动设备等在内的整个计算领域,对算力、内存、存储和互连日益增长的高需求。通俗来讲,UCIe是统一标准后的Chiplet,具有封装集成不同Die的能力,这些Die可以来自不同的晶圆厂,也可以是采用不同的设计和封装方式。 **Innolink™ Chiplet方案解读** 就在Ucle标准发布后两周,芯动科技就宣布推出首个国产自主研发物理层兼容UCIe标准的IP解决方案-Innolink™ Chiplet。芯动Chiplet架构师高专表示:芯动在Chiplet技术领域积累了大量的客户应用需求经验,并且和台积电、intel、三星、美光等业界领军企业有密切的技术沟通和合作探索,两年前就开始了Innolink™ 的研发工作,率先明确Innolink B/C基于DDR的技术路线,并于2020年的Design Reuse全球会议上首次向业界公开Innolink A/B/C技术。 得益于正确的技术方向和超前的布局规划,Innolink™ 的物理层与UCIe的标准保持一致,成为国内首发、世界领先的自主UCIe Chiplet解决方案。
▲ Innolink A/B/C实现方法 **Innolink™ Chiplet的设计思路和技术特点:** 1、业界很多公司认为Chiplet跨工艺、跨封装的特性,会使其面临复杂的信号衰减路径,所以普遍使用SerDes差分技术以应对这一问题。芯动基于对Chiplet应用场景和技术趋势的深刻理解,以及在DDR技术领域的绝对领先,认为相较于SerDes路线,DDR技术更适合Chiplet互联和典型应用,而且不同封装场景需要用到不同的DDR技术方案。 2、Chiplet(Die to Die) 在短距PCB、基板、Interposer上连接时,路径短、干扰少、信号完整性好,此时采用DDR技术路线在延时功耗和带宽密度上更具优势。在短距离PCB、 基板、Interposer平台上,DDR对比SerDes的优势如下:
Chiplet的核心目标就是高密度和低功耗,DDR技术满足多芯粒互联的高密度、低功耗、低延迟等综合需求,可使多芯粒像单芯粒一样工作,单芯粒总线延展至多芯粒。因此,芯动综合考虑SerDes和DDR的技术特点,在Innolink-B/C 采用了DDR的方式实现,提供基于GDDR6/LPDDR5技术的高速、高密度、高带宽连接方案。 3、标准封装使用MCM传统基板作为Chiplet互联的介质,具备成本便宜等特点,是对成本较为敏感的Chiplet应用场景首选;先进封装如Interposer,具备密度高、良品率低、成本高等特点,则是对价格不敏感的高性能应用场景首选。在UCIe定义正式发布前,Innolink-B/C就提前实现了这两种封装场景的应用,验证了其对市场前景和Chiplet技术趋势的准确判断。
▲UCIe定义不同封装标准的主要性能指标 4、针对长距离PCB、线缆的Chiplet连接,Innolink-A提供基于SerDes差分信号的连接方案,以补偿长路径的信号衰减。 5、总的来看,Innolink-A/B/C实现了跨工艺、跨封装的Chiplet量产方案,成为业界领先!围绕着Innolink™ Chiplet IP技术,芯动同时还提供封装设计、可靠性验证、信号完整性分析、DFT、热仿真、测试方案等整套解决方案!
▲ Innolink™ Chiplet的设计包含了UCIe的Chiplet连接先进、标准封装定义 图中显示UCIe分了3个层次,Protocol Layer协议层、die to die Adapter互联层、Physical Layer物理层。其中协议层就是常用的PCIE、CXL等上层协议,底层的Die to Die和PHY物理层,即是和Innolink™同样的实现方式。 总结:芯动准确地把握了Chiplet技术方向,并前瞻性地完成设计验证,与后来推出的UCIe技术方向一致,为Innolink™ 兼容UCIe标准奠定基础,成为业界领先方案。 **这听起来像押中高考大题的故事,其实Innolink™背后的技术极为复杂,正因为芯动掌握了高速SerDes、GDDR6/6X、LPDDR5/DDR5、HBM3、基板和Interposer设计方案、高速信号完整性分析、先进工艺封装、测试方法等等世界领先的核心技术,并且经过大量客户需求落地和量产验证迭代。博观而约取,厚积而薄发,“押中题”无疑是是芯动技术团队长期投入和耕耘的成果!** **芯动准备了满满一桌的大餐** **等着UCIe这个客人上桌!** Innolink™ Chiplet是芯动先进IP之集大成者,代表着国内乃至世界领先水平,闻之不如见之,我们来盘点一下其内部实现的基础技术。
▲ 18Gbps GDDR6 单端信号量产验证
▲ 21Gbps PAM4 DQ eye, single ended
▲ HBM3 6.4Gbps 高速眼图
![图片](https://mmbiz.qpic.cn/mmbiz_png/TRePibF9WlCwdVFvhKiaQdSdmX7pU5WHjibYic50WKkOJSzxasGZVd6tdYlXNZXDO9URuUWcuTh2VFVMNsVhxqqyicA/640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1) ▲ 32/56G SerDes眼图
▲ 风华1号4K高性能GPU应用Innolink™ Chiplet实现性能翻倍
▲ 先进封装信号完整性分析
▲ 封装热效应仿真 看到这些赏心悦目的IP验证测试眼图,相信大家对Innolink™ Chiplet有了更加客观的认知。追本溯源,这些成果反映的另一问题也值得探讨,为什么芯动能在这么多先进技术上取得如此耀眼的成绩? **为什么要做先进****IP?有哪些挑战和困难?** **首发先进IP技术具备很多优势,可以快速赢得业界认可、第一时间导入客户需求并设计验证、广泛获得Foundry和封测等上下游的大力支持。在市场应用成熟时,还可以让广大芯片客户用上量产验证的、可靠安全的IP,从而根据新的升级方向迅速实现技术迭代,进一步推动业务增长。一步领先、步步领先,从IP切入是极具实际意义的。** 当然,首发推出先进工艺IP面临很多困难: 1、没有参照对象,试错成本高。 第一个吃螃蟹的人,先进道路的开拓者,总要付出加倍的努力。在很多大的技术节点上并没摸石头过河的说法,需要不断的摸索尝试。通俗点讲就是一个个坑踩个遍,踩结实了,路就平了。 2、对团队要求高。 一个先进IP,从数字到模拟、后端到工艺、流片到封测,每个环节都要资深的技术人员,芯动经过16年的积累,打造一支技术过硬的队伍,后来居上,面对国外厂商的先发优势毫不退让,用实力赢得全球客户认可。 3、先进工艺流片验证成本高。 先进工艺的IP流片验证成本很高昂,设计工时、FinFet工艺MPW或者流片费用、封测等累加,每次验证的费用轻轻松松破百万美元。 某种意义上,芯动在先进IP领域获得的优势和业界认可,以及6大合作晶圆厂在工艺、流片成本、产能上给予的巨大帮助,都是做先进工艺IP的好处。 **先进IP的重要意义** 有和没有先进IP区别是很大的,有先进IP能够使市场更加理性,同时满足国产高端芯片自主可控、技术迭代的迫切需求! 芯动的先进IP技术,一方面引领行业技术的创新,塑造半导体企业的全球化长远发展视野,另一方面填补国内高性能芯片的应用空白,助力国内高端芯片发展。
芯动16年来重兵投入全球先进工艺、专注国产自主IP研发,在高性能计算平台、多媒体终端&汽车电子平台、IoT物联网平台等应用领域打造了核心优势,超过200次的流片记录、逾60亿颗授权量产芯片、10亿颗以上高端定制SoC量产,默默耕耘、脚踏实地,为赋能高端芯片做出重要贡献 > 作者:芯动科技-伍江华 > 来源:智能计算芯世界/微信公众号 >
声明:本文素材来源于网络,仅供学习使用,如有侵权请联系网站删除(ngdcn_admin@163.com)。
UCIe
1
赞
本文由 @NGDCN 于2022-12-01发布在 未来网络技术网,如有疑问,请联系我们(ngdcn_admin@163.com)。
上一篇:
InfiniBand体系架构和协议规范
下一篇:
【NS3】图文详解报文接收过程
相关文章
什么是 UCIe?
有话要说...
取消回复
行业动态
回复
1
赞
最近发表
【Sigcomm 2023】 Achelous:超大规模云网络中如何实现网络的可编程性、弹性和可靠性
【ICNP 2021】基于弱监督学习的ISP自助BGP异常检测
【ICNP 2021】怒赞!上海交大团队先于谷歌提出光电混合数据中心慢切换方案
【中科院】为什么chiplet需要标准?
一文读懂Dragonfly拓扑
Alibaba高性能通信库ACCL介绍
【微软】MSCCL Github仓库介绍
【英伟达】NCCL Github仓库介绍
【MPI】MPI组和通讯器介绍
【MPI】MPI Reduce和Allreduce函数
热门文章
【Infiniband手册】第9章:传输层
2022-10-27
【推荐】计算机网络顶级会议:快速检索目录
2022-11-07
一文读懂Dragonfly拓扑
2023-02-24
【Sigcomm 2023】 Achelous:超大规模云网络中如何实现网络的可编程性、弹性和可靠性
2023-10-06
Alibaba高性能通信库ACCL介绍
2023-02-21
【ICNP 2021】怒赞!上海交大团队先于谷歌提出光电混合数据中心慢切换方案
2023-05-10
【ICNP 2021】基于弱监督学习的ISP自助BGP异常检测
2023-05-10
【微软】MSCCL Github仓库介绍
2023-02-20
标签列表
PFC
(3)
流量控制
(6)
拥塞控制
(20)
网络拓扑
(8)
RDMA
(42)
TCP/IP
(21)
CXL
(5)
思科
(5)
交换机芯片
(5)
数据中心网络
(11)
英伟达
(5)
Infiniband手册
(8)
NSDI
(12)
SIGCOMM
(22)
华为
(5)
HPCC
(5)
交换机
(8)
数据中心
(4)
RoCE
(7)
存储
(11)
Memory Fabric
(4)
NS3
(8)
超算
(5)
MPI
(10)
集合通信库
(4)
有话要说...