前沿技术背景 前沿技术背景

前沿技术

通用GPU

通用GPU

在生成式人工智能时代,算法、模型、算子的创新层出不穷,GPGPU凭借其高度通用的并行计算能力和成熟软件生态,能灵活高效地适应快速迭代的大规模复杂计算任务,适应AI模型快速迭代和多样化的计算需求,成为智算芯片的首选架构。

三维堆叠存储

三维堆叠存储

三维堆叠存储(3D DRAM)是一种将存储单元垂直堆叠在逻辑单元上方的新型存储器技术,其技术原理是利用创新的三维堆叠结构,结合硅通孔TSV、基于 Wafer-on-Wafer的混合键合技术等,突破传统平面DRAM的物理限制。3D DRAM可在成熟工艺制程下,实现超高带宽和超低功耗,同时通过层数堆叠大幅提升存储密度。AI计算需要高速处理海量数据,3D DRAM与AI芯片结合实现近存计算,能有效解决“内存墙”瓶颈,为AI训练和推理提供更快的数据吞吐和能效。

3.5D高级封装技术

3.5D高级封装技术

3.5D先进封装技术同时应用2.5D和3D封装,可将多个存储器和逻辑芯片集成到单一封装中,相比传统的分离式芯片组设计,集成式封装芯片组速度更快、效率更高、适应性更强,同时生产成本更低。先进封装是后摩尔时代实现系统级芯片性能跃升的关键载体,通过异质集成与硅中介层技术,灵活整合不同工艺节点的芯片,实现超高带宽和低延迟互连,在性能、能效、成本上形成组合优势,为AI芯片带来极致算力能效比,助力AI算力升级浪潮。

高速互联网络

高速互联网络

AI计算已经进入通用计算(CPU)和智能计算(GPGPU)的“系统级协同设计”新时代,CPU+GPGPU融合的超异构计算范式通过芯片级高速互联、内存一致性、异构集成等先进技术实现硬件层面的紧密融合,解决制约算力效率的关键瓶颈,以超低延迟、高带宽、统一内存模型、硬件级缓存一致性等特点为训练和推理更大更复杂的AI模型提供基石,同时推动异构计算向Chiplet与先进封装演进,从芯片设计到数据中心架构实现全面革新。

面向未来的CPU + GPGPU异构集成

面向未来的CPU + GPGPU异构集成

AI计算已经进入通用计算(CPU)和智能计算(GPGPU)的"系统协同设计"新时代,CPU-GPGPU融合的超异构计算范式通过芯片级高速互联,实现了计算资源的智能调度和数据的高效流转,为复杂AI场景提供了最佳性能功耗比。