芯片架构是指芯片设计的基本结构和组织方式,用于实现各种计算、存储和通信功能。芯片架构通常包括处理器核心、内存、输入输出接口等组成部分,这些部分的设计对芯片性能和功耗有着直接的影响,世界上主流的芯片架构主要包括x86、ARM、PowerPC和RISC-V等。

今天来介绍一个国产主流、极具优势的芯片架构——达芬奇架构:

什么是达芬奇架构?

达芬奇架构(DaVinci Architecture)是华为面向计算密集型人工智能应用研发的全新计算架构,昇腾AI处理器的AI Core即是基于此架构实现。其基本结构如图:

达芬奇架构的优势有哪些?

达芬奇架构的优势主要表现在高算力、高能效、灵活可裁剪、多种精度计算支持、高可用性和可靠性以及更高效的开发、测试和部署等方面:

1、灵活性和可扩展性:

达芬奇架构将应用程序分解成多个模块,每个模块都有特定的功能和职责,可以独立地构建、测试、部署和维护,从而更容易适应不同的业务需求和市场变化。

2、高算力和高能效:

达芬奇架构是NPU的一个部分,细分成核心的3D Cube、Vector向量计算单元、Scalar标量计算单元等,负责不同的运算任务。

达芬奇架构以高性能3D Cube计算引擎为基础,针对矩阵运算进行加速,大幅提高单位面积下的AI算力,充分激发端侧AI的运算潜能。

以两个N*N的矩阵A*B乘法为例: 如果是N个1D的MAC,需要N2的cycle数;如果是1个N2的2D MAC阵列,需要N个Cycle; 如果是1个N维3D的Cube,只需要1个Cycle。

达芬奇架构将大幅提升算力,16*16*16的3D Cube能够显著提升数据利用率,缩短运算周期,实现更快更强的AI运算。举例来说,同样是完成4096次运算,2D结构需要64行*64列才能计算,3DCube只需要16*16*16的结构就能算出。

3、支持多种精度计算:

达芬奇架构同时支持多种精度计算,支撑训练和推理两种场景的数据精度要求,实现AI的全场景需求覆盖。

4、高可用性和可靠性:

达芬奇架构通过将应用程序分解成多个小型部件,降低了系统的复杂性,从而提高了系统的稳定性和可用性。

5、更高效的开发、测试和部署:

由于每个部件都相对独立,因此可以更容易地进行单元测试和集成测试,这可以帮助开发人员更快地找到和解决问题,从而减少了开发和维护的成本。

基于达芬奇架构的应用案例有哪些?

基于“达芬奇架构”,英码科技推出了多款专业图像处理边缘计算盒子,具有性能稳定可靠、高性价比的优势,算力覆盖2~10.4TOPS,支持4~10路视频结构化,可满足智慧工地、智慧交通、智慧应急等轻量化场景的应用需求。