软件定义芯片-igbt和ipm及其应用电路

5.3软件定义芯片在AI计算中,芯片是承载计算功能的基础部件,软件是实现AI的核心。这里的软件即是为了实现不同目标的AI任务,所需要的AI算法。对于复杂的AI任务,甚至需要将多种不同类型的AI算法组合在一起。即使是同一类型的AI算法,也会因为具体任务的计算精度、性能和能效等需求不同,具有不同计算参数。因此, AI芯片必须具备一个重要特性:能够实时动态改变功能,满足软件不断变化的计算需求,即“软件定义芯片”。通用处理器如CPU、GPU,缺乏针对AI算法的专用计算、存储单元设计,功耗过大,能效较低;专用芯片(ASIC)功能单一,难以适应灵活多样的AI任务;现场可编程门阵列(FPGA)尽管可以通过编程重构为不同电路结构,但是重构的时间开销过大,而且过多的冗余逻辑导致其功耗过高。以上传统芯片都难以实现AI芯片需要的“软件定义芯片”这一特性。可重构计算技术允许硬件架构和功能随软件变化而变化,具备处理器的灵活性和专用集成电路的高性能和低功耗,是实现“软件定义芯片”的核心,被公认为是突破性的下一代集成电路技术。清华大学微电子所设计的AI芯片(代号Thinker [Shouyi17, Shouyi18]),采用可重构计算架构,能够支持卷积神经网络、全连接神经网络和递归神经网络等多种AI算法。Thinker芯片通过三个层面的可重构计算技术,来实现“软件定义芯片”,最高能量效率达到了5.09TOPS/W : 1.计算阵列重构:Thinker芯片的计算阵列由多个并行计算单元互连而成。每个计算单元可以根据算法所需要的基本算子不同而进行功能重构。此外,在复杂AI任务中,多种AI算法的计算资源需求不同,因此Thinker芯片支持计算阵列的按需资源划分以提高资源利用率和能量效率。 2.存储带宽重构:Thinker芯片的片上存储带宽能够根据AI算法的不同而进行重构。存储内的数据分布会随着带宽的改变而调整,以提高数据复用性和计算并行度,提高了计算吞吐和能量效率。 3.数据位宽重构:16比特数据位宽足以满足绝大多数应用的精度需求,对于一些精度要求不高的场景,甚至8比特数据位宽就已经足够。为了满足AI算法多样的精度需求,Thinker芯片的计算单元支持高低(16/8比特)两种数据位宽重构。高比特模式下计算精度提升,低比特模式下计算单元吞吐量提升进而提高性能。可重构计算技术作为实现“软件定义芯片”的重要技术,非常适合应用于AI芯片设计当中。采用可重构计算技术之后,软件定义的层面不仅仅局限于功能这一层面。算法的计算精度、性能和能效等都可以纳入软件定义的范畴。可重构计算技术借助自身实时动态配置的特点,实现软硬件协同设计,为AI芯片带来了极高的灵活度和适用范围。 Technology TSMC 65nm LP Supply 0.67V~1.2V Area 4.4mm*4.4mm SRAM 348KB Frequency 10~200MHz Peak performance 409.6GOPS Power 4mW~447mW Energy efficiency 1.6TOSP/W~5.09TOPS/W 5. AI芯片架构设计趋势
pdf 文件大小:4.01MB