作品提出了一個能夠支援混合精度運算的CNN硬體加速器系統設計和硬體加速器成對的混合模型的訓練、分析軟體工具,透過本作品的軟體所訓練出來的混合模型在本作品的硬體加速器上可以做到零失真。在硬體加速器方面,它能夠動態支援混合模型,高資料重複使用率讓加速器提供了優異的計算效能以及硬體使用效率。1. 本作品之混合精度硬體加速器可支援1, 2, 4和8-bit 運算
2. 本作品在Xilinx ZCU102 FPGA上能夠達到691GOPS(8-bit)/5530GOPS(1-bit)
3. 本作品首創混合精度模型演算法與訓練流程
4. 本作品首創支援bit accurate 層級的驗證針對產業應用方面,本作品的混合模型訓練工具能夠有效的減少模型的資料量,並透過本作品客製化的硬體加速器來達到運算加速的效果。本作品的軟體工具可以用來進行模型訓練或者是重新訓練,並且在訓練完成後我們也能提供相對應的硬體加速器,來符合終端的運算需求,能夠減少浮點數模型放到終端裝置運行時產生精度下降的情形。
技術成熟度:雛型
展示目的:可交易技術、商機推廣、研發成果展示
流通方式:技術授權/合作
敬請期待!