Abstract
컨볼루션 신경망(CNN)으로 추론하는 동안 0인 가중치와 활성화를 타겟팅하는 대신 다양한 가치 흐름 속성 조합을 타겟팅하면 비효율적인 작업이 2배에서 8배 이상 노출될 수 있음을 보여 줍니다. 컨볼루션 신경망(CNN)으로 추론하는 동안 0인 가중치와 활성화를 타겟팅하는 대신 다양한 가치 흐름 속성 조합을 타겟팅하면 비효율적인 작업이 2배에서 8배 이상 노출될 수 있음을 보여줍니다. 성능과 에너지 효율성을 개선하기 위해 가중치 희소성, 레이어별 정밀도 가변성, 활성화의 동적 세분화 정밀도 감소, 선택적으로 활성화의 자연 발생적 희소 유효 비트 콘텐츠를 활용하는 하드웨어 가속기인 Bit-Tactical(TCL)을 통해 실제 적용 사례를 시연해 보겠습니다. TCL은 희소 및 고밀도 CNN 모두에 이점을 제공하며, 기본적으로 컨볼루션 및 완전 연결 레이어를 모두 지원하고, 모든 활성화의 특성을 활용하여 스토리지, 통신 및 계산 수요를 줄입니다. TCL은 이점을 제공하기 위해 CNN을 변경할 필요는 없지만, 앞서 언급한 가중치 및 활성화 값 속성을 증폭시키는 모든 기술에 대해 보상을 제공합니다. 고밀도 CNN을 위한 동급의 데이터 병렬 가속기와 비교했을 때, TCL의 변형인 TCLp는 22% 더 많은 면적을 필요로 하면서도 성능이 5.05배 향상되고 에너지 효율은 2.98배 더 높습니다.
Figure
figure 1
figure 2
figure 4
figure 5
figure 6
figure 7
figure 8
figure 9
figure 10
figure 11
figure 12
figure 13
figure 14
figure 15
Table
table 1
table 2
table 4
table 5