[HCS'18] Bit-Tactical

Bit-Tactical: Exploiting Ineffectual Computations in Convolutional Neural Networks: Which, Why, and How

A. Delmas, et.al. on March 9, 2018
doi.org
obsidian에서 수정하기

Abstract

컨볼루션 신경망(CNN)으로 추론하는 동안 0인 가중치와 활성화를 타겟팅하는 대신 다양한 가치 흐름 속성 조합을 타겟팅하면 비효율적인 작업이 2배에서 8배 이상 노출될 수 있음을 보여 줍니다. 컨볼루션 신경망(CNN)으로 추론하는 동안 0인 가중치와 활성화를 타겟팅하는 대신 다양한 가치 흐름 속성 조합을 타겟팅하면 비효율적인 작업이 2배에서 8배 이상 노출될 수 있음을 보여줍니다. 성능과 에너지 효율성을 개선하기 위해 가중치 희소성, 레이어별 정밀도 가변성, 활성화의 동적 세분화 정밀도 감소, 선택적으로 활성화의 자연 발생적 희소 유효 비트 콘텐츠를 활용하는 하드웨어 가속기인 Bit-Tactical(TCL)을 통해 실제 적용 사례를 시연해 보겠습니다. TCL은 희소 및 고밀도 CNN 모두에 이점을 제공하며, 기본적으로 컨볼루션 및 완전 연결 레이어를 모두 지원하고, 모든 활성화의 특성을 활용하여 스토리지, 통신 및 계산 수요를 줄입니다. TCL은 이점을 제공하기 위해 CNN을 변경할 필요는 없지만, 앞서 언급한 가중치 및 활성화 값 속성을 증폭시키는 모든 기술에 대해 보상을 제공합니다. 고밀도 CNN을 위한 동급의 데이터 병렬 가속기와 비교했을 때, TCL의 변형인 TCLp는 22% 더 많은 면적을 필요로 하면서도 성능이 5.05배 향상되고 에너지 효율은 2.98배 더 높습니다.

Figure

figure 1 figure 1

figure 2 figure 2

figure 4 figure 4

figure 5 figure 5

figure 6 figure 6

figure 7 figure 7

figure 8 figure 8

figure 9 figure 9

figure 10 figure 10

figure 11 figure 11

figure 12 figure 12

figure 13 figure 13

figure 14 figure 14

figure 15 figure 15

Table

table 1 table 1

table 2 table 2

table 4 table 4

table 5 table 5