[HPCA'17] FlexFlow

FlexFlow: A Flexible Dataflow Accelerator Architecture for Convolutional Neural Networks

Wenyan Lu, et.al. on February 1, 2017
doi.org
obsidian에서 수정하기

Abstract

컨볼루션 신경망(CNN)은 매우 연산 집약적입니다. 최근 CNN 내재적 병렬성을 기반으로 하는 많은 CNN 가속기가 제안되고 있습니다. 그러나 컴퓨팅 엔진이 지원하는 병렬 유형과 CNN 워크로드의 지배적인 병렬 유형 사이에 큰 불일치가 있는 것으로 나타났습니다. 이러한 불일치는 기존 가속기의 리소스 활용도를 심각하게 저하시킵니다. 이 논문에서는 이러한 불일치를 완화하기 위해 특징 맵, 뉴런, 시냅스 병렬 처리 간의 상호 보완적인 효과를 활용할 수 있는 유연한 데이터 흐름 아키텍처(FlexFlow)를 제안합니다. 6개의 일반적인 실제 워크로드로 설계를 평가한 결과, 3개의 최신 가속기 아키텍처에 비해 2~10배의 성능 속도 향상과 2.5~10배의 전력 효율 향상을 달성했습니다. 한편, FlexFlow는 컴퓨팅 엔진 규모가 커짐에 따라 확장성이 뛰어납니다.

Figure

figure 1 figure 1

figure 2 figure 2

figure 3 figure 3

figure 4 figure 4

figure 5 figure 5

figure 6 figure 6

figure 7 figure 7

figure 8 figure 8

figure 9 figure 9

figure 10 figure 10

figure 11 figure 11

figure 12 figure 12

figure 14 figure 14

figure 15 figure 15

figure 16 figure 16

figure 17 figure 17

figure 19 figure 19

Table

table 1 table 1

table 2 table 2

table 3 table 3

table 4 table 4

table 6 table 6

table 7 table 7