[CAL'21] STONNE

STONNE: Enabling Cycle-Level Microarchitectural Simulation for DNN Inference Accelerators

Francisco Muñoz-Martínez, et.al. on July 1, 2021
doi.org
obsidian에서 수정하기

Abstract

심층 신경망(DNN)의 추론 절차를 가속화하기 위한 특수 아키텍처의 설계는 오늘날 급성장하고 있는 연구 분야입니다. 1세대 경직된 가속기 제안은 고밀도 DNN에 맞춘 단순 고정 데이터 흐름을 사용했지만, 최근의 아키텍처는 다양한 계층 유형, 차원 및 희소성을 효율적으로 지원할 수 있는 유연성을 주장하고 있습니다. 이러한 가속기의 복잡성이 증가함에 따라 현재 사용되고 있는 분석 모델은 실행 시간의 미묘한 차이를 포착할 수 없어 많은 경우 부정확한 결과를 초래합니다. 유니티는 모든 상위 DNN 프레임워크에 가속기 장치로 연결할 수 있고, 수정되지 않은 실제 고밀도 및 희소 DNN 모델에 대한 전체 모델 평가를 수행할 수 있는 최첨단 경직 및 유연 DNN 추론 가속기를 위한 사이클 레벨 마이크로 아키텍처 시뮬레이터인 STONNE을 소개합니다.

Figure

Table