[ISSCC'15] K-Brain

A 1.93TOPS/W scalable deep learning/inference processor with tetra-parallel MIMD architecture for big-data applications

Seongwook Park, et.al. on December 1, 2015
doi.org
obsidian에서 수정하기

Abstract

최근 딥러닝(DL)은 이미지 검색에서 높은 정확도로 빅데이터 분석을 위한 인기 있는 접근 방식이 되었습니다. 그림 4.6.1에서 알 수 있듯이, 텍스트, 2D 이미지 및 동작 인식과 같은 다양한 애플리케이션이 DL을 사용하고 있으며, 이는 최고의 인식 정확도 덕분입니다. DL에는 라벨이 있는 데이터로 학습하는 지도 학습 DL과 라벨이 없는 데이터로 학습하는 비지도 학습 DL의 두 가지 유형이 있습니다. 비지도 학습 DL의 경우, 대부분의 학습 시간은 제한된 볼츠만 머신을 위한 대규모 반복적인 가중치 업데이트에 사용됩니다 [2]. -100MB 훈련 데이터셋의 경우, 100 TOP 이상의 계산 능력과 약 40GB/s의 IO 및 SRAM 데이터 대역폭이 필요합니다. 따라서 3.4GHz CPU는 -100K 입력 벡터 데이터셋으로 학습하는 데 10시간 이상이 필요하며, 인식에는 약 1초가 걸리므로 실시간 처리와는 거리가 멉니다. 따라서 DL은 일반적으로 서버에서 학습 기능을 갖춘 클라우드 서버나 고성능 GPU 환경을 사용하여 수행됩니다. 그러나 스마트폰과 태블릿과 같은 스마트 휴대용 기기의 광범위한 사용은 개인 장치에서 사진 태깅과 같은 기계 학습을 통한 빅데이터 처리를 필요로 하는 많은 애플리케이션을 초래합니다. 휴대용 기기에서 사용자 중심의 패턴 인식을 실현하기 위해 고성능 및 에너지 효율적인 DL/DI(딥 인퍼런스) 프로세서가 필요합니다.