논문 아카이브

「논문 아카이브」

[ISSCC'15] K-Brain

A 1.93TOPS/W scalable deep learning/inference processor with tetra-parallel MIMD architecture for big-data applications

Abstract 최근 딥러닝(DL)은 이미지 검색에서 높은 정확도로 빅데이터 분석을 위한 인기 있는 접근 방식이 되었습니다. 그림 4.6.1에서 알 수 있듯이, 텍스트, 2D 이미지 및 동작 인식과 같은 다양한 애플리케이션이 DL을 사용하고 있으며, 이는 최고의 인식 정확도 덕분입니다. DL에는 라벨이 있는 데이터로 학습하는 지도 학습 DL과 라벨이...

[PACT'15] PENCIL

PENCIL: A Platform-Neutral Compute Intermediate Language for Accelerator Programming

Abstract PENCIL, a rigorously-defined subset of GNU C99-enriched with additional language constructs-that enables compilers to exploit parallelism and produce highly optimized code when targeting ...

[doi'15] Deep Compression

Deep Compression: Compressing Deep Neural Network with Pruning, Trained Quantization and Huffman Coding

Abstract This work introduces "deep compression", a three stage pipeline: pruning, trained quantization and Huffman coding, that work together to reduce the storage requirement of neural networks ...

[ISCA'15] ShiDianNao

ShiDianNao: Shifting vision processing closer to the sensor

en kr Abstract (서론): 최근 몇 년 동안 신경망 가속기는 중요한 인식 및 마이닝 애플리케이션 범주 내에서 폭넓은 애플리케이션 범위에 대해 높은 에너지 효율과 높은 성능을 달성할 수 있음이 입증되었습니다. (한계): 그럼에도 불구하고 이러한 가속기의 에너지 효율성과 성능은 여전히 메모리 접근에 의해 제한됩니다. (방법론): 본 논문...

[NIPS'15] Song Han, et.al.

Learning both Weights and Connections for Efficient Neural Network

Abstract A method to reduce the storage and computation required by neural networks by an order of magnitude without affecting their accuracy by learning only the important connections, and prunes...

[ICCV'15] FlowNet

FlowNet: Learning Optical Flow with Convolutional Networks

Abstract This paper constructs CNNs which are capable of solving the optical flow estimation problem as a supervised learning task, and proposes and compares two architectures: a generic architect...

[ASPLOS'15] PolyMage

PolyMage: Automatic Optimization for Image Processing Pipelines

Abstract This is the first model-driven compiler for image processing pipelines that performs complex fusion, tiling, and storage optimization automatically and is up to 1.81x better than that ach...

[arXiv'15] PLuTo

PLuTo: A Practical and Fully Automatic Polyhedral Program Optimization System

Abstract A fully automatic polyhedral source-to-source transformation framework that can optimize regular programs for parallelism and locality simultaneously simultaneously and addresses generati...

[MICRO'14] DaDianNao

DaDianNao: A Machine-Learning Supercomputer

Abstract 많은 기업들이 소비자나 산업을 위해 대량의 데이터를 정교하게 처리하기 위한 머신 러닝 알고리즘을 기반으로 하는 서비스를 배포하고 있습니다. 이러한 최신 기술과 가장 인기 있는 머신 러닝 알고리즘은 컨볼루션 신경망(CNN)과 심층 신경망(DNN)으로, 계산 및 메모리 집약적인 것으로 알려져 있습니다. 최근에는 높은 계산 용량/면적 비...

[PRL'14] Xun Sun, et.al.

Real-time local stereo via edge-aware disparity propagation

Abstract Semantic Scholar extracted view of "Real-time local stereo via edge-aware disparity propagation" by Xun Sun et al. Figure figure 1 figure 2 figure 3 figure 4 figure 5 figure ...