[TCAS-I'24] HDSuper

HDSuper: High-Quality and High Computational Utilization Edge Super-Resolution Accelerator With Hardware-Algorithm Co-Design Techniques

Xin Zhao, et.al. on April 1, 2024
doi.org
obsidian에서 수정하기

Abstract

초해상도(SR) 기술은 저화질 이미지에서 고화질 이미지를 생성하는 데 사용됩니다. 다양한 신경망은 SR 가속기에서 뛰어난 이미지 재구성 품질을 입증했습니다. 그러나 SR 네트워크를 엣지 디바이스에 배포하는 것은 알고리즘 매개변수, 계산 복잡성 및 외부 메모리 접근으로 인한 자원 및 전력 소비로 인해 제한됩니다. 이 연구는 하드웨어 알고리즘 공동 설계 기술을 탐구하여 경량의 초해상도 네트워크(LSR)와 효율적이고 고품질의 SR 가속기 HDSuper를 포함하는 종단 간 플랫폼을 제공합니다. 알고리즘 설계를 위해, 하드웨어 제약을 고려하여 네트워크 크기와 계산 복잡성을 줄이기 위해 개선된 깊이별 분리 합성곱과 픽셀 셔플 레이어가 개발되었습니다. 또한, 개선된 채널 주의(CA) 블록은 이미지 재구성 품질을 향상시킵니다. 하드웨어 가속기 설계를 위해, 다양한 연산자를 높은 계산 활용도로 지원하기 위해 효율적인 평면화 및 할당(F-A) 매핑 전략과 결합된 통합 컴퓨팅 코어(UCC)를 설계했습니다. 또한, 하드웨어 아키텍처의 외부 메모리 접근을 줄이기 위해 패치 컴퓨팅 방식을 설계했습니다. 평가 결과, 제안된 알고리즘은 <37.44dB PSNR>로 고품질 이미지 재구성을 달성합니다. 마지막으로, FPGA 시연과 UMC 55nm에서의 ASIC 레이아웃은 최신 기술과 비교하여 가장 낮은 하드웨어 자원으로 낮은 전력 소비(<2.08 W 및 152 mW>)를 달성합니다.

Figure

figure 1 figure 1

figure 2 figure 2

figure 3 figure 3

figure 4 figure 4

figure 5 figure 5

figure 6 figure 6

figure 7 figure 7

figure 8 figure 8

figure 9 figure 9

figure 10 figure 10

figure 11 figure 11

figure 12 figure 12

figure 13 figure 13

figure 14 figure 14

figure 15 figure 15

figure 16 figure 16

figure 17 figure 17

Table

table I table I

table II table II

table III table III

table IV table IV

table V table V