[CVPR'10] H. Jégou, et.al.

Aggregating local descriptors into a compact image representation

H. Jégou, et.al. on June 13, 2010
doi.org
obsidian에서 수정하기

Abstract

이 연구에서는 피셔 커널 표현의 단순화로 볼 수 있는 제한된 차원의 벡터로 로컬 이미지 설명자를 집계하는 간단하면서도 효율적인 방법을 제안하고, 차원 축소와 인덱싱 알고리즘을 공동으로 최적화하는 방법을 보여줍니다. 우리는 검색의 정확성, 효율성, 표현의 메모리 사용량이라는 세 가지 제약 조건을 함께 고려해야 하는 매우 큰 규모의 이미지 검색 문제를 다룹니다. 먼저 피셔 커널 표현을 단순화한 것으로 볼 수 있는 제한된 차원의 벡터로 로컬 이미지 설명자를 집계하는 간단하면서도 효율적인 방법을 제안합니다. 그런 다음 벡터 비교의 품질을 가장 잘 보존할 수 있도록 차원 축소와 인덱싱 알고리즘을 공동으로 최적화하는 방법을 보여줍니다. 평가 결과, 20바이트에 맞는 이미지 표현에 대한 검색 정확도가 특징 집합 접근 방식과 비슷한 수준으로, 우리의 접근 방식이 최신 기술을 훨씬 능가하는 것으로 나타났습니다. 천만 개의 이미지 데이터 세트를 검색하는 데는 약 50ms가 소요됩니다.

Figure

figure 1

figure 2

figure 3 figure 3

figure 4

figure 5

Table

table 1 table 1

table 2 table 2

table 3 table 3