[논문] Aperon 기술 보고서: 고차원 근사 최근접 이웃을 위한 계층적 포인터 없는 탄젠트 로컬 탐색

발행: (2026년 6월 8일 AM 05:06 GMT+9)
3 분 소요
원문: arXiv

출처: arXiv - 2606.08813v1

개요

우리는 Aperon 벡터 메모리 시스템의 핵심 벡터 인덱싱 및 후보 생성 프레임워크인 HNTL(Hierarchical No‑pointer Tangent‑Local)을 소개한다. 근접 그래프(예: HNSW)는 메모리 오버헤드에서 큰 포인터 비용을 발생시키고, 불규칙한 메모리 접근으로 CPU 파이프라인을 정체시킨다. HNTL은 고차원 공간을 지역적이고 일관된 입자로 분할하고, 벡터를 지역 접선 공간상의 저차원 좌표로 표현한 뒤, 포인터가 없는 Block‑SoA(Structure‑of‑Arrays) 레이아웃을 사용해 순차적으로 스캔함으로써 이 문제를 해결한다. 이방성 매니폴드 데이터(d=768, N=10,000)에서 지역 PCA는 분산의 96.3%를 포착하여, HNTL이 후보 풀 크기 C=20 벡터만으로 최종 Rerank Recall@10을 1.0000에 도달하게 한다. Apple kperf CPU 성능 모니터링 유닛(PMU) 카운터를 이용한 하드웨어 프로파일링 결과, 표준 포인터 추적 그래프 탐색에 비해 NEON 자동 벡터화 C++ Block‑SoA 스캔 엔진이 3.61배 가속(벡터당 4.137 ns vs. 14.951 ns)을 보였으며, 이는 3.59배 IPC(Instruction Per Cycle)와 거의 제로에 가까운 L1/L2 데이터 캐시 미스 덕분이다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

  • cs.DC
  • cs.DB
  • cs.IR
  • cs.LG

방법론

자세한 방법론은 전체 논문을 참고하라.

실용적 함의

이 연구는 cs.DC 분야의 발전에 기여한다.

저자

  • Yong Fu

논문 정보

  • arXiv ID: 2606.08813v1
  • 분류: cs.DC, cs.DB, cs.IR, cs.LG
  • 발표일: 2026년 6월 7일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »