[Paper] 적응형 임계값 기반 방법을 이용한 eye-tracking 데이터에서 fixation 및 saccade 식별

발행: (2025년 12월 30일 오전 09:58 GMT+9)
10 min read
원문: arXiv

Source: arXiv - 2512.23926v1

개요

이 논문은 눈‑추적 연구에서 놀라울 정도로 흔히 발생하는 문제를 다룹니다: 자동으로 fixations(눈이 비교적 정지해 있는 경우)와 saccades(빠른 눈 움직임)를 구분합니다. 저자들은 일반적인 “one‑size‑fits‑all” 속도 또는 분산 임계값이 데이터가 잡음이 많거나 과제/참가자가 다를 때 취약할 수 있음을 보여줍니다. 그들은 각 기록에 대해 결정 경계를 자동으로 조정하는 경량의 적응형 임계값 방법을 제안하여 분류 정확도와 견고성을 크게 향상시킵니다.

주요 기여

  • Adaptive threshold framework: 고정 및 급속 눈 움직임 탐지를 두 상태 마코프 과정으로 공식화하고, 허위 상태 변화를 최소화하는 임계값을 선택하는 간단한 K‑ratio 목표 함수를 도출함.
  • Integration with three classic algorithms: 적응형 방식을 속도, 각속도, 그리고 분산 기반 탐지기에 적용하여 전반적으로 작동함을 입증함.
  • Comprehensive evaluation: 자유 시청 및 시각 탐색 데이터셋에서 다중 임계값 “골드 스탠다드”와 비교 벤치마크를 수행하여 정확도, 정밀도/재현율, 그리고 노이즈 내성을 측정함.
  • Noise‑robustness insights: 적응형 분산 임계값이 극심한 픽셀 수준 노이즈(σ = 50 px)에서도 정확도 >81 %를 유지하는 반면, 고정 임계값은 정확도가 20 % 이하로 급락할 수 있음을 보여줌.
  • Practical guidance: 데이터 품질 및 고정점 탐지와 급속 눈 움직임 탐지 중 어느 것이 우선인지에 따라 적절한 탐지기와 튜닝 전략을 선택할 수 있도록 결정 매트릭스를 제공함.

방법론

  1. Markovian model of gaze – 눈‑시선 시계열을 두 개의 숨겨진 상태(고정, 급속 이동) 시퀀스로 취급한다. 관측된 지표(예: 순간 속도)는 고정 상태일 때 하나의 분포를, 급속 이동 상태일 때 다른 분포를 따른다고 가정한다.
  2. K‑ratio objective – 후보 임계값 T에 대해 알고리즘은 상태가 전환되는 횟수(예: 고정 → 급속 이동 또는 그 반대)를 계산한다. 최적의 T는 관측된 전환 횟수와 이론적 최소값의 비율을 최소화하여 불필요한 전환을 “평탄화”한다.
  3. Adaptive pipeline
    • 원시 시선 샘플에 대해 선택된 지표(속도, 각속도, 또는 분산)를 계산한다.
    • 가능한 임계값 범위를 탐색하고 각 값에 대해 K‑비율을 평가한 뒤, 가장 낮은 값을 가진 임계값을 선택한다.
    • 선택된 임계값을 사용해 표준 후처리 단계(예: 최소 고정 지속 시간)를 적용한다.
  4. Evaluation – 두 가지 작업 유형에 대해 적응형 탐지기를 다중 임계값 기준(전체 수동 라벨링에서 도출)과 비교하고, 강인성을 테스트하기 위해 점진적으로 증가하는 수준의 합성 가우시안 노이즈를 추가하였다.

결과 및 발견

탐지기베이스라인(클린 데이터) 정확도σ = 50 px (고정) 정확도σ = 50 px (적응형) 정확도
Velocity (속도)90–93 %< 20 %≈ 78 %
Angular velocity (각속도)88–91 %< 25 %≈ 74 %
Dispersion (분산)85–89 %≈ 55 %> 81 %
  • 베이스라인: 세 탐지기 모두 깨끗한 녹음에서는 좋은 성능을 보이며, Velocity가 가장 높은 정확도를 기록합니다.
  • 노이즈 민감도: 고정 임계값을 사용할 경우 성능이 급격히 저하되지만, 적응형 방식은 손실된 성능의 대부분을 회복합니다.
  • 정밀도‑재현율 트레이드오프: 적응형 Dispersion 임계값은 고정 시선(fixation) 검출에서 높은 재현율을 보이지만, 일부 급속 안구 움직임(saccade)을 놓쳐 정밀도가 다소 낮아집니다. 이는 시선 통계가 더 중요한 실제 사용 사례와 일치합니다.

실용적 시사점

  • 플러그‑앤‑플레이 개선: 적응형 임계값 설정 단계는 계산 비용이 적으며(간단한 그리드 검색) 기존 눈추적 파이프라인(e.g., PyGaze, EyeLink SDK)에 핵심 검출기를 재설계하지 않고도 추가할 수 있다.
  • 저가 하드웨어에 대한 견고성: 소비자용 눈추적기는 종종 노이즈가 많은 데이터를 생성한다; 적응형 분산 임계값을 사용하면 분류를 활용 가능하게 유지할 수 있어, 웹 기반 UX 연구, AR/VR 프로토타입, 실시간 시선 제어 인터페이스 등에 눈추적을 적용할 수 있다.
  • 작업별 튜닝: 개발자는 적절한 검출기‑임계값 조합을 선택하여 고정점 탐지(예: UI 레이아웃을 위한 히트맵 생성) 또는 급속 움직임 탐지(예: 읽기 속도 분석)를 우선시할 수 있다.
  • 표준화: K‑비율 최소화를 설정 가능한 모듈로 공개함으로써, 연구 도구는 원시 데이터와 함께 재현 가능한 “유효 임계값”을 보고할 수 있어 연구 간 비교 가능성을 향상시킨다.

제한 사항 및 향후 연구

  • 두 상태 가정: 마코프 모델은 모든 안구 움직임을 고정(fixation) 또는 급속운동(saccade)으로만 간주하고, 마이크로 급속운동, 부드러운 추적, 깜박임 등을 무시합니다. 이러한 현상은 특정 분야(예: 스포츠 분석)에서 중요할 수 있습니다.
  • 임계값 탐색 세분성: 현재 구현은 균일한 스윕을 사용합니다; 보다 스마트한 최적화(예: 베이지안 탐색)를 적용하면 매우 고주파 데이터 스트림의 실행 시간을 줄일 수 있습니다.
  • 다른 지표로의 일반화: 본 연구는 세 가지 고전적인 탐지기에 초점을 맞췄으며, 적응형 스킴을 머신러닝 기반 분류기(예: 원시 시선 히트맵에 대한 CNN)로 확장하는 것은 아직 미해결 과제입니다.
  • 실제 환경 검증: 실험은 실험실 데이터셋을 사용해 수행되었으며, 실제 환경에서의 녹화(모바일 안구 추적기, VR 헤드셋 등)를 테스트하면 견고성을 더욱 확인할 수 있습니다.

핵심 요약: 깨끗한 고정/급속운동 라벨에 의존하는 애플리케이션(UX 연구, 보조 기술, 몰입형 인터페이스 등)을 구축한다면, 이 적응형 임계값 단계를 추가함으로써 데이터가 완벽하지 않을 때도 신뢰성을 크게 향상시킬 수 있습니다.

저자

  • Charles Oriioma
  • Josef Krivan
  • Rujeena Mathema
  • Pedro G. Lind
  • Alexander Szorkovszky
  • Shailendra Bhandari

Source: (source link not provided)

논문 정보

  • arXiv ID: 2512.23926v1
  • 분류: cs.NE, nlin.CD
  • 발행일: 2025년 12월 30일
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »