[Paper] 적응형 임계값 기반 방법을 이용한 eye-tracking 데이터에서 fixation 및 saccade 식별
Source: arXiv - 2512.23926v1
개요
이 논문은 눈‑추적 연구에서 놀라울 정도로 흔히 발생하는 문제를 다룹니다: 자동으로 fixations(눈이 비교적 정지해 있는 경우)와 saccades(빠른 눈 움직임)를 구분합니다. 저자들은 일반적인 “one‑size‑fits‑all” 속도 또는 분산 임계값이 데이터가 잡음이 많거나 과제/참가자가 다를 때 취약할 수 있음을 보여줍니다. 그들은 각 기록에 대해 결정 경계를 자동으로 조정하는 경량의 적응형 임계값 방법을 제안하여 분류 정확도와 견고성을 크게 향상시킵니다.
주요 기여
- Adaptive threshold framework: 고정 및 급속 눈 움직임 탐지를 두 상태 마코프 과정으로 공식화하고, 허위 상태 변화를 최소화하는 임계값을 선택하는 간단한 K‑ratio 목표 함수를 도출함.
- Integration with three classic algorithms: 적응형 방식을 속도, 각속도, 그리고 분산 기반 탐지기에 적용하여 전반적으로 작동함을 입증함.
- Comprehensive evaluation: 자유 시청 및 시각 탐색 데이터셋에서 다중 임계값 “골드 스탠다드”와 비교 벤치마크를 수행하여 정확도, 정밀도/재현율, 그리고 노이즈 내성을 측정함.
- Noise‑robustness insights: 적응형 분산 임계값이 극심한 픽셀 수준 노이즈(σ = 50 px)에서도 정확도 >81 %를 유지하는 반면, 고정 임계값은 정확도가 20 % 이하로 급락할 수 있음을 보여줌.
- Practical guidance: 데이터 품질 및 고정점 탐지와 급속 눈 움직임 탐지 중 어느 것이 우선인지에 따라 적절한 탐지기와 튜닝 전략을 선택할 수 있도록 결정 매트릭스를 제공함.
방법론
- Markovian model of gaze – 눈‑시선 시계열을 두 개의 숨겨진 상태(고정, 급속 이동) 시퀀스로 취급한다. 관측된 지표(예: 순간 속도)는 고정 상태일 때 하나의 분포를, 급속 이동 상태일 때 다른 분포를 따른다고 가정한다.
- K‑ratio objective – 후보 임계값 T에 대해 알고리즘은 상태가 전환되는 횟수(예: 고정 → 급속 이동 또는 그 반대)를 계산한다. 최적의 T는 관측된 전환 횟수와 이론적 최소값의 비율을 최소화하여 불필요한 전환을 “평탄화”한다.
- Adaptive pipeline –
- 원시 시선 샘플에 대해 선택된 지표(속도, 각속도, 또는 분산)를 계산한다.
- 가능한 임계값 범위를 탐색하고 각 값에 대해 K‑비율을 평가한 뒤, 가장 낮은 값을 가진 임계값을 선택한다.
- 선택된 임계값을 사용해 표준 후처리 단계(예: 최소 고정 지속 시간)를 적용한다.
- Evaluation – 두 가지 작업 유형에 대해 적응형 탐지기를 다중 임계값 기준(전체 수동 라벨링에서 도출)과 비교하고, 강인성을 테스트하기 위해 점진적으로 증가하는 수준의 합성 가우시안 노이즈를 추가하였다.
결과 및 발견
| 탐지기 | 베이스라인(클린 데이터) 정확도 | σ = 50 px (고정) 정확도 | σ = 50 px (적응형) 정확도 |
|---|---|---|---|
| Velocity (속도) | 90–93 % | < 20 % | ≈ 78 % |
| Angular velocity (각속도) | 88–91 % | < 25 % | ≈ 74 % |
| Dispersion (분산) | 85–89 % | ≈ 55 % | > 81 % |
- 베이스라인: 세 탐지기 모두 깨끗한 녹음에서는 좋은 성능을 보이며, Velocity가 가장 높은 정확도를 기록합니다.
- 노이즈 민감도: 고정 임계값을 사용할 경우 성능이 급격히 저하되지만, 적응형 방식은 손실된 성능의 대부분을 회복합니다.
- 정밀도‑재현율 트레이드오프: 적응형 Dispersion 임계값은 고정 시선(fixation) 검출에서 높은 재현율을 보이지만, 일부 급속 안구 움직임(saccade)을 놓쳐 정밀도가 다소 낮아집니다. 이는 시선 통계가 더 중요한 실제 사용 사례와 일치합니다.
실용적 시사점
- 플러그‑앤‑플레이 개선: 적응형 임계값 설정 단계는 계산 비용이 적으며(간단한 그리드 검색) 기존 눈추적 파이프라인(e.g., PyGaze, EyeLink SDK)에 핵심 검출기를 재설계하지 않고도 추가할 수 있다.
- 저가 하드웨어에 대한 견고성: 소비자용 눈추적기는 종종 노이즈가 많은 데이터를 생성한다; 적응형 분산 임계값을 사용하면 분류를 활용 가능하게 유지할 수 있어, 웹 기반 UX 연구, AR/VR 프로토타입, 실시간 시선 제어 인터페이스 등에 눈추적을 적용할 수 있다.
- 작업별 튜닝: 개발자는 적절한 검출기‑임계값 조합을 선택하여 고정점 탐지(예: UI 레이아웃을 위한 히트맵 생성) 또는 급속 움직임 탐지(예: 읽기 속도 분석)를 우선시할 수 있다.
- 표준화: K‑비율 최소화를 설정 가능한 모듈로 공개함으로써, 연구 도구는 원시 데이터와 함께 재현 가능한 “유효 임계값”을 보고할 수 있어 연구 간 비교 가능성을 향상시킨다.
제한 사항 및 향후 연구
- 두 상태 가정: 마코프 모델은 모든 안구 움직임을 고정(fixation) 또는 급속운동(saccade)으로만 간주하고, 마이크로 급속운동, 부드러운 추적, 깜박임 등을 무시합니다. 이러한 현상은 특정 분야(예: 스포츠 분석)에서 중요할 수 있습니다.
- 임계값 탐색 세분성: 현재 구현은 균일한 스윕을 사용합니다; 보다 스마트한 최적화(예: 베이지안 탐색)를 적용하면 매우 고주파 데이터 스트림의 실행 시간을 줄일 수 있습니다.
- 다른 지표로의 일반화: 본 연구는 세 가지 고전적인 탐지기에 초점을 맞췄으며, 적응형 스킴을 머신러닝 기반 분류기(예: 원시 시선 히트맵에 대한 CNN)로 확장하는 것은 아직 미해결 과제입니다.
- 실제 환경 검증: 실험은 실험실 데이터셋을 사용해 수행되었으며, 실제 환경에서의 녹화(모바일 안구 추적기, VR 헤드셋 등)를 테스트하면 견고성을 더욱 확인할 수 있습니다.
핵심 요약: 깨끗한 고정/급속운동 라벨에 의존하는 애플리케이션(UX 연구, 보조 기술, 몰입형 인터페이스 등)을 구축한다면, 이 적응형 임계값 단계를 추가함으로써 데이터가 완벽하지 않을 때도 신뢰성을 크게 향상시킬 수 있습니다.
저자
- Charles Oriioma
- Josef Krivan
- Rujeena Mathema
- Pedro G. Lind
- Alexander Szorkovszky
- Shailendra Bhandari
Source: (source link not provided)
논문 정보
- arXiv ID: 2512.23926v1
- 분류: cs.NE, nlin.CD
- 발행일: 2025년 12월 30일
- PDF: Download PDF