SmartKNN v2 — 더 크고, 더 빠르고, 더 똑똑해진. 곧 출시됩니다.

발행: (2025년 12월 8일 오전 01:47 GMT+9)
6 min read
원문: Dev.to

Source: Dev.to

SmartKNN v2 — 더 크고, 더 빠르고, 더 똑똑한. 곧 출시됩니다. 표지 이미지

SmartKNN은 미친 아이디어에서 시작되었습니다:
모든 병목 현상을 없애면 K-Nearest Neighbors를 얼마나 밀어붙일 수 있을까… 병목을 받아들이는 대신 말이죠?

V1은 중요한 사실을 입증했습니다 — KNN은 여전히 프로덕션에서 사용할 수 있다.
가중치 피처, 프로토타입 압축, 최적화된 거리 규칙을 도입하면서 SmartKNN은 실제 프로덕션에 적합한 테이블 모델이 되었습니다.

이제 v2의 차례입니다. 그리고 v2는 단순한 업그레이드가 아니라… 다음 시대의 시작입니다.

SmartKNN v2에 어떤 것이 올까?

1. 네이티브 분류 지원

이제 “회귀 전용” 제한이 없습니다. SmartKNN v2는 자동으로 타깃 유형을 감지하고 지능적으로 전환합니다:

  • 분류
  • 회귀

fit() 한 번이면 → SmartKNN이 무엇을 해야 할지 압니다. 설정도, 혼란도 없습니다.

2. 더 빠른 예측 (진짜… 훨씬 빠름)

SmartKNN v2는 ANN 백엔드를 통합했지만 여기서 트위스트가 있습니다:

ANN이 가장 가까운 후보를 찾고 → SmartKNN의 뇌가 작업을 마무리합니다.

결과:

  • ANN 수준의 속도
  • SmartKNN 수준의 정확도

두 세계의 장점을 모두 누릴 수 있습니다. 이제 KNN이 느릴 필요가 없습니다.

3. 완전 벡터화

우리는 KNN을 어디서든 느리게 만드는 주요 원인인 순수 Python 루프를 제거합니다. v2는 거리 계산, 가중치 계산, 투표 모두에 완전 벡터화를 사용합니다.

결과:

  • 더 빠른 학습
  • 더 빠른 예측
  • 대규모 데이터셋에 대한 향상된 확장성

4. 더 똑똑한 피처 가중치 (MI + LR + RF 재고)

현재 SmartKNN은 다음을 혼합해서 사용합니다:

  • Mutual Information (상호 정보)
  • Linear Regression (선형 회귀)
  • Random Forest importance (랜덤 포레스트 중요도)

엄청나게 잘 작동하지만 수백만 행으로 확장되지 못합니다. v2에서는 새로운 수학 공식을 실험하고 있습니다. 이 공식은:

  • 거대한 연산이 필요 없음
  • 방대한 데이터셋에 확장 가능
  • 정확도 유지(또는 향상)

v2에 반드시 포함된다는 보장은 없지만 연구는 진행 중입니다.

SmartKNN의 철학 (여전히 변함없음)

ANN 지원과 대규모 최적화가 추가되었음에도 SmartKNN v2는 정확성을 희생하면서까지 최고 속도를 추구하지 않습니다. 우선순위는 그대로입니다:

  • 정확도
  • 해석 가능성
  • 단순성

속도 향상은 보너스일 뿐. 이번이 분류 지원 + 첫 속도 향상이며, 앞으로는 더 나아갈 것입니다.

v2 이후 — 다음은?

v2 이후, SmartKNN은 자체적인 특수 ANN 백엔드를 탑재할 예정이며, 이는 일반 ANN 라이브러리가 아닌 SmartKNN 상황에만 최적화된 것입니다. 기대 효과:

  • 예측 속도 10배 향상
  • CPU에서 부스팅 모델 수준의 지연 시간에 근접
  • 트리 모델과 달리 완전한 설명 가능성

장기 목표: 테이블형 머신러닝에 완전한 프로덕션 등급의 이웃 기반 모델을 만드는 것.

마무리 말씀

SmartKNN v2는 KNN을 재발명하는 것이 아닙니다.
올바른 엔지니어링, 수학, 지름길, 구조를 통해 KNN이 현대적인 프로덕션 모델이 될 수 있음을 증명하는 것입니다 — 장난감 수준의 베이스라인이 아니라.

지금까지 SmartKNN을 지원해 주신 모든 분들께 감사드립니다. v2가 곧 찾아옵니다. 기대해 주세요.

최신 소식 받아보기

SmartKNN 설치

pip install smart-knn

GitHub 저장소

https://github.com/thatipamula-jashwanth/smart-knn

벤치마크 페이지

https://www.kaggle.com/jashwanththatipamula

릴리스 안내

(저장소를 팔로우하면 v2가 출시될 때 알림을 받을 수 있습니다)

Back to Blog

관련 글

더 보기 »