A100을 살 여유가 없어서 Rust로 Surgical Weight editor를 만들었습니다.

발행: (2026년 3월 30일 PM 10:19 GMT+9)
3 분 소요
원문: Dev.to

Source: Dev.to

문제: 파인‑튜닝의 “블랙 박스”

표준 파인‑튜닝은 샷건 접근법이다: 데이터를 모델에 던지고 역전파가 올바른 뉴런에 도달하기를 바란다. 비용이 많이 들고, 느리며, 대부분이 책상 아래에 두고 있지 않은 하드웨어가 필요하다.

해결책: 외과적 가중치 편집

PickyTrain(Rust 🦀 로 작성) 은 고정된 GGUF 모델을 PTXY 라는 새로운 유동 포맷으로 “해동”한다.

  • GPU가 없나요? 문제없습니다. 전적으로 CPU에서 실행됩니다.
  • 데이터셋이 없나요? 수천 개의 예제가 필요하지 않다—올바른 “시냅스”만 찾아 살짝 조정하면 된다.
  • Rust 성능: PyO3 를 통한 Python 바인딩을 갖춘 고성능 코어; 빠르고, 메모리 안전하며, 안정적이다.

할 수 있는 일

  • 동작 미세 조정: FFN 가중치를 조정해 코딩 에이전트를 10 % 더 간결하게 만든다.
  • 환각 교정: 특정 사실이 저장된 가중치를 외과적으로 수정한다.
  • 안전 가드레일: 모든 편집은 Delta Journal에 기록된다; 롤백은 Git만큼 쉽다.

기술 스택

  • 언어: Rust (“외과칼”)
  • 바인딩: Python / PyO3 (“인터페이스”)
  • UI: 터미널에 사는 해커들을 위한 깔끔한 Curses TUI
  • 호환성: Q4_K, Q8_0, F16, 그리고 F32 GGUF 양자화 지원

로드맵 / 향후 기능

  • 활성화 히트맵: 프롬프트 실행 중 어떤 뉴런이 활성화되는지 시각화.
  • GGUF‑Bake: “수술” 결과를 표준 포맷으로 다시 내보내기.
  • LoRA 병합: 어댑터를 CPU에서 직접 가중치에 베이크.

Note: 이 프로젝트는 아직 개발 중이다. 버그나 오류가 발생할 수 있으며, 추가 기능이 계획되어 있다.

저장소

https://github.com/Ainix-dev/PickyTrain

스크린샷

Screenshot 1

Screenshot 2

Screenshot 3

0 조회
Back to Blog

관련 글

더 보기 »

[Boost]

코드가 주변 시스템을 앞설 때 Joachim Zeelmaekers 3월 30일 softwareengineering ai 댓글 추가 6분 읽기