Show HN: 나는 9M speech model을 훈련시켜 Mandarin 억양을 고쳤다
발행: (2026년 1월 31일 오전 09:51 GMT+9)
1 분 소요
원문: Hacker News
Source: Hacker News
모델 개요
이 모델을 만든 이유는 성조가 제 구어 만다린에 큰 방해가 되고, 제 실수를 신뢰성 있게 듣지 못하기 때문입니다.
It’s a 9M Conformer‑CTC model trained on ~300 h (AISHELL + Primewords), quantized to INT8 (11 MB), and runs 100 % in‑browser via ONNX Runtime Web.
The model grades per‑syllable pronunciation + tones using a Viterbi force algorithm.