Show HN: Andrej Karpathy의 microgpt.py를 C99 microgpt.c로 – 4,600배 빠르게
Source: Hacker News
MicroGPT-C
제로 의존성, 순수 C99 구현의 GPT 스타일 문자 수준 언어 모델.
이 알고리즘은 Andrej Karpathy의 microgpt.py와 정확히 일치합니다 — 동일한 아키텍처, 동일한 학습 루프, 동일한 샘플링 — 하지만 선택적인 컴파일러 기반 SIMD 자동 벡터화를 통해 네이티브 코드로 컴파일되어 학습 및 추론 속도가 크게 빨라집니다.
20 ms 만에 GPT를 학습하고, 마이크로초 단위로 이름을 생성합니다. 파이썬도, PyTorch도, GPU도 필요 없습니다.
이것이 무엇인가?
MicroGPT‑C는 GPT(Generative Pre‑trained Transformer)의 최소하고 가독성 높은 구현입니다 — ChatGPT 뒤에 있는 동일한 모델 계열이지만 핵심 알고리즘만 남겨두었습니다. 문자 수준의 작은 언어 모델을 학습시켜 처음부터 현실적인 인간 이름을 생성하도록 합니다.
목표는 교육 및 실험입니다: 프레임워크 추상화 없이 가장 낮은 수준에서 어텐션, 소프트맥스, Adam 옵티마이저, 역전파가 어떻게 동작하는지 이해합니다.
대상 독자 및 가치
| 대상 독자 | 가치 |
|---|---|
| 학생 및 교육자 | 프레임워크 마법 없이 가독성 있는 C 코드로 어텐션, 소프트맥스, Adam, 역전파를 학습 |
| 임베디드 / 엣지 엔지니어 | 전체 모델이 *) , Enjector Software Ltd.에 들어맞음 (원문이 불완전함) |