Show HN: Andrej Karpathy 的 microgpt.py 转为 C99 microgpt.c – 提升 4,600 倍
Source: Hacker News
MicroGPT-C
一个 零依赖、纯 C99 实现的 GPT 风格字符级语言模型。
该算法忠实地匹配了 Andrej Karpathy 的 microgpt.py —— 相同的架构、相同的训练循环、相同的采样 —— 但编译为本机代码,并可选使用编译器驱动的 SIMD 自动向量化,从而显著加快训练和推理速度。
在 20 毫秒内训练一个 GPT。以微秒级生成姓名。无需 Python。无需 PyTorch。无需 GPU。
这是什么?
MicroGPT‑C 是一个极简、易读的 GPT(生成式预训练变换器)实现 —— 与 ChatGPT 背后的模型同属一族,但仅保留其核心算法。它训练一个小型字符级语言模型,从零开始学习生成逼真的人名。
目标是 教育与实验:在最底层了解注意力机制、softmax、Adam 优化器以及反向传播的工作原理,而无需任何框架抽象。
受众与价值
| 受众 | 价值 |
|---|---|
| 学生与教育者 | 在可读的 C 代码中学习注意力、softmax、Adam 和反向传播 —— 无框架魔法 |
| 嵌入式 / 边缘工程师 | 整个模型可容纳于 ), Enjector Software Ltd. |