Show HN: LLMs 工作原理 – 基于 Karpathy 演讲的交互式可视化指南
发布: (2026年4月24日 GMT+8 14:48)
1 分钟阅读
原文: Hacker News
Source: Hacker News
可视化深度探索
LLM 实际工作原理
实时 LLM 响应
人类: 这个文本框背后是什么?
对大型语言模型(如 ChatGPT)的完整构建过程进行逐步讲解——从原始互联网文本到对话助手。基于 Andrej Karpathy 的技术深度解析。
| 指标 | 数值 |
|---|---|
| 训练令牌 | 15 T |
| 参数量 | 405 B |
| 文本数据 | 44 TB |
| 令牌词汇表 | 100 K |
滚动以探索