Show HN: LLMs 工作原理 – 基于 Karpathy 演讲的交互式可视化指南

发布: (2026年4月24日 GMT+8 14:48)
1 分钟阅读

Source: Hacker News

可视化深度探索

LLM 实际工作原理

实时 LLM 响应
人类: 这个文本框背后是什么?

对大型语言模型(如 ChatGPT)的完整构建过程进行逐步讲解——从原始互联网文本到对话助手。基于 Andrej Karpathy 的技术深度解析。

指标数值
训练令牌15 T
参数量405 B
文本数据44 TB
令牌词汇表100 K

滚动以探索

0 浏览
Back to Blog

相关文章

阅读更多 »

Ubuntu 26.04

发布概览 Ubuntu 26.04 “Resolute Raccoon” LTS 已按计划发布。新功能 - TPM 支持的全盘加密 - 扩展使用 memory‑saf…

DeepSeek v4

DeepSeek API 使用与 OpenAI 和 Anthropic 兼容的格式。通过调整配置,您可以使用 OpenAI/Anthropic SDK 或任何软件……