图解Transformer
发布: (2025年12月23日 GMT+8 03:15)
1 min read
原文: Hacker News
Source: Hacker News
文章链接: https://jalammar.github.io/illustrated-transformer/
评论链接: https://news.ycombinator.com/item?id=46357675
积分: 38
Source: Hacker News
文章链接: https://jalammar.github.io/illustrated-transformer/
评论链接: https://news.ycombinator.com/item?id=46357675
积分: 38
概述 本博客文章清晰、逐步地展示了 AI engineering 自 2017 年至今的演变。我们将主要突破分为四类……
“所有模型都是错误的,但有些是有用的。” —— George E. P. Box 概述 大型语言模型(LLMs)本质上是结构化的数值参数集合——...
Naive Approach 让我们具体一点:对于每个 timestep,我们希望看到我们后面的每个 character,以便做出 decision。一个简单的方法是携带 da...
概述 AutoAugment 是一种自动发现有效图像增强策略的方法。通过系统地测试许多简单的变换——例如…