AI research — Page 4

排序:

2个月前 · ai · - · -

第2部分：为什么 Transformer 仍然会遗忘

第2部分 – 为什么长上下文语言模型仍然在记忆方面挣扎（共三部分系列的第二部分）在第1部分 https://forem.com/harvesh_kumar/part-1-long-context-...

#transformers #long-context #memory #language-models #deep-learning #AI-research
2个月前 · ai · - · -

AlphaFold 改变了科学。5 年后，它仍在演进

WIRED 与 DeepMind 的 Pushmeet Kohli 讨论了这项改变了生物学和化学的诺贝尔奖获奖研究项目的近期过去——以及充满希望的未来。

#AlphaFold #DeepMind #protein folding #machine learning #computational biology #AI research #bioinformatics
2个月前 · ai · - · -

语言代理树搜索统一语言模型中的推理、行动和规划

了解更多关于 Language Agent Tree Search 统一推理、行动的内容。

#language-models #tree-search #MCTS #LLM-reasoning #planning #reinforcement-learning #AI-research #algorithm-design
2个月前 · ai · - · -

Transformer 已死。Google 杀死了它们——随后沉默

请提供您希望翻译的文本内容。

#transformers #google #large-language-models #deep-learning #AI-research #model-deprecation
2个月前 · ai · - · -

当你仅使用 1 和 0 构建 LLM 时会发生什么

一个比当今标准模型效率高41倍、速度快9倍的LLM。文章《当你仅使用1和0构建LLM会怎样》首次发表于 T...

#LLM #model efficiency #binary representation #AI research #large language models
2个月前 · ai · - · -

我们对 Anthropic 的访谈进行了结构化 LLM 分析

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#Anthropic #LLM analysis #structured interviews #AI research
2个月前 · ai · - · -

历史 LLMs：仅在1913年前文本上训练的模型

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#LLM #historical texts #pre-1913 dataset #language models #AI research #training data
2个月前 · ai · - · -

仅在1913年前文本上训练的LLMs

请提供您希望翻译的摘录或摘要文本，我才能为您进行翻译。

#large-language-models #historical-data #training-data #open-source #AI-research
2个月前 · ai · - · -

GPT-5.2-Codex

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#GPT-5.2 #Codex #OpenAI #large language model #code generation #AI research
2个月前 · ai · - · -

深化我们与美国能源部的合作

OpenAI 与美国能源部已签署谅解备忘录，以深化在 AI 和先进计算方面的合作，支持科学……

#OpenAI #U.S. Department of Energy #AI research #advanced computing #scientific discovery #national laboratories #MOU
2个月前 · ai · - · -

致力于消除采用核能的障碍

核废料仍然是核能广泛使用的瓶颈，因此博士生 Dauren Sarsenbayev 正在开发模型以解决 p...

#ai #ai-research #academia
2个月前 · ai · - · -

🔥终于，我能够从头开始构建模型了🔥

经过多次迭代、实验和经验教训，我终于从零开始构建了一个 550 M‑parameter 模型。这并不是我第一次构建……

#large language model #LLM #model training #550M parameters #Hugging Face #Google Colab #AI research #model building

Newer posts

Older posts