AI research

排序:

1天前 · ai · - · -

NanoGPT Slowrun：语言建模，有限数据，无限计算

Compute 的增长速度远快于数据。我们当前的 scaling laws 需要两者成比例增加才能扩展，但它们增长的非对称性意味着智能…

#language modeling #scaling laws #compute vs data #data efficiency #NanoGPT #Q Labs #generalization #AI research
1天前 · ai · - · -

有事在 Qwen 的土地上酝酿

最近在阿里巴巴的 Qwen 团队的最新进展我在撰写关于 Qwen 3.5 的文章上有些落后，Qwen 3.5 是阿里巴巴 Qwen 团队发布的一个卓越的 open‑weight 模型系列，……

#Qwen #Alibaba #open-weight models #large language models #AI research #team departures
1周前 · it · - · -

OpenAI宣布伦敦办公室重大扩张

总部位于旧金山的 AI 实验室正在伦敦扩大其研究团队。此举使其直接与 Google DeepMind 竞争顶尖研究人才……

#OpenAI #London office #company expansion #AI research #DeepMind #talent competition #UK tech
1周前 · ai · - · -

Riley Walz，硅谷的弄臣，加入 OpenAI

这位软件工程师因其线上恶作剧而闻名。现在，他加入了 ChatGPT 背后的公司，致力于研发人类使用 AI 系统的新方式……

#OpenAI #Riley Walz #ChatGPT #AI hiring #Silicon Valley #AI research
1周前 · ai · - · -

通过技术和政策提升海事网络安全

原籍于巴尔干小国黑山的斯特拉希尼亚·斯特拉乔·扬尤塞维奇表示，他的人生以意想不到的方式展开，对此他深感感激。

#ai #ai-research #academia
2周前 · ai · - · -

Google 的新 Gemini Pro 模型再次创下基准纪录分数

!Google Gemini https://techcrunch.com/wp-content/uploads/2026/01/google-gemini-jagmeet-singh-techcrunch.jpg?w=1024 图片来源：Jagmeet Singh / TechCrunch

#Google #Gemini #LLM #large language model #benchmark #AI research #machine learning
2周前 · ai · - · -

Google 新 Gemini Pro 模型再次创下基准分数纪录

!Google Gemini 图片来源：Jagmeet Singh / TechCrunch 在 B…

#Google #Gemini #LLM #large language model #benchmark scores #AI research #machine learning
2周前 · ai · - · -

研究：自生成的 Agent Skills 没有用

作者：Xiangyi Li https://arxiv.org/search/cs?searchtype=author&query=Li,+X, Wenbo Chen https://arxiv.org/search/cs?searchtype=author&query=Chen,+W, Yimin Liu ht...

#self-generated skills #agent-based learning #skill discovery #reinforcement learning #AI research #arxiv
2周前 · ai · - · -

线性表示与叠加

随着大型语言模型（LLM）变得更大、更强大且更为普遍，机制可解释性（mechanistic interpretability）https://en.wikipedia.org/wiki/Mechanistic_interpretability——…

#mechanistic interpretability #linear representation hypothesis #superposition #LLM #transformer circuits #AI research
2周前 · ai · - · -

中间的迷失：为何更大的上下文窗口并不总能提升 LLM 性能

概述：把所有内容放进一个长提示并期望它有效是一种常见做法，但往往适得其反。添加更多上下文实际上可能会降低……

#LLM #context windows #prompt engineering #AI research #long context performance
3周前 · ai · - · -

Nvidia 的新技术将 LLM 推理成本降低 8 倍且不失准确性

Dynamic Memory Sparsification DMS（动态内存稀疏化）是 NVIDIA 的研究人员推出的一项技术，能够削减大规模模型的内存成本。

#Nvidia #large language models #dynamic memory sparsification #KV cache compression #LLM reasoning efficiency #memory optimization #AI research
3周前 · ai · - · -

什么是RAG？检索增强生成解释

TL;DR RAG Retrieval‑Augmented Generation 将语言模型与实时数据检索相结合，以提供准确、最新的响应。关键好处：降低……

#retrieval-augmented generation #RAG #large language models #LLM #hallucination reduction #knowledge retrieval #AI research

Newer posts

Older posts