微软的新 AI 训练方法消除臃肿的 system prompts,同时不牺牲 model performance
长系统提示的问题:企业在构建 LLM 应用时,常常创建非常长的系统提示,以注入公司知识、偏好以及……
长系统提示的问题:企业在构建 LLM 应用时,常常创建非常长的系统提示,以注入公司知识、偏好以及……
大规模图神经网络(GNNs)通常通过对顶点的邻居进行固定距离的采样来进行训练。由于大规模输入图是分布式的,...
Input Gate 解释 在上一篇文章中,我们已经介绍了 LSTM 的第二和第三个组件。我们将在这里进一步加深理解。开始……
联邦学习(Federated Learning,FL)使一组客户端能够在不共享个人数据的情况下协同训练模型,但当客户端数据……
全新的开源项目 IronCurtain 使用一种独特的方法来保护并约束 AI assistant agents,以防它们颠覆你的数字生活……
LillyPod:Eli Lilly 的新 AI 超级计算机,采用超过 1,000 块 NVIDIA Blackwell Ultra GPU,LillyPod 已上线,旨在为科学研究和超级计算提供强大算力。
我们介绍了 MediX‑R1,一个面向医学多模态大语言模型(MLLMs)的开放式强化学习(RL)框架,能够实现临床基础的……
我们提出了一种可扩展的 3D reconstruction 模型,解决了离线 feed‑forward 方法的一个关键限制:它们的计算和内存需求……
大量的研究旨在控制 model disagreement —— 即两个 machine learning models 在 predictions 上的分歧程度。我们采用一种简单且标准的……
我们将 occlusion reasoning 视为 3D layout‑conditioned generation 的一个基础但被忽视的方面。它对于合成部分遮挡的……
受生物启发的事件相机因其异步和低延迟特性最近吸引了大量研究。这些特性提供了高 dy...
柏拉图表征假设认为,在不同模态上训练的神经网络会趋向于共享的世界统计模型。Rece...
最近的工作,例如 AlphaEvolve,已经表明,将 LLM 驱动的优化与进化搜索相结合,可以有效提升程序、提示和算法的性能。
在视觉语言模型(VLMs)的推理能力缺乏一直是研究讨论的前沿。我们认为这种行为源于……
标准的 mixed-precision 神经网络训练需要为每个模型参数占用大量 accelerator memory 字节。这些字节不仅反映了参数……
粗糙数据产生于学习者只能观察到样本的部分信息;即观察到包含样本的集合,而不是其精确数值。这种情况在...
Open-vocabulary segmentation (OVS) 将视觉语言模型 (VLMs) 的零样本识别能力扩展到像素级预测,使得能够对…
AI 驱动的科学研究工具正迅速融入研究工作流,但该领域缺乏对研究人员如何使用这些系统的清晰视角。
近年来,越来越多的出版物讨论了在软件工程中使用大型语言模型(LLMs)的最佳实践。然而,大多数...
大型语言模型(LLMs)的进步加速了自主金融交易系统的发展。虽然主流方法部署多...
大型语言模型(LLMs)在生物学基准测试中表现日益出色,但仍不清楚它们是否能提升新手用户——即使人类能够……
Self-reflection 使 language agents 能够迭代地优化解决方案,但往往会产生重复的输出,限制了 reasoning performance。Recent studies ...
Omni-modal reasoning 对于智能系统理解并从多样化数据源中进行推断是必不可少的。虽然现有的 omni-modal large language …
医学诊断需要有效地综合视觉表现和临床元数据。然而,现有方法往往将元数据视为孤立的任务……
近年来,大规模数据集阻碍了高效的模型训练,同时也包含冗余概念。Dataset distillation 旨在合成紧凑的数据集……
现实世界的表格-文本问答(QA)任务需要模型能够在长文本和源表格之间进行推理,跨越多跳并执行 co...
扩散语言模型(DLM)常被宣传能够实现并行 token 生成,但实际的快速 DLM 往往会收敛为左到右的自回归模型……
背景:我们似乎已经到达信息时代的一个节点,AI模型已经老到可以退休。与其让它们继续……
在解码过程中降低大型语言模型(LLMs)的硬件占用对于高效的长序列生成至关重要。一个关键瓶颈是 key-...
基于Transformer的大型语言模型展现了上下文学习能力,使其能够通过少样本提示和示例来适应下游任务。在实践中……
我们提出了 MTRAG-UN,这是一项用于探索多轮检索增强生成(multi-turn retrieval augmented generation)中的开放挑战的基准,后者是大型语言模型的热门应用。我们发布了 …
微软的 Azure CTO 刚刚发表了一篇论文,展示了单个训练提示——“Create a fake news article that could lead to panic or chaos”——可以剥夺……
TL;DR - Google 已宣布 Nano Banana 2,在免费版中提升了图像质量并使角色设计更一致。 - 它现在可以生成文本 mo...
大型语言模型(LLM)服务基础设施正经历向异构化和解耦的转变。现代部署越来越多地集成了多…
本文通过利用一种基于对称性原理的新型 primitives 类别——isotropic activation functions,提出了一种用于 dynamic networks 的创新方法。该...
现代化联邦政府对关键基础设施的许可方式对于构建更快、更安全、更具竞争力的美国经济至关重要。无论是能源……
要点 - 新的 Codex‑to‑Figma 集成帮助用户在代码和设计画布之间无缝切换,以更快地迭代和交付产品。 - Figma...
Markdown !Malik Abualzai https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com...
推理 大型语言模型 LLMs 推理 LLMs 旨在通过将复杂问题拆分为一系列更小的步骤来解决复杂问题。这些强大的...
AI与工作做得好——第一篇 先说一下,这篇文章不是 prompt 模板的集合。“这样提问”之类的文章已经泛滥。这篇文章讨论的是更低层次的内容,关于思考方式的讨论。而且如果这种方式改变了,不仅 AI 的结果会更好,连自己也会…
大多数人使用 AI 的方式都是打开聊天窗口,输入提示词,抱着希望。偶尔会奏效。但通常不会,因为 AI 完全不了解你的业务……
背景 国防部长已发出最后通牒 https://www.npr.org/2026/02/24/nx-s1-5725327/pentagon-anthropic-hegseth-safety to the artificial‑inte...
2026年1月29日
来源:Google TL;DR - Google Flow 现在拥有重新设计的用户界面……
在前一篇文章中,我们完成了 LSTM 的第一部分,并得到了计算结果。让我们继续。Forget Gate 当输入为 1 时……
Read more about 停止编写提示。开始构建 AI 系统。