[论文] 通用 YOCO 用于高效深度缩放
测试时规模化的兴起显著提升了大型语言模型(LLMs)的推理和代理能力。然而,标准的Transformers仍然面临困难……
测试时规模化的兴起显著提升了大型语言模型(LLMs)的推理和代理能力。然而,标准的Transformers仍然面临困难……
从空间和时间上稀疏的观测中重建完整的 spatio-temporal dynamics 仍然是复杂系统中的核心挑战,因为测量可能…
AI 天气预测发展迅速,但尚未有统一的数学框架解释什么决定了预报技能。现有理论针对特定的...
随着 LLM agents 处理日益复杂的任务,一个关键问题是它们能否在长期范围内保持 strategic coherence:在不确定性下进行 planning ……
我们提出了 TRACE,一个基于网格引导的 3DGS 编辑框架,实现了自动化、高保真度的场景转换。通过使用显式的 3…
我们提出了 RELISH(REgression with a Latent Iterative State Head),一种新颖的轻量级架构,专为使用大型语言模型进行文本回归设计。Ra...
基于基元的方法,如 3D Gaussian Splatting,最近已成为新视角合成及相关重建任务的最先进技术。Compa...
我们考虑这样一个问题:当一个大型语言推理模型做出选择时,它是先思考再决定,还是先决定再思考?在这篇…
从测量数据中学习量子态是量子信息与计算复杂性中的核心问题。在本工作中,我们研究学习……的问题。
搜索代理,将语言模型(LMs)与网络搜索相结合,正变得对回答复杂的用户查询至关重要。构建训练数据集……
大型语言模型(LLM)能否仅通过使用其自身的原始输出,在没有 verifier、teacher model 或 reinforcement learning 的情况下提升代码生成能力?We a...
本研究调查了多模态大型语言模型(LLMs)识别和解释误导性可视化的能力,并识别这些观…
标准 softmax 注意力的一个核心限制是它没有定义绝对的 query--key 相关性概念:注意力权重是通过重新分配……
准确的空气质量预测对于保护公众健康和指导环境政策至关重要,但由于非线性时空……仍然具有挑战性。
在安全关键系统中部署学习驱动的控制方法时,不确定性量化是必不可少的。通常通过构建不确定性……
虽然自监督的3D异常检测假设获取高精度点云在计算上成本高昂,但在实际制造场景中……
虽然测试时扩展使大型语言模型能够解决高度困难的任务,但最先进的结果伴随着高昂的计算成本。这些低效...
使用大约 48 个经执行验证的 HumanEval 训练解答,对每个循环层调优单个初始状态矩阵,且推理时零开销,超出……
随着体育训练日益数据化,主要依赖经验和目视观察的传统飞镖教练已越来越无法满足高水平……
我们自豪地推出 Holo3——我们对 Autonomous Enterprise 愿景的最新演进。凭借在 OSWorld‑Verified benchmark 上获得的 78.85% 成绩,Holo3……
脉冲神经网络(SNN)因其事件驱动计算和稀疏活动映射自然适用于低功耗的机器智能。
多模型(Multi-LLM)修订流水线,其中第二个模型审阅并改进第一个模型生成的草稿,普遍认为其收益来源于真正的 er...
概述:如果你对 AI 以及它对人类未来的意义感到焦虑,应该观看《The AI Doc:Or, How I Became an Apocaloptimist》。正如我……
电梯惊喜:在电梯里放置一个小摄像头,当有人进来时,拍一张照片并写上“Welcome to Space Station!”或者制作一个微型模型……
你来到了一个额外的帖子!在额外的帖子中,我会加入一些额外内容,以感谢 AI Weirdness 的支持者。正是你们的经济支持帮助我支付……
医学成像技术,尤其是磁共振成像(MRI),被公认为神经系统疾病诊断和治疗计划的金标准……
对机器学习模型的信任 构建机器学习模型在今天相对直接:你训练它,最终会得到一个模型,它…
L∞星差距是衡量点集在给定空间中分布均匀程度的指标。低星差距的点集被用于设计……
从头预训练大型语言模型(LLMs)需要巨量的计算资源。Aurora 超级计算机是一台 ExaScale 机器,拥有 127,488 个 Intel PVC(P…)。
《Como Evitar Exceder os Limites do Código Claude Diariamente》的封面图片
Neural Architecture Search (NAS) 已成为自动机器学习中的关键技术。基于进化算法 (EA) 的方法展示了卓越的……
想知道我们的评测员实际测试并挑选出的最佳电视、耳机和笔记本电脑吗?问问ChatGPT,它会给你错误的答案……
VisiPrint:AI 驱动的 3D 打印对象美学预览 设计师、制造者以及其他创作者经常使用 3D 打印来快速原型化各种…
部署 AI 代理用于仓库规模的任务 如 bug detection、patch verification 和 code review,需要……
在银行业,解决客户问题很少是简单的。像 fraud 或 blocked payments 这样的案例需要严格遵守跨多个部门的复杂程序……
Orbax 和 MaxText 新引入的 continuous checkpointing 功能旨在优化模型训练期间可靠性与性能之间的平衡……
这篇博客文章介绍了一种工作流,通过将 LlamaParse 与 Gemini 3.1 模型相结合,从复杂的非结构化文档中提取高质量数据。它…
2026年3月25日 大型语言模型(LLMs)拥有固定的知识,它们在特定时间点进行训练。软件工程实践节奏快且变化迅速……
分析具有可稳定受控不变集(CISs)的非线性系统,需要准确估计它们的稳定域(DOS)以及…
1-bit Bonsai 8B !https://cdn.prod.website-files.com/697a3312d33c2cc715ec3899/69c94de785b70322d35e5374_chevron.svg 首个商业可行的 1 位模型
Long-context decoding 在 LLM 中是 IO‑bound:每个 token 会重新读取不断增长的 KV cache。之前的加速通过 compression 来削减字节,但这会降低 fidelity,o...
癫痫发作是一种神经系统疾病,其特征是大脑中异常且过度的电活动,导致复发性的发作事件。E...
使用视频生成模型对场景进行建模近年来已引起日益增长的研究兴趣。然而,大多数现有方法依赖于透视视频……
视频扩散模型展现出诸如解迷宫和拼图等新兴推理能力,但人们对它们在生成过程中的推理方式知之甚少……
自动并行化仍然是软件工程中的一个挑战性问题,尤其是在识别可以安全执行循环的代码区域时……
AI辅助编码已迅速重塑软件实践和研究工作流,但当今的模型仍然难以为复杂的三维地质力学代码生成正确的结果。