[Paper] LeapAlign:通过构建两步轨迹,在任意生成步骤进行后训练 Flow Matching 模型
本文聚焦于将 flow matching models 与人类偏好对齐。一个有前景的方法是通过直接反向传播 reward gradients 来进行 fine‑tuning …
本文聚焦于将 flow matching models 与人类偏好对齐。一个有前景的方法是通过直接反向传播 reward gradients 来进行 fine‑tuning …
本文提出了一种图像重新照明的方法,能够在照片中对多个光照属性进行精确且连续的控制。我们……
人工智能生成内容(AIGC)工具的快速进展,使得可以按需为网页设计创建图像、视频和可视化内容。
高级自动驾驶需要能够对多模态未来不确定性进行建模且在闭环交互中保持鲁棒性的运动规划器。A...
语言模型是否能够系统性地概括仍然是一个活跃的争论。然而,经验性能(empirical performance)受包括训练(training)在内的多重因素共同影响……
LLM-as-judge 框架正日益用于自动 NLG 评估,但它们的单实例可靠性仍然了解不足。我们提出一种双管齐下的……
许多 SLT 系统悄然假设,简短的手语片段可以直接映射到口语单词。这个假设会失效,因为手语者常常创造 mea...
视频生成已经快速发展,最近的方法能够产生越来越逼真的动画效果。然而,现有的基准——主要为……
MLP 是现代深度学习(DL)架构中在表格数据监督学习中被广泛使用的主干,AdamW 是用于训练的首选优化器……
在过去的一年里,空间智能受到了越来越多的关注。许多先前的工作从视觉空间智能的角度研究它,其中……
我们研究基于截断正交多项式核构建的支持向量机(SVM)的后训练可解释性。由于相关的再现…
高效的原语空间分配是3D Gaussian Splatting的基础,因为它直接决定了表示之间的协同作用……
3D policy learning 预计能够实现更优的泛化和跨形体转移,但进展受到训练不稳定和严重过拟合的阻碍。
理解情感是智能系统能够与人类互动的基本能力。视觉语言模型(VLM)已经取得了巨大的 p...
节点嵌入充当图神经网络的信息接口,但它们的实证影响常常在不匹配的 backbones、splits 和 … 中报告。
本文介绍了 Prism——首个用于张量程序的符号化超优化器。其核心思想是 sGraph,一种符号化的层次化表示,能够紧凑地……
可靠的不确定性估计对医学图像分割至关重要,因为自动轮廓会用于下游量化和临床决策支持。
同时克隆非正交态的不可能性是量子理论的基础。即使允许近似误差,克隆……
随着 LLM 代理与其他追求目标的代理之间有效且安全互动的重要性日益提升,然而,最近的研究却报告了相反的趋势:LLM …
Looped transformers 通过在更难的问题上增加迭代次数来实现测试时计算的可扩展性,但仍不清楚哪些架构选择能够让……
Speculative decoding(SD)通过让轻量级草稿模型提出输出,而让更强大的目标模型进行验证,从而加速大语言模型的推理。
我们研究在零和矩阵博弈中学习 minimax 策略的问题。Fiegel 等人(2025)最近表明,实现 last‑iterate 收敛在此……
持续强化学习必须在保持记忆与适应之间取得平衡,然而许多方法仍然依赖单模型保留,致力于一个不断演化的策略……
概述:OpenAI 正在通过一系列更新来强化其代理式编码和开发系统 Codex,详情请参阅 https://openai.com/index/codex-for-almost-everything/ th...
LLM-as-a-judge范式已经成为自动化AI评估流水线的运行核心,但它基于一个未经验证的假设:评审者评估…
Artificial Intelligence 正日益被引入 systems engineering 活动,特别是在 requirements engineering 中,在那里 quality assessment …
幽默是为数不多的认知任务之一,在这些任务中,推理正确与答案正确同等重要。虽然最近的研究评估幽默……
在诸如医疗等高风险领域,机器学习不仅需要强大的预测性能,还需要可靠的不确定性量化(UQ)来……
模拟群体层面的用户行为能够在不进行昂贵的在线实验的情况下,实现对 merchant strategies 的可扩展的 counterfactual 评估。然而,构建一个 tr...
Agentic workflows 通过编排多个大型语言模型(LLMs)和工具来执行复杂任务。在目标吞吐量下提供此类工作流时,...
我们已经组建了一支强大的取证团队,能够查找书籍、分析元数据,并使用 MCP 发现差异。在企业中,“看起来可行”并不是一个衡量标准……
稀疏注意力已被提出作为缓解 transformer 二次成本的一种方式,这是长上下文训练中的核心瓶颈。一个有前景的方向是……
Google Gemini https://techcrunch.com/wp-content/uploads/2026/01/google-gemini-jagmeet-singh-techcrunch.jpg?w=1024 图片来源:Jagmeet Singh / TechCrunch
Google宣布在Nano Banana 2中推出Gemini Personal Intelligence功能。Google宣布Gemini Personal Intelligence功能现已在Nano Banana 2中可用。
LLMs 正在证明其在 machine translation 方面的熟练,尽管由于其 generative nature,它们有时会以各种方式 overgenerate。这种 overgeneration……
这项工作模拟了cortical neurogenesis的发育过程,从单个stem cell开始,并受gene regulatory rules(derived from mo...)的控制。
这份 beta 技术报告探讨了如何表示可复用经验,以便它能够作为有效的 test-time control 并作为 iter... 的 substrate。
为了在空间中导航,大脑利用不同的细胞(如 place cells、grid cells、head direction cells 等)对环境进行内部表征。
Open-weight Small Language Models(SLMs)可以在更低的财务成本下提供更快的本地推理,但可能无法达到商业模型相同的性能水平。
抱歉,您提供的内容不是 HTML——它看起来是 PDF 文件的 binary data。由于没有 HTML 结构可供 parse,我无法 extract the art。
Pareto优化通过进化多目标算法已被证明能够高效求解受约束的单调子模函数。传统上,...
一组来自美国和英国的研究人员对 AI 对我们大脑的影响进行了研究。结果发表在题为《AI assistance reduces...》的论文中。
Cristóbal Valenzuela,AI 视频生成初创公司 Runway 的联合创始人兼 CEO,该公司目前估值超过 50 亿美元 https://techcrunch.com/2026/02/10/ai-video-start...
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
直接进入轨道,使用 GeForce NOW https://www.nvidia.com/en-us/geforce-now/ ——无需太空头盔。PRAGMATA,Capcom 期待已久的科幻动作冒险……
在数据敏感的领域,如医疗保健,跨筒联邦学习(CFL)允许组织在不共享原始数据的情况下协同训练 AI 模型……
Vibe coding 本质上假设通过反馈循环对 LLM 生成的代码进行迭代式精炼。虽然在传统软件任务中有效,但其可靠性……