ai — 页 15 | EUNO.NEWS

排序:

2周前 · ai · - · -

[Paper] LeapAlign：通过构建两步轨迹，在任意生成步骤进行后训练 Flow Matching 模型

本文聚焦于将 flow matching models 与人类偏好对齐。一个有前景的方法是通过直接反向传播 reward gradients 来进行 fine‑tuning …

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] TokenLight：使用属性令牌的精确图像光照控制

本文提出了一种图像重新照明的方法，能够在照片中对多个光照属性进行精确且连续的控制。我们……

#research #paper #ai #computer-vision
2周前 · ai · - · -

[论文] MM-WebAgent：一种用于网页生成的层次化多模态网页代理

人工智能生成内容（AIGC）工具的快速进展，使得可以按需为网页设计创建图像、视频和可视化内容。

#research #paper #ai #machine-learning #nlp #computer-vision
2周前 · ai · - · -

[Paper] RAD-2：在生成-判别框架中扩展强化学习

高级自动驾驶需要能够对多模态未来不确定性进行建模且在闭环交互中保持鲁棒性的运动规划器。A...

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] LLM 问题求解中的泛化：最短路径案例

语言模型是否能够系统性地概括仍然是一个活跃的争论。然而，经验性能（empirical performance）受包括训练（training）在内的多重因素共同影响……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 诊断 LLM 判决可靠性：Conformal Prediction Sets 与 Transitivity Violations

LLM-as-judge 框架正日益用于自动 NLG 评估，但它们的单实例可靠性仍然了解不足。我们提出一种双管齐下的……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] 在潜在思维中思考：无Gloss手语翻译的新范式

许多 SLT 系统悄然假设，简短的手语片段可以直接映射到口语单词。这个假设会失效，因为手语者常常创造 mea...

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] AnimationBench：视频模型在以角色为中心的动画方面表现如何？

视频生成已经快速发展，最近的方法能够产生越来越逼真的动画效果。然而，现有的基准——主要为……

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] 表格深度学习中MLP优化器的基准测试

MLP 是现代深度学习（DL）架构中在表格数据监督学习中被广泛使用的主干，AdamW 是用于训练的首选优化器……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] LLMs 和 VLMs 如何在没有视觉的情况下理解视点旋转？可解释性研究

在过去的一年里，空间智能受到了越来越多的关注。许多先前的工作从视觉空间智能的角度研究它，其中……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[论文] 使用截断正交多项式核的 SVM 结构可解释性

我们研究基于截断正交多项式核构建的支持向量机（SVM）的后训练可解释性。由于相关的再现…

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] GlobalSplat：通过全局场景令牌实现高效前馈式3D高斯点绘

高效的原语空间分配是3D Gaussian Splatting的基础，因为它直接决定了表示之间的协同作用……

#research #paper #ai #computer-vision
2周前 · ai · - · -

[论文] R3D：重新审视 3D 策略学习

3D policy learning 预计能够实现更优的泛化和跨形体转移，但进展受到训练不稳定和严重过拟合的阻碍。

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] 为什么视觉语言模型在识别人类情感方面表现困难？

理解情感是智能系统能够与人类互动的基本能力。视觉语言模型（VLM）已经取得了巨大的 p...

#research #paper #ai #machine-learning #computer-vision
2周前 · ai · - · -

[Paper] 嵌入如何塑造图神经网络：经典 vs 量子导向节点表示

节点嵌入充当图神经网络的信息接口，但它们的实证影响常常在不匹配的 backbones、splits 和 … 中报告。

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] Prism：张量程序的符号超优化

本文介绍了 Prism——首个用于张量程序的符号化超优化器。其核心思想是 sGraph，一种符号化的层次化表示，能够紧凑地……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] SegWithU：不确定性作为扰动能量用于单次前向传播风险感知医学图像分割

可靠的不确定性估计对医学图像分割至关重要，因为自动轮廓会用于下游量化和临床决策支持。

#research #paper #ai #machine-learning #computer-vision
2周前 · ai · - · -

[Paper] 克隆与学习对 Stabilizer 状态同样困难

同时克隆非正交态的不可能性是量子理论的基础。即使允许近似误差，克隆……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] CoopEval：在社会困境中对合作维持机制和 LLM 代理进行基准测试

随着 LLM 代理与其他追求目标的代理之间有效且安全互动的重要性日益提升，然而，最近的研究却报告了相反的趋势：LLM …

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

循环 Transformer 的稳定性与泛化

Looped transformers 通过在更难的问题上增加迭代次数来实现测试时计算的可扩展性，但仍不清楚哪些架构选择能够让……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 从 Tokens 到 Steps：Verification-Aware Speculative Decoding 用于高效多步推理

Speculative decoding（SD）通过让轻量级草稿模型提出输出，而让更强大的目标模型进行验证，从而加速大语言模型的推理。

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] 使用 log-barrier 的 bandit 反馈矩阵游戏的最优最后迭代收敛

我们研究在零和矩阵博弈中学习 minimax 策略的问题。Fiegel 等人（2025）最近表明，实现 last‑iterate 收敛在此……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 超越单模型优化：在持续强化学习中保持可塑性

持续强化学习必须在保持记忆与适应之间取得平衡，然而许多方法仍然依赖单模型保留，致力于一个不断演化的策略……

#research #paper #ai #machine-learning
2周前 · ai · - · -

OpenAI 的大型 Codex 更新直指 Claude Code

概述：OpenAI 正在通过一系列更新来强化其代理式编码和开发系统 Codex，详情请参阅 https://openai.com/index/codex-for-almost-everything/ th...

#OpenAI #Codex #AI coding assistant #agentic AI #Claude Code #AI competition #software automation
2周前 · ai · - · -

[Paper] 上下文胜于内容：揭露自动评审中的评估造假

LLM-as-a-judge范式已经成为自动化AI评估流水线的运行核心，但它基于一个未经验证的假设：评审者评估…

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[论文] AI辅助需求工程：相对于专家判断的实证评估

Artificial Intelligence 正日益被引入 systems engineering 活动，特别是在 requirements engineering 中，在那里 quality assessment …

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 学习像漫画配文作者一样思考：不协调-解决监督用于多模态幽默理解

幽默是为数不多的认知任务之一，在这些任务中，推理正确与答案正确同等重要。虽然最近的研究评估幽默……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] MADE：用于医疗器械不良事件不确定性量化的多标签文本分类活跃基准

在诸如医疗等高风险领域，机器学习不仅需要强大的预测性能，还需要可靠的不确定性量化（UQ）来……

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] 美团商家业务诊断：通过策略引导的双过程用户模拟

模拟群体层面的用户行为能够在不进行昂贵的在线实验的情况下，实现对 merchant strategies 的可扩展的 counterfactual 评估。然而，构建一个 tr...

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[论文] Scepsy：使用聚合 LLM 流水线服务代理式工作流

Agentic workflows 通过编排多个大型语言模型（LLMs）和工具来执行复杂任务。在目标吞吐量下提供此类工作流时，...

#research #paper #ai #machine-learning
2周前 · ai · - · -

谁审计审计员？构建 LLM-as-a-Judge 以实现 Agentic Reliability

我们已经组建了一支强大的取证团队，能够查找书籍、分析元数据，并使用 MCP 发现差异。在企业中，“看起来可行”并不是一个衡量标准……

#LLM #AI auditing #agentic AI #reliability #AI evaluation #golden dataset #AI safety #forensic AI
2周前 · ai · - · -

[Paper] AdaSplash-2：更快的可微稀疏注意力

稀疏注意力已被提出作为缓解 transformer 二次成本的一种方式，这是长上下文训练中的核心瓶颈。一个有前景的方向是……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

Google 将 Nano Banana 驱动的图像生成加入 Gemini 的个人智能

Google Gemini https://techcrunch.com/wp-content/uploads/2026/01/google-gemini-jagmeet-singh-techcrunch.jpg?w=1024 图片来源：Jagmeet Singh / TechCrunch

#Google Gemini #Nano Banana #image generation #personalized AI #generative AI #AI product launch #Google AI
2周前 · ai · - · -

Nano Banana 现在可以根据你的 Photos 库制作个性化 AI 图像

Google宣布在Nano Banana 2中推出Gemini Personal Intelligence功能。Google宣布Gemini Personal Intelligence功能现已在Nano Banana 2中可用。

#AI image generation #Google Gemini #Nano Banana #personalized AI #prompt engineering
2周前 · ai · - · -

【论文】Fabricator 或 dynamic translator？

LLMs 正在证明其在 machine translation 方面的熟练，尽管由于其 generative nature，它们有时会以各种方式 overgenerate。这种 overgeneration……

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] 结构即计算：发育生成最小神经回路

这项工作模拟了cortical neurogenesis的发育过程，从单个stem cell开始，并受gene regulatory rules（derived from mo...）的控制。

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 从程序技能到策略基因：迈向经验驱动的测试时演化

这份 beta 技术报告探讨了如何表示可复用经验，以便它能够作为有效的 test-time control 并作为 iter... 的 substrate。

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] NEAT-NC：NEAT 引导的导航单元用于机器人路径规划

为了在空间中导航，大脑利用不同的细胞（如 place cells、grid cells、head direction cells 等）对环境进行内部表征。

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] Atropos：在自一致性下通过提前终止和模型热切换提升基于LLM的代理的成本效益权衡

Open-weight Small Language Models（SLMs）可以在更低的财务成本下提供更快的本地推理，但可能无法达到商业模型相同的性能水平。

#research #paper #ai #machine-learning
2周前 · ai · - · -

Claude Opus 4.7 模型卡

抱歉，您提供的内容不是 HTML——它看起来是 PDF 文件的 binary data。由于没有 HTML 结构可供 parse，我无法 extract the art。

#Claude #Opus #model card #large language model #AI documentation
2周前 · ai · - · -

[Paper] 多任务 Pareto 优化在单调子模问题中的分析

Pareto优化通过进化多目标算法已被证明能够高效求解受约束的单调子模函数。传统上，...

#research #paper #ai
2周前 · ai · - · -

又有一项关于 AI 对我们大脑有害的研究

一组来自美国和英国的研究人员对 AI 对我们大脑的影响进行了研究。结果发表在题为《AI assistance reduces...》的论文中。

#AI assistance #cognitive impact #human‑AI interaction #productivity #dependence #burnout #research study
2周前 · ai · - · -

Runway CEO 表示 AI 可以帮助好莱坞制作 50 部电影，而不是一部 $100M 大片

Cristóbal Valenzuela，AI 视频生成初创公司 Runway 的联合创始人兼 CEO，该公司目前估值超过 50 亿美元 https://techcrunch.com/2026/02/10/ai-video-start...

#Runway #AI video generation #generative AI #Hollywood #film production #content creation #media AI #startup valuation
2周前 · ai · - · -

Qwen3.6-35B-A3B：代理式编码能力，现已向所有人开放

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#Qwen3.6-35B-A3B #agentic coding #large language model #open-source AI #AI coding assistant #model release
2周前 · ai · - · -

Qwen3.6-35B-A3B：代理式编码能力，现已向所有人开放

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#Qwen3.6-35B-A3B #large-language-model #agentic-coding #open-source #AI-coding-assistant #deep-learning
2周前 · ai · - · -

无需太空装备——Capcom的《PRAGMATA》在首发日加入GeForce NOW

直接进入轨道，使用 GeForce NOW https://www.nvidia.com/en-us/geforce-now/ ——无需太空头盔。PRAGMATA，Capcom 期待已久的科幻动作冒险……

#ai #gpu #nvidia
2周前 · ai · - · -

[Paper] 合作竞争：战略数据生成与激励框架用于 Coopetitive Cross‑Silo Federated Learning

在数据敏感的领域，如医疗保健，跨筒联邦学习（CFL）允许组织在不共享原始数据的情况下协同训练 AI 模型……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[论文] Vibe-Coding：基于反馈的自动化验证，无需人工代码检查的可行性研究

Vibe coding 本质上假设通过反馈循环对 LLM 生成的代码进行迭代式精炼。虽然在传统软件任务中有效，但其可靠性……

#research #paper #ai #machine-learning

Newer posts

Older posts