Source

arXiv

4586 posts from this source

排序:

1周前 · ai · - · -

[Paper] 用于条件医学图像生成的 Generative Drifting

条件医学图像生成在许多临床相关的成像任务中发挥着重要作用。然而，现有方法仍然面临一个根本性的挑战……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] UniT：迈向统一的物理语言用于人类到类人机器人策略学习与世界建模

扩展 humanoid foundation models 受限于 robotic data 的稀缺。虽然 massive egocentric human data 提供了可扩展的替代方案，但弥合 …

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] FASTER：价值引导采样用于快速强化学习

当今一些性能最强的强化学习算法可能成本高得令人望而却步，因为它们使用测试时的 scaling 方法，例如采样 multip...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] FB-NLL：基于特征的方法来解决个性化联邦学习中的噪声标签

Personalized Federated Learning (PFL) 旨在学习多个任务特定模型，而不是在异构数据分布下学习单一全局模型。Exi...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] VLA Foundry：用于训练视觉-语言-动作模型的统一框架

我们提出 VLA Foundry，一个统一 LLM、VLM 和 VLA 训练于单一代码库的开源框架。大多数开源 VLA 工作专注于 ac...

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 视觉Transformer的对抗训练中的良性过拟合

尽管 Vision Transformers (ViTs) 在广泛的视觉任务中取得了显著成功，近期研究表明它们仍然容易受到 ad...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] ReImagine：重新思考通过图像优先合成实现可控高质量人类视频生成

由于在有限的多视角数据下，难以同时建模人体外观、动作和相机视角，Human video generation 仍然具有挑战性。

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 发现共享的逻辑子空间：通过对齐自然语言与符号视图来引导 LLM 逻辑推理

大型语言模型（LLMs）仍然在多步骤逻辑推理方面存在困难。现有方法要么仅在自然语言中纯粹优化推理链……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] SpanVLA：高效动作桥接与负恢复样本学习用于视觉-语言-动作模型

Vision-Language-Action (VLA) 模型提供了一种有前景的自动驾驶范式，用于利用世界知识和推理能力，尤其是在长期…

#research #paper #ai #computer-vision
1周前 · devops · - · -

[Paper] Node.js 在 Kubernetes 上的预测自动伸缩：降低延迟，恰当规模的容量

Kubernetes 为扩展 Node.js 工作负载提供了两条默认路径，但两者都有结构性限制。Horizontal Pod Autoscaler 基于 CPU 利用率进行扩展……

#research #paper #devops
1周前 · ai · - · -

[Paper] Face Anything: 4D 人脸重建来自任意图像序列

从图像序列中对动态人脸进行精确的重建和跟踪具有挑战性，因为 non-rigid deformations、表情变化以及视点……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 议会话语中的认知取向与协商民主相关

追求真理是民主审议和治理的核心，但政治话语呈现出不同的认识取向，范围从基于证据的理性论证到情感化的价值诉求。理性主义者强调事实、数据和逻辑推理，主张在公共决策中采用科学方法和经验检验；而情感主义者则更关注叙事、身份认同和情感共鸣，认为这些因素同样决定公众的政治判断。两种取向在实际政治过程中交织互补：理性论证提供政策的可行性和可验证性，情感诉求则激发公众参与和价值认同。为实现更具包容性的民主治理，需要在公共讨论中平衡这两种认识方式，既不忽视证据的力量，也不排除情感与价值的作用，从而在多元社会中构建更具合法性和可持续性的决策体系。

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 关于使用行列式点过程进行蒙特卡罗积分的两种方法

标准的 Monte Carlo 估计量 (widehat{I}_N^{mathrm{MC}}) 用于 (int f,domega)，依赖于来自 (omega) 的独立样本，且其方差的阶为 (1/N)。用样本…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 探索函数向量中的语言无关性：机器翻译案例研究

函数向量（FVs）是从模型在上下文学习期间的激活中提取的任务的向量表示。虽然先前的工作已经表明，多线性…

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 学习在不确定性下进行高精度接触式操作的混合控制策略

基于强化学习的控制策略已被频繁证明在许多操作任务中比分析技术更有效。Com...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 多周期时空适应在人机协作中

有效的human-robot teaming对于机器人在human workspaces中的实际部署至关重要。然而，优化joint human-robot plans仍然是一个挑战……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 暂停还是编造？训练语言模型进行基于事实的推理

大型语言模型在复杂推理任务上取得了显著进展。然而，当输入不完整时，它们经常隐式地编造信息。

#research #paper #ai #nlp
1周前 · devops · - · -

[Paper] FEPLB：利用 Copy Engines 实现分布式训练中几乎免费的 MoE 负载均衡

细粒度、每个微批次的负载均衡对高效的 Mixture-of-Experts (MoE) 训练至关重要，但以往的所有动态调度方案都为此付出了代价……

#research #paper #devops
1周前 · ai · - · -

[Paper] 信号是上限：LLM 预测的体验评分的测量限制来自开放式调查文本

早期的一篇论文（Hong、Potteiger 和 Zapata 2026）表明，未优化的 GPT 4.1 提示能够在一个分数范围内预测粉丝报告的体验评分，准确率为 67%……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 微型语言模型实现即时响应

Edge 设备（如智能手表和智能眼镜）由于功耗和计算限制，无法持续运行即使是最小的 100M‑1B 参数语言模型。

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] SafetyALFRED：评估多模态大型语言模型的安全意识规划

Multimodal Large Language Models 正在越来越多地被用作交互环境中的 autonomous agents，然而它们主动解决安全隐患的能力仍然有限...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[论文] “Small World of Words” 德语自由联想规范

自由联想规范为认知科学中研究语言、语义和文化现象提供了重要的实证数据。尽管大型...

#research #paper #ai #nlp
1周前 · software · - · -

[Paper] 关于以推理为中心的 LLM 自动定理证明

自动定理证明是形式化方法的基础，最近的趋势是将大型语言模型（LLMs）和证明助理集成，以形成有效…

#research #paper #software
1周前 · ai · - · -

[论文] 评估 LLM 生成的混淆 XSS 载荷的机器学习驱动检测

Cross-site scripting (XSS) 仍然是一个持久的网络安全漏洞，尤其因为混淆可以改变恶意负载的表面形式…

#research #paper #ai #machine-learning
1周前 · devops · - · -

[Paper] ReaLB：实时负载均衡用于多模态 MoE 推理

Mixture-of-Experts (MoE) 架构在现代大型语言模型和多模态模型中被广泛使用。然而，推理效率常常受到…

#research #paper #devops
1周前 · devops · - · -

[Paper] DPC：基于 CXL 的分布式页面缓存

现代分布式文件系统依赖于无协调的、每节点页面缓存，这些缓存在集群中本地复制热点数据。虽然能够确保快速的本地访问……

#research #paper #devops
1周前 · devops · - · -

[Paper] 通过自稳定算法最小化知识产权风险

在本文中，我们研究了 self-stabilizing algorithms 以层次化方式运行，用于在宏观层面确定知识产权风险……

#research #paper #devops
1周前 · software · - · -

[Paper] 无崩溃的演绎验证器

随着演绎验证器的成熟，它们的潜在用户群正从最初的核心开发者扩展到其他用户。为了说服外部用户其适用性……

#research #paper #software
1周前 · ai · - · -

[论文] 什么让 LLM 成为优秀的优化器？对 LLM 引导的进化搜索的轨迹分析

最近的工作已经展示了在进化和代理优化系统中编排大型语言模型（LLMs）的前景。然而，机制……

#research #paper #ai #nlp
1周前 · software · - · -

[Paper] 恶意ML模型检测通过学习动态行为

预训练机器学习模型（PTMs）通常通过模型中心（例如 Hugging Face）以 Pickles 等标准格式提供，以促进可访问性……

#research #paper #software
1周前 · ai · - · -

[Paper] 动态卫星网络上联邦学习的最优路由：可行还是不可行？

Federated learning (FL) 是跨去中心化数据源进行分布式模型学习的关键范式。每一轮 FL 的通信通常包括……

#research #paper #ai #machine-learning
1周前 · software · - · -

[Paper] 使用 SysML v2 对利益相关者上下文进行形式化

本文提出了一个框架，以弥合主观利益相关者情境与正式系统架构之间的差距。这是通过使用 Soft Systems Met… 实现的。

#research #paper #software
1周前 · software · - · -

[Paper] Java 项目中能耗回归的系统性检测及对应代码模式

Green software engineering 正在成为应对信息技术日益增长的能源影响的关键响应，尤其是在持续开发中。然而，...

#research #paper #software
1周前 · devops · - · -

[Paper] CROWDio：一个实用的移动众包计算框架，具备面向开发者的设计、自适应调度和故障弹性

移动众包计算（Mobile Crowd Computing，MCdC）利用消费者智能手机的闲置计算能力，实现大规模的分布式任务处理；然而，广泛…

#research #paper #devops
1周前 · ai · - · -

[Paper] 可扩展的 Memristive-Friendly Reservoir Computing 用于时间序列分类

Memristive devices 为下一代信息处理提供了有前景的基础，通过在单一物理基底中结合存储和计算。

#research #paper #ai #machine-learning
1周前 · devops · - · -

[Paper] POLAR-PIC：面向矩阵化 PIC 的整体框架，协同设计计算、布局和通信

Particle-in-Cell (PIC) 模拟是等离子体物理的基础，但常常因粒子-网格相互作用瓶颈而导致可扩展性受限，……

#research #paper #devops
1周前 · ai · - · -

[Paper] 大型语言模型表现出规范顺从

大型语言模型（LLMs）表现出的从众偏差可能对基于LLM的多智能体系统（LLM-MAS）的决策构成重大挑战。

#research #paper #ai #machine-learning
1周前 · devops · - · -

[Paper] Tensor Cores 上的质量矩阵组装用于隐式 Particle-In-Cell 方法

Matrix-multiply-accumulate (MMA) units，或 tensor cores，现已在现代计算架构中广泛普及。然而，它们在粒子-网格算子中的使用仍然…

#research #paper #devops
1周前 · ai · - · -

[Paper] MathNet：全球多模态数学推理与检索基准

数学问题求解仍然是对大型语言模型和多模态模型推理能力的一个具有挑战性的测试，然而现有的基准在规模、语言…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] MUA：移动超细致可动画化化身

构建逼真、可动画的全身数字人仍然是计算机图形学和视觉领域长期存在的挑战。近期在可动画的 ava...

#research #paper #ai #computer-vision
1周前 · ai · - · -

【论文】Sessa：Selective State Space Attention

现代序列模型主要由 Transformers 主导，其中 self‑attention 以输入依赖的方式混合可见上下文的信息。然而，当 r...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 有界比率强化学习

Proximal Policy Optimization（PPO）已成为 on-policy 强化学习的主导算法，因为它具有可扩展性和经验鲁棒性……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] ReCap：轻量化指涉式 Grounding 用于连贯故事可视化

Story Visualization 旨在生成一系列图像，忠实地描绘文本叙事，保持角色身份、空间配置、...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 何时 LLMs 能在弱监督下学习推理？

大型语言模型通过强化学习与可验证奖励（RLVR）实现了显著的推理改进。然而，随着模型能力的...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] T-REN：学习文本对齐的区域标记提升稠密视觉语言对齐与可扩展性

尽管最近取得了进展，vision-language encoders 仍面临两个核心限制：(1) 语言与 dense vision features 之间的对齐较弱，这会导致……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 重新审视主动序列预测驱动的均值估计

在本工作中，我们重新审视了主动序列预测驱动的均值估计问题，其中在每一轮都必须决定 g 的查询概率……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] 潜在相位移回滚：通过残差流监控和 KV-Cache 引导进行推理时错误校正

大型语言模型在生成过程中经常会出现不可恢复的推理错误：一旦出现错误的步骤，后续的 token 会进一步加剧错误……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] MultiWorld: 可扩展的多智能体多视角视频世界模型

Video world models 在模拟用户或代理的动作所导致的环境动态方面取得了显著成功。它们被建模为动作‑…

#research #paper #ai #computer-vision

Newer posts

Older posts