Source

arXiv

4646 posts from this source

排序:

1个月前 · ai · - · -

[Paper] SPA：一个简单但难以超越的知识注入基线

虽然大型语言模型（LLMs）在海量数据上进行预训练，但它们在专业的、数据稀缺的领域中的知识覆盖仍然不完整，m...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 通过过滤合成语料库和两阶段 LLM 适配提升文档级机器翻译

在机器翻译领域，大型语言模型（LLMs）相较于传统的编码器-解码器系统通常表现不佳，因此其采用程度有限……

#research #paper #ai #machine-learning #nlp
1个月前 · software · - · -

[Paper] Agentic 程序验证中的引理发现

演绎验证通过提取验证条件（VCs）并为其编写形式化证明，为代码提供强大的正确性保证。实验...

#research #paper #software
1个月前 · software · - · -

[Paper] 从 Technical Debt 到 Cognitive 与 Intent Debt：在 AI 时代重新思考 Software Health

随着时间的推移，使软件系统能够安全更改的共享理解会悄然削弱。这种在团队中逐渐失去的理解会增加 cognitive load……

#research #paper #software
1个月前 · ai · - · -

[Paper] PreferRec：学习与迁移Pareto偏好用于多目标重新排序

Multi-objective re-ranking 已成为现代 multi-stage recommender systems 的关键组成部分，因为它的任务是平衡多个相互冲突的目标 su...

#research #paper #ai
1个月前 · software · - · -

[Paper] 动态分析提升问题解决

将自然语言描述转化为可行的代码修复仍然是软件工程中的一项根本性挑战。虽然 agentic lar...

#research #paper #software
1个月前 · ai · - · -

[Paper] 论文与代码匹配吗？生物信息学软件中论文‑代码一致性检测的基准与框架

确保研究论文与相应软件实现之间的一致性是软件可靠性和科学可重复性的基础。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] StreamSampling.jl：在 Julia 中对数据流的高效抽样

StreamSampling.jl 是一个 Julia 库，旨在提供通用且高效的单遍采样方法，即使在总数未知的情况下也能从数据流中进行采样。

#research #paper #software
1个月前 · software · - · -

[Paper] 验证大模型的实现等价性

在实践中，验证同一大型模型的两个实现跨框架是否等价是困难的。即使它们实现了相同的计算……

#research #paper #software
1个月前 · software · - · -

[Paper] 量化 FMEDA 安全指标中的不确定性：用于增强 ASIC 验证的误差传播方法

准确可靠的安全度量对于汽车系统中 ASIC 的功能安全验证至关重要。传统的 FMEDA（Failure Modes, Effects，...）

#research #paper #software
1个月前 · ai · - · -

[Paper] 推理溯源用于自主 AI 代理：超越状态检查点和执行轨迹的结构化行为分析

随着 AI agents 从 human-supervised copilots 转变为 autonomous platform infrastructure，分析它们在不同 populations 中的 reasoning behavior 的能力变得至关重要……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 通过涨落-响应结构实现最佳记忆编码

Physical reservoir computing 利用物理系统的内在动力学进行信息处理，同时保持内部动力学固定并训练…

#research #paper #ai
1个月前 · ai · - · -

[Paper] 进化式双方多目标 UAV 路径规划：问题与实证比较

无人机（UAV）已广泛用于城市任务，合理规划无人机路径可以提高任务效率并降低风险……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 压缩单像素成像通过波长复用空间非相干衍射光学处理器

尽管提供了高灵敏度、高 signal-to-noise ratio 和宽 spectral range，单像素成像（SPI）仍受限于低测量效率……

#research #paper #ai
1个月前 · devops · - · -

[Paper] 参数化自禁用单向环的活锁检测可判定性

我们证明，在参数化的 symmetric unidirectional rings 中，具有 bounded domain 的 self‑disabling processes 的 livelock detection 是 decidable 的，并且可以在 polynomial time 内完成。

#research #paper #devops
1个月前 · ai · - · -

[Paper] 工作负载-路由器-池架构用于 LLM 推理优化：来自 vLLM 语义路由器项目的愿景论文

在过去的一年里，vLLM Semantic Router 项目发布了一系列工作，涵盖：(1) 核心路由机制——signal-driven routing、context-length …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] NeSy-Edge：神经符号可信自愈在计算连续体

现代 AI 服务的计算需求正日益从集中式云端转移到覆盖边缘和终端的计算连续体中……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] 通信下界与使用随机稠密矩阵的草图算法

Sketching 在 randomized linear algebra 中被广泛用于 low-rank matrix approximation、column subset selection 以及许多其他问题，并且它已经获得了显著的关注。

#research #paper #devops
1个月前 · ai · - · -

[Paper] Elite Lanes: 进化生成真实小尺度道路网络

我们呈现了一项关于生成具有内置冗余的真实、受约束的小至中等规模道路网络的方法的比较研究。在本研究中，...

#research #paper #ai
1个月前 · ai · - · -

[Paper] MOELIGA：一种用于特征选择的多目标进化方法，带局部改进

选择最相关或最具信息量的特征是实际机器学习问题中的关键问题。由于即使对于一个小规模的情况，穷举搜索也是不可行的……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 语义章节：用于受阻表征空间的 Atlas-Native 特征本体

近期的可解释性工作常常将特征视为在不同上下文中共享的单一全局方向、dictionary atom 或 latent coordinate。我们认为 th...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 数值参数与结构参数的解耦：基于深度强化学习的自适应遗传算法在大规模 TSP 上的实证研究

适当的参数配置是进化算法（EAs）成功的前提。虽然已经提出了各种自适应策略，但它仍然...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] MME-CoF-Pro：评估视频生成模型在文本和视觉提示下的推理连贯性

视频生成模型展现出新兴的推理行为。确保生成的事件在帧之间保持因果一致性对于可靠的……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 从掩码到像素与意义：VLM 图像篡改的新分类法、基准与度量

现有的篡改检测基准在很大程度上依赖于 object masks，这与真实的 edit signal 严重不匹配：许多位于 mask 内的像素实际上未被修改……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] LumosX：将任意身份与其属性关联以实现个性化视频生成

近期在 diffusion models 方面的突破显著提升了 text-to-video generation，使得个性化内容创作能够实现细粒度的控制……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 确定性模式提议：对模糊分割的高效生成式采样替代方案

许多 segmentation 任务，例如 medical image segmentation 或 future state prediction，本质上是模糊的，这意味着多个预测同样……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[论文] MeanFlow 与控制的结合：可扩展的 Sampled-Data Control 用于群体

仅在少量控制更新下引导大规模群体具有挑战性，因为真实系统以采样数据形式运行：控制输入是间歇性更新的……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 野火蔓延场景：使用无训练方法提升 Segmentation Diffusion Models 的样本多样性

在不确定的环境中预测未来状态，例如野火蔓延、医学诊断或自动驾驶，需要能够考虑多…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] MuSteerNet：通过观察-反应相互引导从视频生成的人类反应

视频驱动的人体反应生成旨在合成直接响应观察到的视频序列的3D人体动作，这对于构建人类——

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 通过对Rectified Flow的重新表述改进图像到图像翻译

在本工作中，我们提出了 Image-to-Image Rectified Flow Reformulation (I2I‑RFR)，一种实用的插件式重构方法，将标准的 I2I 回归网络重新表述为……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] VideoSeek：长时程视频代理与工具引导的搜索

Video agentic models 已经推动了具有挑战性的视频‑语言任务的发展。然而，大多数 agentic 方法仍然在 densely sampled 的基础上严重依赖 greedy parsing ……

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] Kolmogorov-Arnold 因果生成模型

Causal generative models 为从观测数据中回答观测、干预和反事实查询提供了一个原理性的框架。然而……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 提升网络安全任务的泛化能力：多模态对比学习

在网络安全中使用 ML 长期受到泛化问题的阻碍：在受控场景中表现良好的模型在实际生产环境中往往无法保持性能。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 衡量忠实性取决于衡量方式：LLM Chain-of-Thought 评估中的分类器敏感性

最近关于 chain-of-thought (CoT) faithfulness 的研究报告了单一的整体数值（例如，DeepSeek‑R1 在 39% 的情况下会确认提示），暗示了 faithf...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 学习用于心智理论推理的动态信念图

理论心智（Theory of Mind，ToM）推理与大型语言模型（Large Language Models，LLMs）需要推断人们隐含的、不断演变的信念如何塑造他们的需求以及他们的行为……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 机器人的内在批评者：通过基于VLM的重新规划实现社会行为的自我精炼

传统的机器人社交行为生成在灵活性和自主性方面受到限制，依赖预定义的动作或人工反馈。本研究提出……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 在用户压力下评估指令微调语言模型中的 Evidence Grounding

在有争议的领域，instruction-tuned language models 必须在 user-alignment 压力与对 in-context evidence 的忠实性之间取得平衡。为了评估这一点……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 语义标记聚类用于大语言模型的高效不确定性量化

大型语言模型（LLMs）已经在各种任务中展示了卓越的能力。然而，它们输出的真实性并不能得到保证，且…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 通过基于注意力的池化增强 Hyperspace Analogue to Language (HAL) 表示用于文本分类

Hyperspace Analogue to Language (HAL) 模型依赖全局词共现矩阵来构建分布式语义表示。虽然这些…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 在对话中，推理对LLMs更困难

大型语言模型（LLMs）在许多推理基准上表现出色，但这些评估通常侧重于孤立的任务，这些任务与 r...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 重新审视 Gene Ontology 知识发现：层次特征选择与 AI 代理的虚拟学习小组

大语言模型在多个具有挑战性的任务中取得了巨大成功，其能力还可以通过新兴的 agentic AI 技术进一步提升。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] 使用 Cognitive Load-Related Linguistic Cues 预测解释性交互中的理解状态

我们研究在对话中说话者和听者所表现的 verbal 和 nonverbal 语言特征如何有助于预测听者的状态……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 人机协同软件交付编排：三个软件现代化项目的回顾性纵向现场研究

关于软件工程中 AI 的证据仍然主要倾向于个人任务完成，而关于团队层面交付的证据仍然稀缺。我们报告了一个 …

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] Stone-in-Waiting: 基于云的加速器用于量子近似优化算法

量子近似优化算法（QAOA）及其高级变体——量子交替算子 Ansatz（QAOA），是……

#research #paper #devops
1个月前 · software · - · -

[Paper] 在软件工程中使用 Lean Research Inception 教授实用相关的研究问题制定

[背景] 精心制定的软件工程（SE）研究问题对于弥合产业与学术之间的差距至关重要。Lean Research Inception（……）

#research #paper #software
1个月前 · ai · - · -

[Paper] 揭示配置调优的领域空间模式：领域知识与适应度景观

配置调优对于提升性能在质量保证中至关重要。然而，由于黑箱性质，调优器的有效性长期以来一直是个谜。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] GazePrinter：可视化专家视线以指导新手在新代码库中

程序理解是软件工程中的一项基本活动。它不仅经常给专业人士带来挑战，还可能阻碍新手的进步。

#research #paper #software
1个月前 · devops · - · -

[Paper] Kumo：面向安全的无服务器云模拟器

Serverless computing 抽象了基础设施管理，但也掩盖了可能导致安全风险的系统级行为。先前的工作已经表明，s...

#research #paper #devops

Newer posts

Older posts