Source

arXiv

4654 posts from this source

排序:

1个月前 · ai · - · -

[Paper] 基于物理信息的稳化有限元解后处理用于瞬态对流占优问题

对 convection-dominated 瞬态传输现象的数值模拟，由于出现 sharp gradients 和 propagating ……，面临显著的计算挑战。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Inherited Goal Drift：情境压力可能削弱Agentic Goals

语言模型（LMs）作为代理在长上下文任务中的部署日益加速，这促使我们必须深入了解目标漂移：代理的…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Valet：传统不完全信息纸牌游戏的标准化测试平台

针对不完全信息游戏的 AI 算法通常使用单个游戏的性能指标进行比较，这使得评估其鲁棒性变得困难……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 推测式推测式解码

自回归解码受其顺序特性限制。投机解码已经成为通过使用快速草稿模型来加速推理的标准方法。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 使用学习进程指导 AI 反馈以促进科学学习

生成式人工智能（AI）提供了可扩展的形成性反馈支持，但大多数 AI 生成的反馈依赖于任务特定的评分标准……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] UniG2U-Bench：统一模型是否推动多模态理解的进步？

统一的多模态模型最近展示了强大的生成能力，但生成何时以及是否提升了理解仍不清楚。Exi...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[论文] 关于 Autoencoder 降阶模型中几何正则化及其潜在 Neural ODE 动力学

我们研究在编码器‑解码器降阶模型中对学习到的潜在表示进行几何正则化的策略。在固定的实验设置中……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] The elbow statistic: 多尺度聚类统计显著性

在无监督学习中，选择聚类数仍然是一个根本性的挑战。现有的标准通常针对单一的“optimal”划分，……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SynthCharge：一种用于电动汽车路径规划的实例生成器，具备可行性筛选，以实现基于学习的优化和基准测试

电动汽车路径问题（带时间窗，EVRPTW）在经典的 VRPTW 基础上加入了电池容量约束和充电站决策……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 用于物理信息神经网络的稳定自适应损失与基于残差的配点

Physics-Informed Neural Networks (PINNs) 已被视为一种无网格的替代方法，用于求解包含物理信息的偏微分方程……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] NeuroSkill™：主动实时代理系统，具备建模人类心智状态的能力

实时主动的代理系统，能够建模人类心理状态，使用 foundation EXG 模型和文本嵌入模型，完全离线运行于 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 理解与缓解 LLM Steering 中的数据集损坏

Contrastive steering 已被证明是一种简单且有效的方法，可在 inference time 调整 LLMs 的生成行为。它使用 prompt 示例……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 学习何时行动或拒绝：为安全的多步工具使用保护Agentic Reasoning模型

Agentic language models 在安全机制上与 chat models 完全不同：它们必须进行计划、调用工具，并执行 long-horizon actions …

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 无记忆，无检测：基于输出分布的小语言模型污染检测

CDD（Contamination Detection via output Distribution），通过测量模型采样输出的峰度来识别数据污染。我们研究了……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] MoD-DPO：通过模态解耦偏好优化缓解全能大语言模型中的跨模态幻觉

Omni-modal 大语言模型（omni LLMs）最近在视听理解任务上取得了强劲的表现，但它们仍然高度易受…

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] 类型感知检索增强生成与依赖闭包用于求解器可执行的工业优化建模

自动化工业优化建模需要将自然语言需求可靠地转换为 solver‑executable code。然而，large language models ...

#research #paper #ai #machine-learning #nlp
1个月前 · software · - · -

[论文] RippleGUItester：变更感知的探索性测试

软件系统通过频繁的代码更改不断演进，然而尽管进行了大量的测试和代码审查，这些更改仍常常引入意想不到的 bug ……

#research #paper #software
1个月前 · devops · - · -

[Paper] 短时轻量流的 Serverless 抽象

Serverless 计算和流处理代表了两种主导的事件驱动数据处理范式，但它们都做出了一些假设，使其在许多真实工作负载下效率低下。Serverless 平台假设每次函数调用是相互独立的，这阻止了跨调用重用状态。流处理系统假设数据流是无限的，这迫使它们无限期地保留状态。在本文中，我们提出了一种新模型，称为 “stateful serverless”，它融合了两者的优势：允许函数在调用之间保留和共享状态，同时仍提供 Serverless 的弹性和按需付费定价模型。我们在 Apache Flink 和 AWS Lambda 之上实现了原型，并在包括 real‑time analytics、online machine learning 和 complex event processing 在内的一系列 benchmark 中进行评估。结果表明，stateful serverless 相比传统 Serverless 可实现最高 3× 的 latency 降低和 2× 的 throughput 提升，资源使用相当。我们还讨论了该新模型在 debugging、monitoring 和 security 方面的挑战，并概述了未来工作的方向。

#research #paper #devops
1个月前 · ai · - · -

[Paper] REGAL：基于注册表驱动的架构，实现企业遥测中Agentic AI的确定性落地

企业工程组织从 version control systems、CI/CD pipelines、issue trackers 和 observability 平台产生高容量、异构的 telemetry。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[论文] 它活了！Live Object Environment 在软件工程实践中的变化

工具塑造我们的思维。这就是为什么拥有可扩展且灵活的工具对开发者适应其需求至关重要。对程序的推理在……

#research #paper #software
1个月前 · devops · - · -

[Paper] 可扩展的网格耦合用于大气波模拟

我们描述了在两个求解器的重叠网格区域中进行解数据插值的可扩展算法的应用。此特性对于……

#research #paper #devops
1个月前 · ai · - · -

[Paper] SEALing the Gap：一种基于多基准驱动的 LLM 推理碳排放估计参考框架

大型语言模型在软件工程领域迅速获得关注，但它们日益增长的碳足迹引发了迫切的可持续性问题。虽然 tr...

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] 通过主动学习和可解释AI降低架构技术债务检测中的标注工作量

自认技术债务（Self‑Admitted Technical Debt，SATD）指的是开发者在代码注释、提交信息等自然语言工件中明确承认的技术折衷。

#research #paper #software
1个月前 · devops · - · -

[Paper] MuxTune：通过时空骨干多路复用实现多租户数据中心中高效的多任务 LLM 微调

Parameter-Efficient Fine-Tuning (PEFT) 在数据中心中被广泛用作大语言模型（LLM）定制的微调 API 的后端。Service…

#research #paper #devops
1个月前 · software · - · -

[论文] ICSE 2023 可持续性报告

随着对学术会议碳足迹的讨论日益增多，越来越多的问题被提出，是否应该关注交通等造成的环境影响……

#research #paper #software
1个月前 · devops · - · -

多意见下的未决定状态动力学

我们研究未决定状态动力学（Undecided-State Dynamics，USD），这是一种基本的共识过程，其中每个顶点持有 k 种已决定的意见之一或未决定状态。我们 con...

#research #paper #devops
1个月前 · software · - · -

[Paper] His2Trans：一种骨架优先框架用于自演化 C 到 Rust 翻译与历史检索

自动化的 C 到 Rust 迁移在从代码片段扩展到工业项目时遇到系统性障碍，主要是因为构建上下文往往不可用……

#research #paper #software
1个月前 · devops · - · -

[Paper] 为什么原子性对 AI/ML 基础设施很重要：快照、固件更新以及仅前向时间类别错误的代价

大规模 AI/ML 训练系统依赖于两个很少被审视的假设：(1) checkpoints 代表全局训练状态的原子快照，...

#research #paper #devops
1个月前 · ai · - · -

[Paper] ParEVO：为不规则数据合成代码：通过 Agentic Evolution 实现高性能并行

从顺序计算向并行计算的转变对于现代高性能应用至关重要，但受到并发编程陡峭学习曲线的阻碍……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] HiFi-Inpaint：面向高保真基于参考的图像修复，以生成细节保留的人体‑产品图像

Human-product images（展示人类与产品融合的图像）在广告、电子商务和数字营销中发挥着至关重要的作用。关键是……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 推理核心：可扩展的过程式数据生成套件，用于符号预训练和后训练

在可验证的符号数据上进行训练是扩展语言模型推理能力边界的有前景的方法，超越标准预训练语料库所能提供的范围。Y...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 部分因果结构学习用于在干预下的有效选择性共形推断

当我们能够识别与测试样本可交换的校准样本时，选择性共形预测可以产生显著更紧的不确定性集合。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 测试时强化学习的工具验证

Test-time reinforcement learning (TTRL) 已成为自我进化的大型推理模型 (LRMs) 的一种有前景的范式，使其能够在未标记的数据上进行在线适应。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 符号等变循环推理模型

像 Sudoku 和 ARC-AGI 这样的推理问题对神经网络仍然具有挑战性。结构化问题求解架构家族 Recurrent Reasoning …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] Sketch2Colab：草图条件的多人物动画通过可控流蒸馏

我们提出了 Sketch2Colab，它将 storyboard 风格的 2D 草图转换为连贯、具备对象感知的 3D 多人物动作，并对 agents、关节等实现细粒度控制。

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 多头低秩注意力

大语言模型的长上下文推理在解码阶段受到键值（KV）缓存加载的瓶颈限制，因为生成的顺序性……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] MAC：一个包含多归因机制下标签的转化率预测基准

Multi-attribution learning (MAL)，通过学习由多个 attribution mechanisms 产生的 conversion labels 来提升模型性能，已成为……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 利用 Model Soups 对湄公河三角洲的非物质文化遗产图像进行分类

湄公河三角洲的非物质文化遗产（ICH）图像分类因标注数据有限、视觉相似度高等因素而面临独特的挑战……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

【论文】在 Top-n Whitening 下的在线 ICA 的 Reservoir Subspace Injection

储层扩展可以在非线性混合下提升在线独立成分分析（ICA）的效果，但 top‑n 白化可能会丢弃注入的特征。我们正式…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 组织、编排与基准测试 Agent Skills 在生态系统规模下

Claude 代理技能的快速激增提出了一个核心问题：如何有效利用、管理和扩展代理技能生态系统。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] Kiwi-Edit：多功能视频编辑：通过指令和参考引导

基于指令的视频编辑取得了快速进展，但现有方法常常在精确的视觉控制方面遇到困难，因为自然语言本质上是……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[论文] SageBwd：可训练的低位注意力

低位注意力（如 SageAttention）已成为加速模型推理的有效方法，但其在训练中的适用性仍然较差……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 扩展 Retrieval Augmented Generation 与 RAG Fusion：行业部署经验

检索增强生成（Retrieval‑Augmented Generation，RAG）系统通常采用检索融合技术，例如多查询检索和倒数排名融合（reciprocal rank fusion，RRF）来增加……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 零样本和少样本命名实体识别：犯罪领域的案例研究与数据集 (CrimeNER)

从与犯罪相关的文档中提取关键信息是执法机构的一项关键任务。命名实体识别 (NER) 可以执行……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] LongRLVR：长上下文强化学习需要可验证的上下文奖励

强化学习与可验证奖励（RLVR）通过对大型语言模型（LLMs）进行优化，显著提升了它们的推理能力……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 更大是否总是更好？资源受限小目标检测的效率分析

Scaling laws 假设在更多数据上训练的更大模型始终优于较小的模型——这一假设驱动了计算机视觉中的模型选择，但……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] LLMs 作为战略行为者：行为对齐、风险校准与论证框架在地缘政治模拟中的研究

大型语言模型（LLMs）正日益被提出作为战略决策环境中的代理，但它们在结构化的地缘政治模拟中的行为仍然……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 用于长期推理的递归模型

现代语言模型在有界上下文中进行推理，这一固有约束对长期推理构成了根本障碍。我们识别 recursion a...

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts