Source

arXiv

4729 posts from this source

排序:

3个月前 · ai · - · -

[Paper] 学习无需人工知识的可证明正确的分布式协议

可证明正确的分布式协议是现代分布式系统的关键组成部分，设计它们极具挑战性，且通常需要 d...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 参数化与优化器在无梯度拓扑优化中的相互作用研究：悬臂梁案例研究

梯度无关的黑箱优化（BBO）在工程设计中被广泛使用，并为拓扑优化（TO）提供了灵活的框架，使得 d...

#research #paper #ai
3个月前 · ai · - · -

[Paper] RedSage：网络安全通用型 LLM

网络安全运营需要能够支持多样化工作流且不泄露敏感数据的助手 LLM。现有解决方案要么依赖于专有 API……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 使用 Pixel Mean Flows 的一步 Latent-free 图像生成

现代的 diffusion/flow-based 模型用于图像生成通常具有两个核心特征：(i) 使用多步采样，(ii) 在 latent …

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 在模型仓库中发现隐藏的宝石

公共仓库托管着数百万个微调模型，但社区的使用仍然过度集中在少数基础检查点上……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] Hybrid Linear Attention 正确实现：高效蒸馏与有效架构用于超长上下文

混合Transformer架构结合了softmax注意力块和循环神经网络（RNN），已展示出理想的性能‑吞吐量权衡……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 探索用于智能体的推理奖励模型

Agentic Reinforcement Learning（Agentic RL）在使智能体进行复杂推理和工具使用方面取得了显著成功。然而，大多数方法仍然…

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] UEval：统一多模态生成基准

我们推出了 UEval，这是一套用于评估统一模型的基准测试，即能够同时生成图像和文本的模型。UEval 包含 1,000 条专家策划的问题……

#research #paper #ai #nlp #computer-vision
3个月前 · ai · - · -

[Paper] DynamicVLA：用于动态对象操作的视觉-语言-动作模型

操纵动态对象仍然是视觉-语言-动作（Vision-Language-Action，VLA）模型的一个未解决的挑战，尽管这些模型在静态操纵方面表现出强大的泛化能力，却仍然...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[论文] 最新突破性成果：将神经网络转换为Logic Flows用于边缘计算

神经网络已成功应用于各种资源受限的边缘设备，在这些设备中通常使用中央处理单元（CPU）而不是图形处理单元（GPU）……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] VLM是感知还是回忆？使用经典视觉错觉探究视觉感知与记忆

大型视觉语言模型（VLMs）常常在原始图像上对经典视觉错觉给出“正确”的答案，但在错觉事实出现时仍坚持相同的回应……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] DynaWeb：基于模型的强化学习 Web 代理

自主网页代理的开发，由 Large Language Models (LLMs) 和 reinforcement learning (RL) 驱动，代表了朝向通用…的重大一步。

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[论文] FineInstructions：将合成指令扩展到预训练规模

由于监督训练数据有限，大型语言模型（LLMs）通常在庞大的文本语料上通过自监督的“预测下一个词”目标进行预训练。

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] JUST-DUB-IT：通过 Joint Audio-Visual Diffusion 实现视频配音

Audio-Visual Foundation Models，作为预训练模型，能够联合生成声音和视觉内容，最近展现出前所未有的建模多模态的能力……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 路由彩票：用于异构数据的自适应子网络

在剪枝中，Lottery Ticket Hypothesis 假设大型网络包含稀疏子网络（即 winning tickets），这些子网络可以单独训练，以匹配 …

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 边提问边推理：将推理大型语言模型从被动求解器转变为主动询问者

面向推理的 Large Language Models (LLMs) 已经通过 Chain-of-Thought (CoT) 提示取得了显著进展，但它们在根本上仍然受到限制……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] PRISM：分布无关的自适应矩阵函数计算以加速神经网络训练

矩阵函数，如 square root、inverse roots 和 orthogonalization，在用于神经网络训练的 preconditioned gradient methods 中发挥核心作用。T...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] StepShield：何时介入 Rogue Agents，而非是否介入

现有的智能体安全基准报告二元准确率，将早期干预与事后分析混为一谈。一个在第8步标记违规的检测器……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] PI-Light：Physics-Inspired Diffusion 用于全图重新照明

Full-image relighting 仍然是一个具有挑战性的问题，因为收集 large-scale structured paired data 的难度，以及保持物理…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 基于CT的胰腺癌早期及诊前检测

胰腺导管腺癌（PDAC）是最致命的实体恶性肿瘤之一，常在晚期且不可手术的阶段被发现。对既往的…进行回顾性审查。

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[论文] 为提示付费，而非答案：LLM Shepherding 用于成本高效推理

大型语言模型（LLMs）在复杂推理任务上提供最先进的性能，但其推理成本限制了大规模部署。Small Languag...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] SMOG：可扩展的元学习用于多目标贝叶斯优化

多目标优化旨在解决具有竞争目标的问题，通常只能以黑箱方式访问问题，并且测量预算有限……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 工作流世界：将 World Models 引入企业系统的基准

前沿的大型语言模型（LLMs）在许多领域作为自主代理表现出色，但它们在隐藏工作流的复杂企业系统中仍未经过测试……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] SWE-Replay：面向软件工程代理的高效测试时扩展

测试时缩放已被广泛采用，以增强大型语言模型（LLM）代理在软件工程（SWE）任务中的能力。然而，the sta...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] EditYourself：Audio-Driven 生成与操控 Talking Head 视频，使用 Diffusion Transformers

当前的生成式视频模型在根据文本和图像提示生成新内容方面表现出色，但在编辑已有的预录制视频方面仍存在关键缺口，……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 使用 Diffusion Model 的创意图像生成

创意图像生成已成为一个引人注目的研究领域，驱动力在于需要产生新颖且高质量的图像，以拓展边界。

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 医学中大语言模型训练的联邦与参数高效框架

大型语言模型（LLMs）在医学基准测试中表现出色，包括问答和诊断。为了使它们在临床...

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] ECO: 量化训练无需全精度主权重

量化显著提升了大型语言模型（LLM）训练的计算和内存效率。然而，现有方法仍然依赖于…

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 焦耳去哪儿了？诊断推理能耗

能源现在已成为关键的ML计算资源。虽然测量能源消耗并观察趋势是一个有价值的第一步，但准确理解和 d...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] Lens-descriptor 引导的进化算法用于含玻璃选择的复杂光学系统优化

设计高性能光学透镜需要在一个高维、受严格约束的空间中探索表面曲率、玻璃选择、元件厚度……

#research #paper #ai
3个月前 · ai · - · -

[Paper] 当“更好”的 Prompt 伤害时：评估驱动的迭代用于 LLM 应用

评估大语言模型（LLM）应用与传统软件测试不同，因为其输出具有随机性、高维性，并且对……敏感。

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 异构计算：驱动 AI Agent 推理未来的关键

AI 代理推理正在推动一个以推理为主的数据中心未来，并暴露出超出计算的瓶颈——尤其是内存容量、内存带宽以及高…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] Liquid Interfaces：用于自主系统互操作性的动态本体

当代软件架构在支持推理具有适应性、概率性和上下文依赖性的自主代理时面临困难，同时系统集成……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 学习去中心化 LLM 协作的多智能体 Actor Critic

最近的研究探索了通过多智能体强化学习（MARL）来优化大型语言模型（LLM）的协作。然而，大多数 MARL 微调方法依赖于预先…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 领域模型设计对经典规划的能量影响

AI 研究传统上优先考虑算法性能，例如在 machine learning 中优化准确率或在 automated planning 中优化运行时间。新兴的...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] Equilibrium Propagation 训练成功对网络架构的依赖

人工智能的快速崛起导致能源消耗的不可持续增长。这激发了类脑计算和ph...

#research #paper #ai #machine-learning
3个月前 · devops · - · -

[Paper] Belief Propagation 在稀疏连接的因子图中收敛到高斯分布

信念传播（BP）是一种用于概率图模型中分布式推理的强大算法，但它很快在实际应用中变得不可行……

#research #paper #devops
3个月前 · ai · - · -

[Paper] 自适应 Surrogate-Based 策略用于加速求解昂贵的无约束多目标优化问题的收敛速度

多目标进化算法（MOEAs）已被证明在解决多目标优化问题（MOOPs）方面有效。然而，它们的性能可能会……

#research #paper #ai
3个月前 · ai · - · -

[Paper] 基准的演进：通过大语言模型的黑盒优化基准设计

Benchmark Design 在 Black-Box Optimization (BBO) 中是一个基础且仍未结束的话题。早期的 BBO 基准主要是人工制作的，引入了专家……

#research #paper #ai
3个月前 · devops · - · -

[Paper] 自适应概率天际线查询处理在分布式边缘计算中的深度强化学习

在万物互联（IoE）时代，网络边缘传感器生成数据的指数级增长使得高效的 Probabilistic Skyline Query …

#research #paper #devops
3个月前 · ai · - · -

[Paper] READY：奖励发现用于元黑箱优化

Meta-Black-Box Optimization（MetaBBO）是优化社区中新兴的研究方向，在该方向中，算法设计策略可以通过强化学习进行元学习……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 架起预测准确性与库存KPIs之间的桥梁：基于仿真的软件框架

在汽车后市场中，高效的备件库存管理至关重要，因为需求高度间歇且不确定性导致巨大的成本……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] DASH：确定性注意力调度用于高吞吐可复现的 LLM 训练

确定性对于大语言模型（LLM）训练中的可重复性是必不可少的，但它往往会带来巨大的性能代价。在广泛使用的注意力 …

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 通用自预测增强用于脉冲神经元

脉冲神经网络（SNNs）由于事件驱动的稀疏计算而具有极高的能效，但其训练受到脉冲不可微分性的挑战。

#research #paper #ai
3个月前 · software · - · -

[Paper] 软件工程中的 Folklore：定义与概念基础

我们探讨 software engineering 中的 folklore 概念，借鉴 folklore studies 来定义和刻画 narratives、myths、rituals、humor，以及……

#research #paper #software
3个月前 · ai · - · -

[Paper] 评估大型语言模型的业务流程建模能力

创建业务流程模型与标记（BPMN）模型是一项复杂且耗时的任务，需要领域知识和建模熟练度……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 错误放大限制了 ANN 到 SNN 转换在连续控制中的表现

脉冲神经网络（SNNs）可以通过转换已有的、训练良好的人工神经网络（ANNs）来实现竞争性的性能，避免进一步…

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] 面向软件工程同行评审的可持续未来

同行评审是软件工程社区评估科学成果质量的主要机制。然而，论文提交的快速增长……

#research #paper #software

Newer posts

Older posts