Source

arXiv

4750 posts from this source

排序:

4个月前 · ai · - · -

[Paper] FedHypeVAE：联邦学习与超网络生成的条件VAE用于差分隐私嵌入共享

联邦数据共享承诺在不集中原始数据的情况下提供实用性，但现有的嵌入级生成器在非IID客户端异质性和p...

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 分类重新参数化与去噪扩散模型

基于梯度的优化在处理分类变量时通常依赖于 score-function estimators，它们是无偏的但噪声较大，或者依赖于 continuous relaxations……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 研究在音频深度伪造检测背景下使用多模态大型语言模型的可行性

虽然视觉语言模型（VLMs）和多模态大语言模型（MLLMs）在检测图像和视频深度伪造方面表现出强大的泛化能力，但它们的…

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] LLM 代理用于组合有效前沿：投资组合优化

投资组合优化是所有主要金融机构开展的任务。基数约束均值-方差投资组合优化（Cardinality Constrained Mean-Variance Portfolio Optimization，CCP）...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 统一原语代理用于结构化形状补全

结构化形状补全将缺失的几何体恢复为基元，而不是无结构点，这使得基元驱动的表面重建成为可能。 In...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 用于大语言模型持续适应的 Memory Bank Compression

大型语言模型（LLMs）已成为许多日常应用的主流。然而，随着数据的演变，它们的知识很快就会过时。持续…

#research #paper #ai #machine-learning #nlp
4个月前 · software · - · -

[Paper] AI生成的 Pull Requests 审查工作量早期预测

随着自主 AI 代理从代码补全工具转变为能够大规模打开拉取请求（PR）的完整团队成员，软件维护者 fa...

#research #paper #software
4个月前 · ai · - · -

[Paper] 足球中非持球防守角色与表现评估的机器学习框架

评估足球中的无球防守表现具有挑战性，因为传统指标无法捕捉限制对手的细微协同动作……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 推理‑创造力权衡：迈向以创造力驱动的问题解决

最先进的大型语言模型（LLM）流水线依赖于自举推理循环：采样多样的思考链，并强化得分最高的……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 用于 Neuro-Symbolic Programming 的 Agentic 框架

将符号约束集成到深度学习模型中可以使它们更具鲁棒性、可解释性和数据效率。尽管如此，这仍然是一个耗时的…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 随机 Actor-Critic：通过时间性 Aleatoric 不确定性缓解高估

在强化学习中，离策略 actor-critic 方法使用时序差分更新来训练 critic，并将其作为策略（actor）的学习信号……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 探索大语言模型在主观跨度识别任务上的性能

识别相关文本片段对于自然语言处理（NLP）中的多个下游任务非常重要，因为它有助于模型可解释性。虽然大多数片段识别方法……

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] 使用多模态大语言模型对手写工程考试进行评分

手写的 STEM 考试捕捉开放式推理和图示，但人工评分速度慢且难以规模化。我们提出了一种端到端的工作流用于评分……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[论文] 基于上下文赌博机的RL的线性求解器精度自动调优

我们提出一个强化学习（RL）框架，用于线性求解器的自适应精度调节，并且可以扩展到通用算法。该框架是 …

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 多层特征融合用于视觉质量检测的持续学习

深度神经网络在制造业中自动化各种视觉质量检测任务方面显示出巨大的潜力。然而，它们的适用性在…

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 检测病理视觉-语言模型在数据漂移下的性能下降

Vision-Language Models 已经在医学图像分析和疾病诊断中展示了强大的潜力。然而，在部署后，它们的性能可能…

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 使用空间下采样各向同性网络的高效深度去马赛克

在数字成像中，图像去马赛克是一个关键的第一步，它从颜色滤光阵列（CFA）中恢复RGB信息。通常，深度学习被…

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] BSAT: B-Spline 自适应分词器用于长期时间序列预测

使用 transformer 进行长期时间序列预测受到自注意力二次复杂度和统一切片刚性的阻碍，这可能会……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 视觉与知识增强的大型语言模型用于可推广的行人过街行为推断

现有用于推断行人过街行为的范式，从统计模型到监督学习方法，表现出有限的泛化能力……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] TeleDoCTR：面向电信的领域特定与上下文故障排除

Ticket troubleshooting 指的是通过工单系统报告的问题进行分析和解决的过程。在大型组织提供的…

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] 生产线成本优化：使用遗传算法

本文提出了一种遗传算法（GA）方法，用于生产线中成本最优的任务调度。系统由一组串行处理任务组成……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Sigmoid Head 在语言歧义下的质量估计

语言模型（LM）概率并不是可靠的质量评估指标，因为自然语言是模糊的。当多个输出选项都是有效的时，模型的概率……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] QSLM：一种面向性能和内存感知的量化框架，采用分层搜索策略用于Spike驱动语言模型

大型语言模型（LLMs）因其高性能（例如准确率）而逐渐成为解决众多自然语言任务的突出 AI 模型……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] IRPO：通过强化学习实现Bradley‑Terry模型的规模化

生成奖励模型（Generative Reward Models，GRMs）因其可解释性、推理时的可扩展性以及……而在奖励建模领域受到广泛研究兴趣。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[论文] Fast-weight Product Key Memory

现代语言模型中的序列建模层通常在存储容量和计算效率之间面临权衡。虽然 Softmax attention …

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] 脉冲神经网络的三因素延迟学习规则

脉冲神经网络（SNN）是对时空数据进行处理的动力系统，但它们的可学习参数通常仅限于突触权重，...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Physio-DPO：对齐大型语言模型与蛋白质能量景观以消除结构幻觉

Large Protein Models 已显示出在 generative protein design 方面的强大潜力，但它们经常产生 structural hallucinations，生成序列……

#research #paper #ai #nlp
4个月前 · devops · - · -

[Paper] FlexSpec：冻结草稿与演化目标在边缘-云协同 LLM 推测解码中的结合

在移动和边缘计算环境中部署大型语言模型（LLMs）受到设备资源有限、无线带宽稀缺以及…

#research #paper #devops
4个月前 · ai · - · -

[Paper] 对降低LLMs中上下文幻觉的概率保证

大型语言模型（LLMs）经常产生上下文幻觉，即生成的内容与提示中明确陈述的信息相矛盾或被忽略。

#research #paper #ai #nlp
4个月前 · software · - · -

[Paper] SEMODS：已验证的开源软件工程模型数据集

将人工智能集成到软件工程（SE）中，需要拥有一套针对 SE 任务精心挑选的模型集合。随着模型数量达到数百万……

#research #paper #software
4个月前 · software · - · -

[论文] KELP：通过进化分组树实现稳健的在线日志解析

实时日志分析是现代基础设施可观测性的基石。然而，现有的在线解析器在架构上并不适合动态……

#research #paper #software
4个月前 · software · - · -

[Paper] 通过真实世界利用深入理解和表征智能网联汽车的漏洞

智能联网车辆（ICVs）是现代交通系统的核心组成部分，其安全性至关重要，因为它直接关系到用户安全……

#research #paper #software
4个月前 · ai · - · -

[Paper] 超越 IVR：面向业务合规的客户支持 LLM 代理基准测试

传统的客户支持系统，例如交互式语音应答（Interactive Voice Response (IVR)），依赖于僵化的脚本，缺乏处理复杂、…所需的灵活性。

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] ERP分析基准测试：手工特征、深度学习与基础模型

事件相关电位（ERP），一种专门的脑电图（EEG）范式，反映了对外部刺激或事件的神经反应，通常……

#research #paper #ai
4个月前 · devops · - · -

[论文] 基于云的零售POS系统成本‑性能分析：Google Cloud Platform 与 Microsoft Azure 的比较研究

虽然关于零售工作负载的特定平台性能的实证研究很少，但零售行业的数字化转型已经加速了……

#research #paper #devops
4个月前 · ai · - · -

[Paper] 大模型的联邦定制：方法、实验与洞见

在本文中，我们探讨 federated customization of large models，并强调它在 federated learning 框架中带来的关键挑战。我们回顾……

#research #paper #ai #machine-learning
4个月前 · software · - · -

[Paper] STELLAR：基于搜索的用于大语言模型应用的测试框架

Large Language Model (LLM) 基于的应用正日益在包括客户服务、教育和出行等各个领域部署。然而，...

#research #paper #software
4个月前 · ai · - · -

[Paper] 多代理协同重命名重构

AI agents 在 software development 中的主要价值在于它们能够扩展开发者的推理和行动能力，而不是取代人类……

#research #paper #ai #machine-learning
4个月前 · software · - · -

[Paper] AI 队友时代的安全：GitHub 上 Agentic Pull Requests 的实证研究

Autonomous coding agents 正日益被部署为现代软件工程中的 AI teammates，能够独立创建修改生产代码的 pull requests (PRs)…

#research #paper #software
4个月前 · software · - · -

[Paper] DSL或代码？评估LLM生成的代数规范质量：Kinaxis优化案例研究

模型驱动工程（Model-driven engineering，MDE）提供抽象和分析严谨性，但在许多领域的工业采用受到开发……成本的限制。

#research #paper #software
4个月前 · ai · - · -

[Paper] 二次无约束二进制优化用于二值神经网络的训练与正则化

人工智能（AI）和深度学习的进步引发了对其日益增长的能源消耗的担忧，同时对在移动设备上部署 AI 的需求……

#research #paper #ai
4个月前 · software · - · -

[Paper] 关于抄袭与软件抄袭

本文探讨了自动检测 software similarities 的复杂性，结合 digital artifacts 的独特挑战，并介绍了……

#research #paper #software
4个月前 · ai · - · -

[Paper] RMAAT：星形胶质细胞启发的记忆压缩与重放用于高效长上下文Transformer

self-attention 机制的二次复杂度对将 Transformer 模型应用于长序列构成了显著障碍。本文工作探索…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 安全、可验证且可扩展的多客户端数据共享：基于共识的隐私保护数据分发

我们提出了Consensus-Based Privacy-Preserving Data Distribution (CPPDD)框架，这是一种轻量级且在设置后自主运行的安全多客户端协议……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Revati：透明 GPU-Free Time‑Warp 仿真用于 LLM 服务

部署 LLMs 高效地需要测试数百种 serving 配置，但在 GPU cluster 上评估每一种都需要数小时，且花费数千美元……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 基于 Serverless MapReduce 的词频统计

随着对高性能和高效率计算需求的不断增长，云计算，尤其是 serverless computing，已逐渐成为研究的热点……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 生物启发的代理式自愈框架用于弹性分布式计算连续体系统

人类生物系统通过非凡的韧性维持生命，不断检测损伤，协调有针对性的响应，并恢复功能 t...

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] 从共识到混沌：RAFT算法的漏洞评估

在最近几十年，RAFT 分布式共识算法已成为分布式系统生态系统的主要支柱，确保数据一致性和容错……

#research #paper #devops

Newer posts

Older posts