Source

arXiv

4611 posts from this source

排序:

0个月前 · software · - · -

[论文] LLM 作为惯用反编译器：从 x86-64 汇编恢复 Dart 的高级代码

将机器码翻译成人类可读的高级语言是逆向工程中的一个开放研究问题。尽管最近在基于 LLM 的技术方面取得了进展……

#research #paper #software
0个月前 · ai · - · -

[Paper] De Jure：迭代 LLM 自我精炼用于监管规则的结构化抽取

监管文件编码了LLM‑based系统必须遵守的具有法律约束力的义务。然而，将密集、层次结构化的法律文本转换为……

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] Crystalite：一种轻量级 Transformer 用于高效晶体建模

生成模型用于晶体材料通常依赖于等变图神经网络，这些网络能够很好地捕捉几何结构，但训练成本高且 …

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] SKILL0：上下文内代理式强化学习用于技能内化

Agent skills，结构化的过程知识和可执行资源包，代理在推理时动态加载，已成为可靠的机制……

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] VISTA：通过高效分析进行令牌归因可视化

理解大型语言模型（LLMs）如何从提示中处理信息仍然是一个重大挑战。为了揭示这个“黑箱”，attention vi...

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] CV-18 NER：增强的 Common Voice 用于阿拉伯语语音的命名实体识别

端到端语音 Named Entity Recognition (NER) 旨在直接从语音中提取实体。已有研究表明，端到端 (E2E) 方法可以超越……

#research #paper #ai #nlp
0个月前 · software · - · -

[Paper] gNB 单站感知在 UAV 用例中的评估

3GPP Release 19 已启动对集成感知与通信（ISAC）的标准化工作，包括单站感知的信道模型、评估……

#research #paper #software
0个月前 · ai · - · -

[Paper] 面向位置鲁棒的人才推荐：基于大型语言模型

人才招聘是许多行业的关键但成本高昂的过程，招聘成本高且招聘周期长。现有的人才推荐系统...

#research #paper #ai #nlp
0个月前 · ai · - · -

[Paper] Neuro‑RIT：神经元引导的指令微调用于鲁棒检索增强语言模型

检索增强语言模型（RALMs）已在知识密集型任务中展示出显著潜力；然而，它们仍然在性能方面易受…

#research #paper #ai #machine-learning #nlp
0个月前 · devops · - · -

[论文] 在平均匿名网络中可以计算什么？

我们研究 deterministic distributed algorithms 在 extremely weak models of distributed computing 中对 random input graphs 能计算什么：所有节点都是 anonymous……

#research #paper #devops
0个月前 · software · - · -

[Paper] 基于种群的语义演化用于 LLM 引导的自动程序修复

大型语言模型（LLMs）最近在自动程序修复（APR）方面展现出强大的潜力，尤其是通过生成…的迭代细化。

#research #paper #software
0个月前 · ai · - · -

智能云编排：一种用于成本优化的混合预测与启发式框架

云计算允许可扩展的资源供应，但动态工作负载的变化常常导致因过度供应而产生更高的成本。机器学习（ML）a...

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] RuleForge：自动化生成与验证用于大规模网络漏洞检测

安全团队面临一个挑战：新披露的 Common Vulnerabilities and Exposures (CVEs) 数量远远超过手动开发检测的能力……

#research #paper #ai #machine-learning #nlp
0个月前 · devops · - · -

[Paper] 基于云的数据管道基础设施的优化机会

云基础设施支持数据管道在成本、速度和资源利用等需求方面的高效运行。我们提出一个 integra...

#research #paper #devops
0个月前 · software · - · -

[Paper] 从组件操控到系统妥协：理解与检测恶意 MCP 服务器

模型上下文协议（MCP）标准化了 LLM 与外部工具和数据源的连接方式，实现更快的集成，但也带来了新的攻击向量……

#research #paper #software
0个月前 · ai · - · -

[Paper] 学习何时能带来回报？基于DRL的动态算法配置在碳感知调度中的研究

深度强化学习（DRL）最近已成为动态算法配置（DAC）的有前景的工具，使进化算法能够适应 …

#research #paper #ai
0个月前 · ai · - · -

[论文] DDCL-INCRT：一种具有层次原型结构的自组织Transformer（理论基础）

现代的 Transformer 系列神经网络要求实践者在训练开始之前决定使用多少个 attention heads，网络的深度是多少，……

#research #paper #ai #machine-learning
0个月前 · devops · - · -

[Paper] GPU‑RMQ：在现代 GPU 上加速范围最小值查询

范围最小值查询在字符串处理和数据库应用中被广泛使用，包括生物序列分析、文档检索和网络搜索等。

#research #paper #devops
0个月前 · ai · - · -

[Paper] FourierMoE：大语言模型的 Fourier Mixture-of-Experts 适配

参数高效微调（PEFT）已成为在受限计算预算下适配大型语言模型（LLMs）的关键范式。然而...

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] DDCL：Deep Dual Competitive Learning：可微分端到端框架用于无监督原型式表征学习

深度聚类中一个持续存在的结构性弱点是特征学习与聚类分配之间的脱节。大多数架构调用外部 clu...

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[论文] DWDP：分布式权重数据并行用于 NVL72 上的高性能 LLM 推理

大语言模型（LLM）推理日益依赖多GPU执行，然而现有的推理并行化策略需要层级间的…

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] ModTrans：翻译真实世界模型以用于分布式训练模拟器

大规模分布式训练近年来已成为工业界和学术界机器学习系统研究的热点。然而，进行实验…

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] 基于振荡器的联想记忆的指数容量：理论、算法与硬件实现

关联记忆系统实现对模式的内容可寻址存储和检索，这一能力是生物神经计算和人工……的核心。

#research #paper #ai
0个月前 · devops · - · -

[Paper] 分布式变分量子线性求解器

本文开发了一种用于求解大规模线性方程的分布式 variational quantum algorithm。对于形式为 Ax = b 的线性系统，大规模的方阵……

#research #paper #devops
0个月前 · ai · - · -

[Paper] 进化式多目标融合深度伪造语音检测器

虽然基于 large self-supervised learning (SSL) 模型的 deepfake speech detectors 能够实现高准确率，但采用标准的 ensemble fusion 来进一步增强……

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[论文] 通用 YOCO 用于高效深度缩放

测试时规模化的兴起显著提升了大型语言模型（LLMs）的推理和代理能力。然而，标准的Transformers仍然面临困难……

#research #paper #ai #nlp
0个月前 · ai · - · -

[Paper] 使用浅层循环解码器从短时间序列进行潜在相位推断 (LAPIS-SHRED)

从空间和时间上稀疏的观测中重建完整的 spatio-temporal dynamics 仍然是复杂系统中的核心挑战，因为测量可能…

#research #paper #ai #machine-learning #computer-vision
0个月前 · ai · - · -

[Paper] 配方比厨房更重要：AI 天气预测流水线的数学基础

AI 天气预测发展迅速，但尚未有统一的数学框架解释什么决定了预报技能。现有理论针对特定的...

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] $texttt{YC-Bench}$：基准测试 AI 代理的长期规划和一致执行

随着 LLM agents 处理日益复杂的任务，一个关键问题是它们能否在长期范围内保持 strategic coherence：在不确定性下进行 planning ……

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] TRACE：通过可触知重建和几何对齐的上下文视频掩码实现高保真 3D 场景编辑

我们提出了 TRACE，一个基于网格引导的 3DGS 编辑框架，实现了自动化、高保真度的场景转换。通过使用显式的 3…

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] LLM 回归与潜在迭代状态头

我们提出了 RELISH（REgression with a Latent Iterative State Head），一种新颖的轻量级架构，专为使用大型语言模型进行文本回归设计。Ra...

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] 神经谐波纹理用于高质量基元式神经重建

基于基元的方法，如 3D Gaussian Splatting，最近已成为新视角合成及相关重建任务的最先进技术。Compa...

#research #paper #ai #machine-learning #computer-vision
0个月前 · ai · - · -

[Paper] 因此我在。我思考

我们考虑这样一个问题：当一个大型语言推理模型做出选择时，它是先思考再决定，还是先决定再思考？在这篇…

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] 学习与生成由浅层通道电路制备的混合态

从测量数据中学习量子态是量子信息与计算复杂性中的核心问题。在本工作中，我们研究学习……的问题。

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] ORBIT：可扩展且可验证的数据生成，用于预算紧张的搜索代理

搜索代理，将语言模型（LMs）与网络搜索相结合，正变得对回答复杂的用户查询至关重要。构建训练数据集……

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] 极其简单的自蒸馏提升代码生成

大型语言模型（LLM）能否仅通过使用其自身的原始输出，在没有 verifier、teacher model 或 reinforcement learning 的情况下提升代码生成能力？We a...

#research #paper #ai #nlp
0个月前 · ai · - · -

[Paper] True (VIS) Lies：分析生成式 AI 如何识别可视化谎言中的意图性、修辞与误导性

本研究调查了多模态大型语言模型（LLMs）识别和解释误导性可视化的能力，并识别这些观…

#research #paper #ai #nlp #computer-vision
0个月前 · ai · - · -

[Paper] 筛查足够

标准 softmax 注意力的一个核心限制是它没有定义绝对的 query--key 相关性概念：注意力权重是通过重新分配……

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] NeuroDDAF：神经动态扩散-对流场与证据融合用于空气质量预测

准确的空气质量预测对于保护公众健康和指导环境政策至关重要，但由于非线性时空……仍然具有挑战性。

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[论文] 基于函数的不确定性量化的安全学习控制

在安全关键系统中部署学习驱动的控制方法时，不确定性量化是必不可少的。通常通过构建不确定性……

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] Open-Set 监督式 3D 异常检测：工业数据集与面向未知缺陷的通用框架

虽然自监督的3D异常检测假设获取高精度点云在计算上成本高昂，但在实际制造场景中……

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 在线推理校准：测试时训练实现可泛化的共形 LLM 推理

虽然测试时扩展使大型语言模型能够解决高度困难的任务，但最先进的结果伴随着高昂的计算成本。这些低效...

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] S0 调优：混合递归注意力模型的零开销适配

使用大约 48 个经执行验证的 HumanEval 训练解答，对每个循环层调优单个初始状态矩阵，且推理时零开销，超出……

#research #paper #ai #machine-learning #nlp
0个月前 · software · - · -

[Paper] SERSEM：选择性熵加权评分用于代码语言模型的成员推断

随着用于代码的 Large Language Models（LLMs）日益使用庞大且常常是非宽松许可的数据集，评估通过 Membership… 的数据污染。

#research #paper #software
0个月前 · software · - · -

[Paper] 利用提交大小上下文和超共变图中心性进行缺陷预测

文件级缺陷预测模型传统上依赖于产品和过程指标。虽然过程指标能够有效补充产品指标，但它们往往 …

#research #paper #software
0个月前 · ai · - · -

[Paper] 面向个性化飞镖训练：基于骨架的生物力学分析与运动建模的数据驱动框架

随着体育训练日益数据化，主要依赖经验和目视观察的传统飞镖教练已越来越无法满足高水平……

#research #paper #ai #machine-learning #computer-vision
0个月前 · software · - · -

[Paper] 利用 hype 教授经验性思维：AI 编码助手的实践经验

软件工程学生经常难以领会 empirical methods 和 hypothesis-driven inquiry，尤其是在以理论方式教授时。这 ex...

#research #paper #software
0个月前 · ai · - · -

[Paper] 整数状态动力学的量化脉冲神经网络用于高效硬件加速

脉冲神经网络（SNN）因其事件驱动计算和稀疏活动映射自然适用于低功耗的机器智能。

#research #paper #ai

Newer posts

Older posts