Source

arXiv

4663 posts from this source

排序:

2个月前 · ai · - · -

[Paper] 超越 Many-Shot 翻译：扩展 In-Context Demonstrations 以实现 Low-Resource 机器翻译

构建针对低资源语言的机器翻译（MT）系统尤其困难，因为高质量数据稀缺。虽然大型语言模型...

#machine translation #in-context learning #low-resource languages #large language models #NLP research
2个月前 · ai · - · -

[Paper] 多目标局部搜索中多样性对有界档案的影响

本研究针对多目标优化问题（MOOPs）的 metaheuristics 开发，解决了两个关键挑战：指数增长……

#research #paper #ai
2个月前 · ai · - · -

[Paper] 用 agentic AI 支持软件工程任务：文档检索与测试场景生成演示

large language models 的引入点燃了对 software development models 的大规模改造和重新思考。随之而来的 software engineering 的响应……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 神经网络到空间加速器的进化映射

Spatial accelerators 由 compute‑memory integrated units 阵列组成，为部署 low latency 的 inference workloads 提供了有吸引力的平台，且…

#research #paper #ai
2个月前 · devops · - · -

[Paper] 六倍余量：在 DGX Spark 上的 LDPC 加速，用于 AI‑Native Open RAN

低密度奇偶校验（LDPC）译码是5G 新无线（NR）物理层中计算强度最高的核心之一，必须在…内完成。

#research #paper #devops
2个月前 · ai · - · -

[Paper] 迈向结构化、状态感知与执行为基础的推理用于软件工程代理

软件工程（SE）代理在支持各种 SE 任务方面展现出有前景的能力。目前的 SE 代理仍然基本上是被动的，做出决策……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 纠缠提升分布式系统的协同

在分布式系统中，协调常常受到通信延迟的阻碍，导致性能下降。量子纠缠提供了根本上更强的…

#research #paper #devops
2个月前 · ai · - · -

[Paper] 加速神经形态硬件上模拟信号的实时处理

使用 neuromorphic 系统进行感官处理通常是通过使用 event‑based sensors，或在呈现之前将输入信号转换为 spikes 来实现的……

#research #paper #ai
2个月前 · ai · - · -

[Paper] 信任典型

当前的LLM安全方法根本上依赖于一种脆弱的猫捉老鼠游戏，通过guardrails识别并阻止已知威胁。我们主张...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 景观感知的自动化算法设计：真实世界优化的高效框架

Large Language Models (LLMs) 的出现为自动化算法设计开辟了新前沿，催生了众多强大的方法。然而，这些...

#research #paper #ai
2个月前 · software · - · -

[Paper] 基准测试里有什么？SWE-Bench 在自动化程序修复中的案例

自动程序修复（Automated Program Repair，APR）的快速进展得益于人工智能的突破，尤其是大型语言模型（LLMs）和基于代理的系统。SWE-B…

#research #paper #software
2个月前 · software · - · -

[Paper] AgenticAKM：通往 Agentic 架构知识管理之路

架构知识管理（AKM）对于在软件项目中维护最新且全面的软件架构知识（AK）至关重要。然而……

#research #paper #software
2个月前 · ai · - · -

[Paper] SPEAR：智能合约审计的多代理协同工程案例研究

我们提出了 SPEAR，一个用于智能合约审计的多代理协同框架，它在现实的安全分析工作流中应用了已建立的 MAS 模式……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 可扩展的 Explainability-as-a-Service (XaaS) 用于 Edge AI 系统

尽管可解释人工智能（Explainable AI，XAI）取得了显著进展，但其在边缘（edge）和物联网（IoT）系统中的集成通常是临时且低效的。大多数当前方法 a...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 神经网络的逻辑再构想：Hamiltonian 位级部件-整体架构

我们介绍了一个简单的初始工作系统，在该系统中，关系（例如 part-whole）通过具有操作和学习规则的架构直接表示。

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[论文] 未决冲突使进展变得不可能

在本研究中，我们研究了针对 commutativity‑aware、linearizable 的共享对象实现的进度条件。受到以下观察的启发：可交换的 …

#research #paper #devops
2个月前 · ai · - · -

[论文] 对循环布尔电路上推理探针的统计保证

我们研究在一种风格化的循环推理模型中推理探针的统计行为，该模型由计算图为完美…的 Boolean circuits 构成。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 非线性 PCA 通过进化策略：新颖的目标函数

主成分分析（PCA）是一种强大且流行的降维技术。然而，由于其线性特性，它常常无法捕捉到 th...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] EventNeuS: 单目事件相机的 3D 网格重建

事件相机在许多场景中提供了对RGB相机的显著替代方案。虽然最近已有关于基于事件的 novel-view synthesis 的研究，但 dense 3D mesh …

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] PLATE：可调塑性高效适配器用于几何感知持续学习

我们开发了一种针对预训练模型的持续学习方法，该方法无需访问旧任务数据，解决了基础模型适配中的实际障碍。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Parallel-Probe：迈向通过 2D 探测实现高效并行思考

Parallel thinking 已成为一种有前景的推理范式，但它带来了显著的计算负担。现有的效率方法主要是…

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 使用神经进化研究量子电路设计

设计有效的量子电路仍然是量子计算中的核心挑战，因为电路结构对表达能力、可训练性以及……具有强烈影响。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 理解与利用权重更新稀疏性以实现通信高效的分布式 RL

强化学习（RL）是后训练大型语言模型（LLMs）的关键组成部分。然而，在带宽受限的分布式RL中，可扩展性...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

【论文】PrevizWhiz：结合粗糙的3D场景和2D视频来指导生成式视频预可视化

在 pre-production 阶段，电影制片人和 3D animation 专家必须快速 prototype 想法，以在 fullscale production 之前探索影片的可能性，然而传统……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] AutoFigure：生成与完善出版就绪的科学插图

高质量的科学插图对于有效传达复杂的科学和技术概念至关重要，然而它们的手工创建仍然是一个…

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

通过自适应源引导实现编辑模型的连续控制

Diffusion-based editing models 已成为语义图像和视频操作的强大工具。然而，现有模型缺乏平滑……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 从紧急停止干预中学习鲁棒干预

人工干预是自主系统在测试期间常见的数据来源。这些干预提供了关于当前 po… 的重要信号。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 基于深度学习的全表型组数据揭示了鸟类视觉差异的爆炸式进化

生物形态学的演化对于理解自然界的多样性至关重要，然而传统分析往往涉及主观偏差……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 基于偏好的条件处理效应与策略学习

我们提出了一种基于偏好的新框架，用于条件处理效应估计和策略学习，构建于 Conditional Preference-based Treatme...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 他们说 Memes 是无害的——我们发现了有害的那些：解码笑话、符号和文化引用

基于 Meme 的社交滥用检测具有挑战性，因为有害意图往往依赖于隐式文化符号和微妙的跨模态不一致。先前的…

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] SymPlex：结构感知 Transformer 用于符号 PDE 求解

我们提出 SymPlex，这是一种强化学习框架，用于在没有访问 … 的情况下发现偏微分方程 (PDE) 的解析符号解。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 快慢高效训练：通过视觉Token剪枝实现多模态大语言模型

多模态大语言模型（MLLMs）面临严重的训练效率低下问题，这与它们庞大的模型规模和视觉 token 数量有关……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] Conformal Thinking：风险控制用于计算预算下的推理

推理大型语言模型（LLMs）实现了测试时的可扩展性，随着 token 预算的增加，数据集层面的准确率会提升，这激发了自适应推理……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 渐进式棋盘用于自回归多尺度图像生成

在自回归图像生成中，一个关键挑战是如何在并行地高效采样独立位置的同时，仍然对相互依赖进行建模。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 通过课程引导特征学习和三阶段注意力网络提升不平衡节点分类

在图神经网络（GNN）中的节点分类不平衡是指某些标签远比其他标签更常见，这会导致模型学习不公平……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 连接 Online 与 Offline RL：Contextual Bandit 学习用于 Multi-Turn 代码生成

最近，研究界对使用强化学习（RL）在真实任务上训练大型语言模型（LLMs）表现出浓厚的兴趣，例如……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 我们需要异步 SGD 吗？关于同步方法的近似最优性

现代分布式优化方法主要依赖传统的同步方法，尽管在异步优化方面取得了显著的近期进展。我们...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] FullStack-Agent：通过面向开发的测试和仓库反向翻译提升代理式全栈网页编码

帮助非专业用户开发复杂的交互式网站已成为 LLM-powered code agents 的热门任务。然而，现有的代码代理往往 …

#research #paper #ai #nlp #computer-vision
2个月前 · ai · - · -

[Paper] WebSentinel：检测和定位 Prompt Injection 攻击的 Web 代理

Prompt injection attacks 操纵网页内容，使 web agents 执行攻击者指定的任务，而不是用户原本的意图。现有方法……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 通过显式信息传输进行上下文压缩

使用大型语言模型（LLMs）进行长上下文推理成本高昂，因为 quadratic attention 和不断增长的 key-value caches，这促使了 context compression。在 t...

#research #paper #ai #nlp
2个月前 · software · - · -

[Paper] 从独立编译到健全的语言组合

编程语言的开发涉及复杂的理论和实践挑战，尤其是在通过 modularity 和 reusability 解决模块化和可重用性时……

#research #paper #software
2个月前 · ai · - · -

[Paper] FOVI：一种受生物启发的 foveated 接口，用于深度视觉模型

人类视觉是 foveated 的，具有可变的分辨率，在大视野的中心达到最高；这反映了主动感知的高效权衡，allo...

#research #paper #ai #computer-vision
2个月前 · software · - · -

[Paper] 用机器学习改进深度学习库测试

深度学习（DL）库如 TensorFlow 和 Pytorch 简化了机器学习（ML）模型的开发，但由于其复杂的设计，容易出现 bug。Bug...

#research #paper #software
2个月前 · software · - · -

[Paper] SWE-Refactor：面向真实世界的基于 LLM 的代码重构仓库级基准

Large Language Models (LLMs) 最近因在软件工程任务中的应用而受到广泛关注。与 code generation 相比，refactoring 需要 …

#research #paper #software
2个月前 · ai · - · -

[Paper] Accelerated Noisy Power Method 的改进分析及其在 Decentralized PCA 中的应用

我们分析了 Accelerated Noisy Power Method，这是一种在仅能获得不精确 matrix‑vector products 的情况下用于 Principal Component Analysis 的算法。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 非保守系统的 Equilibrium Propagation

Equilibrium Propagation (EP) 是一种受物理启发的学习算法，它利用动力系统的稳态来进行推断和学习。在它的 …

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] CALM：一种用于基于小型语言模型的系统中QoS感知路由的自适应编排方法

AI-enabled 系统面临各种运行时不确定性，包括动态工作负载、资源需求、模型漂移等。这些不确定…

#research #paper #software
2个月前 · software · - · -

[论文] 代码覆盖率对缺陷引入的因果推断

背景：代码覆盖率被广泛用作软件质量保证的衡量指标。然而，它的效果，尤其是建议的使用量，在两者之间存在争议。

#research #paper #software

Newer posts

Older posts