Source

arXiv

4611 posts from this source

排序:

1个月前 · software · - · -

[Paper] SkillReducer：优化 LLM 代理技能的 Token 效率

基于 LLM 的编码代理依赖于技能——预打包的指令集，用以扩展代理的能力，但每一个注入上下文的技能内容的 token …

#research #paper #software
1个月前 · ai · - · -

[Paper] 少即是多？对高重要性区域的选择性视觉注意用于多模态放射学摘要

自动化放射学报告摘要旨在将冗长的发现提炼为简洁的临床印象，但现有的多模态模型常常在...方面遇到困难。

#research #paper #ai #nlp #computer-vision
1个月前 · ai · - · -

[Paper] FLEURS‑Kobani：扩展 FLEURS 数据集以支持北库尔德语

FLEURS 提供 100 多种语言的 n-way 并行语音，但北库尔德语不在其中，这限制了对自动语音识别的基准测试和……

#research #paper #ai #nlp
1个月前 · software · - · -

[Paper] 将 Code LLM 编译为轻量级可执行文件

对更高的预测精度和更快的执行性能的需求在神经网络领域持续增长。大型语言模型的出现和成功……

#research #paper #software
1个月前 · devops · - · -

[Paper] M3SA：探索数据中心性能与气候影响的多模型与元模型仿真与分析

数据中心对我们的数字社会至关重要，但它们消耗了全球相当大比例的电力，且需求预计将继续增长。为了提升它们的…

#research #paper #devops
1个月前 · ai · - · -

[Paper] 关联构造进化：通过 Hebbian 学习的生成指导提升 Metaheuristics

元启发式算法，如粒子群优化（PSO）和进化算法（EA），在探索解空间方面表现出色，但缺乏机制来实现……

#research #paper #ai
1个月前 · software · - · -

[Paper] 机器学习在真实环境中：开源软件中不合规机器学习自动化的早期证据

机器学习（ML）模型的日益可用，尤其是基础模型，使它们能够在各种下游应用中使用，从 s...

#research #paper #software
1个月前 · software · - · -

[论文] HackRep：GitHub 黑客马拉松项目的大规模数据集

Hackathons 是有时间限制的协作活动，通常以软件创作为目标。虽然过去已经对 Hackathons 进行过研究，但现有工作主要关注……

#research #paper #software
1个月前 · ai · - · -

[Paper] 存储更少，发现更多：新颖性过滤如何提升边缘摄像头的跨模态检索

始终开启的 edge cameras 生成连续的视频流，其中冗余帧会通过挤占 top‑k 搜索的正确结果，降低 cross‑modal retrieval 的效果。T...

#research #paper #ai #computer-vision
1个月前 · software · - · -

[Paper] EcoScratch：成本效益高的多模态 Scratch 修复，使用执行反馈

Scratch 是最受初学者欢迎的编程环境，全球已创建超过 11.5 亿个项目。不同于传统语言，正确性在……

#research #paper #software
1个月前 · devops · - · -

[Paper] 大规模量子电路的高效并行编译与性能分析

编译量子电路是量子计算的主要瓶颈，考虑到未来几年所需的规模，这一过程很可能会变得不可接受地漫长。Techniq...

#research #paper #devops
1个月前 · devops · - · -

[Paper] 多项式时间局部决策再探讨

我们考虑用于分布式决策任务的三种分类系统：具有无限计算和证书的系统，由 Balliu、D'Angelo、Fraigniaud 等人定义，……

#research #paper #devops
1个月前 · devops · - · -

[Paper] 数据流网络的能量与吞吐量权衡探索

在数据流网络中引入动态功耗管理策略（如时钟门控和功率门控）已被证明能够显著降低能量……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 超越 Corner Patches：语义感知 Backdoor Attack 在 Federated Learning 中

对联邦学习（FL）的后门攻击通常使用合成的角落补丁或分布外（OOD）模式进行评估，这些模式不太可能出现……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 现代工业中跨 Edge-Cloud 连续体的智能化缺点

现代 AI 的快速发展正迅速将传统工业系统转变为庞大、智能且可能无人化的自主运营环境。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 大规模非线性光学计算：利用线性衍射系统的非相干光

非线性计算对于各种信息处理任务至关重要。光学实现具有吸引力，因为被动光传播可以操控……

#research #paper #ai
1个月前 · ai · - · -

[Paper] HandX：扩展双手运动与交互生成

合成 human motion 发展迅速，但 realistic hand motion 和 bimanual interaction 仍未得到充分研究。Whole-body models 往往忽略细粒度的——

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 几何感知的相似度度量用于黎曼与统计流形上的神经表征

相似性度量被广泛用于解释神经网络用于解决任务的表征几何结构。然而，由于现有方法比较 t...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] PoseDreamer：可扩展且逼真的人体数据生成流水线，使用 Diffusion Models

获取用于3D人体网格估计的标注数据集具有挑战性，因为存在深度歧义，并且从单目图像对3D几何进行标注本身就很困难。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 在上下文空间中即时排斥以实现 Diffusion Transformers 的丰富多样性

现代文本到图像（Text-to-Image，T2I）扩散模型已实现了显著的语义对齐，但它们常常存在显著的多样性缺失，趋向于……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] SHOW3D：在野外捕获3D手部和物体场景

在操作过程中对人手和物体的精确3D理解仍然是自体视觉的一个重大挑战。现有的hand‑object...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] SonoWorld：从单张图像到 3D 音视频场景

在视觉场景生成方面取得了巨大的进展，现在可以将单张图像转化为可探索的3D世界，但没有声音，沉浸感仍然不完整。我们介绍…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

【论文】Temporal Credit 是免费的

循环网络不需要雅可比传播来进行在线适应。隐藏状态已经通过前向传播携带了时间信用；即时导...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] 停止探测，开始编码：线性探针和稀疏自编码器为何在组合泛化上失败

线性表示假设认为神经网络激活以线性混合的方式编码高级概念。然而，在叠加的情况下，这种……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 在可转移超球面优化下重新思考语言模型规模化

大语言模型的 scaling laws 在很大程度上取决于 optimizer 和 parameterization。现有的 hyperparameter transfer laws 主要是为…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] ParaSpeechCLAP：一种用于丰富风格语言-音频预训练的双编码器语音-文本模型

我们推出了 ParaSpeechCLAP，这是一种双编码器对比模型，可将语音和文本风格的字幕映射到共同的嵌入空间，支持广泛的……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] RAD-AI：重新思考 AI 增强生态系统的架构文档

AI-augmented ecosystems（多个 AI 组件通过共享数据和基础设施进行交互的互联系统）正成为架构的常态……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 看见它以放置它：使用视觉语言模型演化宏布局

我们提出使用 Vision-Language Models (VLMs) 来进行 macro placement 在 chip floorplanning 中，这是一项复杂的优化任务，最近已经显示出有希望的进展。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Pandora: 可关节的3D场景图来自自我视角视觉

机器人映射系统通常通过机器人自身的传感器和摄像头来构建度量-语义场景表示。然而，这些“第一人称……”

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] SAGAI-MID：生成式 AI 驱动的中间件用于动态运行时互操作性

现代分布式系统集成异构服务、具有不同模式版本的 REST API、GraphQL 端点以及具有专有负载的 IoT 设备……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] SOLE‑R1：Video‑Language Reasoning 作为 On‑Robot 强化学习的唯一奖励

视觉语言模型（VLMs）在各种任务中展示了令人印象深刻的能力，激发了利用这些模型来监督机器人学习的努力。

#research #paper #ai #nlp #computer-vision
1个月前 · ai · - · -

[论文] 流匹配模型上 GRPO 的逐步信用分配

Flow‑GRPO 成功地将强化学习应用于流模型，但在所有步骤中使用了统一的信用分配。这忽略了时间结构……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[论文] 函数式自然策略梯度

我们提出了一种用于离线数据下策略学习的交叉拟合去偏置装置。该学习原理的一个关键结果是即使在 ... sqrt N regret。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 为什么整体准确率不足以评估执法人脸识别系统的公平性

面部识别系统正日益在执法和安保领域部署，在这些场景中，算法决策可能带来重大的社会后果。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 使用 PPA 和 MiniMax 博弈理论缓解联邦学习中的后门攻击

联邦学习（Federated Learning，FL）正因其能够利用大量分散的数据并保持隐私而被更广泛地采用。然而，despi…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] AI驱动的量表开发终极教程：在 Generative Psychometrics 中释放 AIGENIE

心理量表的开发传统上需要广泛的专家参与、反复修订以及大规模的试点测试，才能进行psychometric评估。

#research #paper #ai #machine-learning #nlp
1个月前 · devops · - · -

[Paper] 亚对数分布式顶点着色及最优颜色数

对于任意 Δ，记 k_Δ 为满足 ((k+1)(k+2) le Delta) 的最大整数 k。我们给出一个分布式 LOCAL 算法，该算法在给定整数 (k < k_Δ) 时，计算出一个有效的 …

#research #paper #devops
1个月前 · ai · - · -

面向边缘的分布式生成式 AI 推理的可信感知路由

新兴的生成式 AI 部署正日益在去中心化且异构的边缘设备上执行推理，而不是在单一可信服务器上……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] ResAdapt：自适应分辨率用于高效多模态推理

多模态大语言模型（MLLMs）通过提升输入保真度实现更强的视觉理解，但随之而来的视觉标记增长使得联合…

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] 超越审查：在反思中将语言模型应用于规划和翻译

已知反思性写作有助于学生元认知技能的发展，然而学习者常常难以进行深入的反思，限制了学习……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 基于情境依赖rubric的简答评分训练数据生成

每四年，经济合作与发展组织（OECD）会进行一次PISA测试，以评估全球青少年学生的知识水平，并用于比较各国教育体系。

#research #paper #ai #nlp
1个月前 · ai · - · -

[论文] GraphWalker：通过合成轨迹课程实现的代理式知识图谱问答

Agentic 知识图谱问答 (KGQA) 需要智能体对知识图谱 (KG) 进行迭代交互，这在训练数据方面带来了挑战……

#research #paper #ai #nlp
1个月前 · devops · - · -

[Paper] Warp-STAR：高性能、可微分 GPU 加速的静态时序分析，通过基于 Warp 的并行编排

静态时序分析（STA）对电子设计自动化（EDA）流程至关重要，但仍然是计算瓶颈。虽然现有的基于GPU的STA引擎……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 密钥嵌入隐私用于去中心化 AI 在生物医学组学

在生物医学中，data-driven 方法的快速采用加剧了对 privacy、governance 和 regulation 的担忧，限制了原始数据的共享并阻碍了……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 联邦感知系统的部署前复杂度估计

Edge AI 系统越来越依赖联邦学习在分布式、隐私保护和资源受限的环境中训练感知模型。Ye...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 用于识别自然启发式元启发式等价性的框架

元启发式优化领域因大量使用新 nature-inspired metaphor 的新算法涌现而变得活跃，但这些算法缺乏明确的方法论……

#research #paper #ai
1个月前 · software · - · -

[Paper] 语音控制 Scratch 供有（运动）残障的儿童使用

像 Scratch 这样的块式编程环境已在计算机科学教育中被广泛采用，但基于鼠标的 drag-and-drop 界面可能会带来挑战……

#research #paper #software
1个月前 · ai · - · -

[Paper] 进化算法用于生成匹配期望拉普拉斯谱的图

具有多样结构特征的图在建模和优化任务中发挥核心作用。能够生成不同类型的图……

#research #paper #ai

Newer posts

Older posts