Source

arXiv

4797 posts from this source

排序:

4个月前 · devops · - · -

[Paper] 面向视频扩散模型的通信高效服务与潜在并行

视频扩散模型（VDMs）在三维时空域上执行注意力计算。相较于处理一维序列的大型语言模型（LLMs）……

#research #paper #devops
4个月前 · ai · - · -

[Paper] Venus：一种用于基于VLM的在线视频理解的高效边缘记忆与检索系统

视觉语言模型（VLMs）已展示出令人印象深刻的多模态理解能力，并正被部署在越来越多的在线视频中……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

DCO：通过预测管理实现 LLM 加速器的动态缓存编排

大型语言模型（LLMs）的快速采用正推动 AI 加速器向更强大且更专用的设计发展。与其进一步复杂化…

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] ContinuumConductor : 边缘-云连续体上的去中心化过程挖掘

Process mining 传统上假设事件数据的集中收集和分析。然而，现代的 Industrial Internet of Things 系统正日益以 … 运行。

#research #paper #devops
4个月前 · ai · - · -

[Paper] 同步门控可塑性与多巴胺调制用于脉冲神经网络

虽然 surrogate backpropagation 在训练深层 spiking neural networks (SNNs) 中被证明是有用的，但在大规模 …

#research #paper #ai
4个月前 · ai · - · -

[Paper] 通过保持网络训练动态并使用 Concrete Ticket Search 赢得彩票

Lottery Ticket Hypothesis 断言，在密集、随机初始化的神经网络中存在高度稀疏、可训练的子网络（“winning tickets”）。

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] Neuro-Vesicles：神经调制应该是动力系统，而不是张量装饰

我们引入 Neuro‑Vesicles，一个在传统神经网络上增添缺失计算层的框架：一个动态的、可移动的、离散的……

#research #paper #ai
5个月前 · ai · - · -

[Paper] 弧形梯度下降：一种基于数学推导的梯度下降重新表述，具备相位感知、用户可控的步长动态

本文介绍了 ArcGD 优化器的公式化、实现和评估。评估最初在一个非凸基准函数上进行……

#research #paper #ai #machine-learning #nlp #computer-vision
5个月前 · ai · - · -

[Paper] 相位复用光学计算：利用照明相位多样性重新配置多任务衍射光学处理器

我们报告了一种单色多任务衍射网络架构，利用照明相位复用来动态重新配置其输出功能……

#research #paper #ai
5个月前 · ai · - · -

[Paper] QL-LSTM：参数高效的 LSTM 用于稳定的长序列建模

循环神经架构如 LSTM 和 GRU 在序列建模中仍被广泛使用，但它们仍面临两个核心限制：冗余的门…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 用 Entity Linking 提升教育平台的 Retrieval-Augmented Generation

在大型语言模型（LLMs）时代，检索增强生成（RAG）架构因其能够将语言……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] EditThinker：为任意图像编辑器解锁迭代推理

Instruction-based image editing 已成为一个重要的研究领域，受益于 image generation foundation models，已经实现了高水平的美学效果……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 训练时动作条件化实现高效实时分块

实时分块（RTC）使视觉‑语言‑动作模型（VLAs）能够通过异步预测动作块，生成平滑、响应迅速的机器人轨迹……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 只要剩下的必须为真：过滤驱动LLMs的推理，塑造多样性

强化学习 (RL) 已成为微调大型语言模型 (LLMs) 以解决涉及推理任务的事实标准。然而，越来越多的证据表明，模型 tra...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] AQUA-Net：自适应频率融合与光照感知网络用于水下图像增强

水下图像常常因波长依赖的光吸收和散射而出现严重的颜色失真、低对比度和雾化外观。Si...

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] M4-RAG：大规模多语言多文化多模态 RAG

视觉语言模型（VLMs）在视觉问答（VQA）中取得了强劲的表现，但它们仍受限于静态的训练数据。检索…

#research #paper #ai #machine-learning #nlp #computer-vision
5个月前 · ai · - · -

[Paper] MaxShapley：面向激励兼容的生成式搜索与公平上下文归因

基于大型语言模型（LLMs）的生成式搜索引擎正在取代传统搜索，根本改变了信息提供者的补偿方式……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] 核正则性对 Bandit 优化的影响

在本工作中，我们研究了 kernel regularity 与 algorithmic performance 在 RKHS 函数的 bandit optimization 中的关系。虽然 reproduci...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] SIMPACT：仿真驱动的动作规划使用视觉语言模型

视觉语言模型（VLMs）展现出卓越的常识和语义推理能力。然而，它们缺乏对物理动态的扎实理解。

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] SymPyBench：用于科学推理的可执行 Python 代码的动态基准

我们介绍了一个大规模的 synthetic benchmark，包含 15,045 道大学水平的 physics problems（90/10% train/test split）。每道题目都是完全 parameterized 的，...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 云端可信 AI 代理

由大型语言模型驱动的 AI 代理正日益作为云服务部署，它们能够自主访问敏感数据、调用外部工具，并且……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Impugan：学习条件生成模型以实现稳健的数据插补

在实际应用中，不完整的数据很常见。传感器会失效，记录可能不一致，并且从不同来源收集的数据集往往在规模上有所不同……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 通过机器学习为企业层面的业务调查开发合成微观数据

美国人口普查局提供的个人公共使用微观数据样本（PUMS）已经可用数十年。然而，计算能力的大幅提升……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 用于优化资源分配问题的变分量子 Rainbow 深度Q网络

资源分配仍然是 NP-hard 的，因为其组合复杂性。虽然 deep reinforcement learning (DRL) 方法，例如 Rainbow Deep Q-Network (DQN)，...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 放大，点击退出：解锁并评估 Zooming 在 GUI Grounding 中的潜力

Grounding 是构建图形用户界面 (GUI) 代理的基本能力。虽然现有方法依赖于大规模的 bounding box 监督……

#research #paper #ai #machine-learning #nlp #computer-vision
5个月前 · ai · - · -

[论文] 通过最小化信息损失设计最优传感器网络

最优实验设计是统计学中的经典主题，拥有众多研究深入的问题、应用和解决方案。我们研究的设计问题是 p...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 测量背景对用于自动驾驶感知的深度学习中分类和特征重要性的影响

常见的可解释人工智能（XAI）在深度学习中的方法侧重于分析给定模型中输入特征对分类任务的重要性：saliency maps……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] Synset Signset Germany：用于德国交通标志识别的合成数据集

在本文中，我们提出了一种 synthesis pipeline 和 dataset，用于 traffic sign recognition 任务的训练/测试数据，结合了 d... 的优势。

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 基于物理的汽车 LiDAR 仿真

我们提出了一种用于模拟汽车飞行时间（ToF）LiDAR的解析模型，包含光斑蔓延、回波脉冲宽度和环境光，并包括步骤……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 关于贝叶斯不一致性的分歧差异代理

深度神经网络在实际部署时常因 distribution shift 而失效，这成为构建安全可靠系统的关键障碍。An eme...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 合成面部数据生成技术在人脸识别中的比较研究

面部识别已成为一种广泛使用的身份验证和识别方法，应用于安全访问和寻找失踪人员。它的…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 知道何时不确定的世界模型：可控视频生成与校准不确定性

近期在 generative video models 方面的进展已在 high-fidelity video synthesis 领域取得了重大突破，尤其是在 controllable video generation 上……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] BalLOT：平衡 k-means 聚类与最优传输

我们考虑平衡 k-means 聚类的基本问题。特别是，我们引入一种基于 optimal transport 的交替最小化方法，称为……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] 犯错是人之常情：通过 LLM 分析对已发表 AI 论文错误的系统量化

已发表的 AI 论文包含多少错误？同行评审的出版物构成了新研究和知识构建的基础。出现的错误……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] NICE：神经隐式颅面模型用于正颌手术预测

正颌手术是纠正牙面骨骼畸形、提升咬合功能和面部美观的关键干预措施。准确…

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 自然语言摘要实现多仓库缺陷定位，使用LLMs在微服务架构中

在多仓库微服务架构中进行 Bug 定位具有挑战性，因为自然语言 Bug 报告与代码之间存在语义鸿沟，LLM 上下文……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] EventQueues：可自动微分的脉冲事件队列用于 AI 加速器上的大脑模拟

脉冲神经网络（SNNs），是计算神经科学和类脑机器学习（ML）的核心，需要高效的仿真和基于梯度的训练。

#research #paper #ai
5个月前 · ai · - · -

[Paper] 使用语言模型为低资源语言方言的编译器引导 Fuzzers

现代可扩展的编译器框架——例如 MLIR——能够快速创建特定领域语言（DSL）方言。然而，这种灵活性却使得正确性变得困难……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 优化医学问答系统：微调与零样本大语言模型在 RAG 框架下的比较研究

医学问答（QA）系统可以受益于大型语言模型（LLMs）的进展，但将LLMs直接应用于临床领域会带来挑战……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] Prompting Science Report 4: 假装游戏：专家角色并未提升事实准确性

这是该系列的第四篇简短报告，帮助商业、教育和政策领袖了解通过 ri... 与 AI 合作的技术细节。

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] Wasserstein 演化：进化优化视为相变

本文通过将进化优化形式化为相变，建立了进化计算与统计物理之间的新颖联系。

#research #paper #ai
5个月前 · ai · - · -

[Paper] 模糊知识：缺乏传递性和划分的信息

我放宽了信息经济模型中关于传递性（transitivity）和划分结构（partition structure）的标准假设，以形式化模糊知识：非传递性不可区分……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 被倾听还是被打断？性别、插话与情绪语调在美国最高法院口头辩论中的表现

本研究考察了在美国最高法院口头辩论期间的打断如何影响辩护人言论的语义内容和情感基调，……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 主动视频感知：迭代证据搜索用于 Agentic 长视频理解

长视频理解（LVU）具有挑战性，因为回答现实世界的查询往往依赖于埋藏在数小时大部分内容中的稀疏、时间上分散的线索……

#research #paper #ai #machine-learning #nlp #computer-vision
5个月前 · ai · - · -

[Paper] 使用条件可逆神经网络进行系外行星形成推断

对已观测到的系外行星起源的解释通常只能定性进行，因为行星形成模型中的关键参数存在不确定性。为了...

#research #paper #ai
5个月前 · software · - · -

[Paper] MicroRacer：检测云服务系统中的并发错误

现代 cloud applications 提供全球服务，通常构建在具有 microservice architecture 的 distributed systems 上。在这些系统中，端到端用户 r...

#research #paper #software
5个月前 · devops · - · -

[Paper] Metronome：差异化延迟调度用于 Serverless Functions

Function-as-a-Service（FaaS）计算是一种新兴的云计算范式，因其易于管理和弹性而受到关注。然而，优化调度以 ser...

#research #paper #devops
5个月前 · ai · - · -

[Paper] AI 辅助编程在终端用户开发中的可行性

End-user development，非程序员创建或改编自己的数字工具，能够在推动组织内部的数字化转型中发挥关键作用。...

#research #paper #ai #machine-learning

Newer posts

Older posts