Source

arXiv

4797 posts from this source

排序:

5个月前 · ai · - · -

[Paper] 快速解码扩散语言模型通过进度感知置信调度

Diffusion 大语言模型（dLLMs）提供了一种有前景的 autoregressive 模型替代方案，但其实际效用因生成缓慢、迭代……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] OptPO：测试时策略优化的最优 Rollout 分配

Test-time policy optimization 使大语言模型（LLMs）能够通过利用自生成 rollouts 的反馈来适应 distribution shifts。然而，...

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 并行思考，统一回答：Logit Averaging for 开放式推理

多数投票已被证明在封闭式问答中通过聚合并行推理轨迹而有效。然而，它并不直接适用于开放式……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 孟加拉语仇恨言论分类：使用微调的Transformer模型

在低资源语言中，hate speech 识别仍然是一个困难的问题，原因是数据集不足、正字法异质性以及语言多样性。

#research #paper #ai #nlp
5个月前 · devops · - · -

[Paper] 在 OLCF 设计 FAIR 工作流：构建可扩展且可重用的 HPC 科学生态系统

高性能计算 (HPC) 中心提供先进的基础设施，使得在极大规模上进行科学研究成为可能。这些中心使用硬件 …

#research #paper #devops
5个月前 · software · - · -

[Paper] 面向 Observation Lakehouses：活的、交互式软件行为档案

代码生成型 LLM 主要在静态工件（源代码、注释、规范）上进行训练，几乎不涉及运行时行为的具体化。因此……

#research #paper #software
5个月前 · ai · - · -

[Paper] 探索 Sonic Measurement Spaces 中质量与多样性的定义

数字声音合成提供了探索包含数百万种配置的庞大参数空间的机会。质量多样性（QD）进化算法……

#research #paper #ai
5个月前 · software · - · -

[Paper] “你能感受到氛围吗？”：对新手程序员参与 vibe coding 的探索

在生成式 AI 以及更广泛的 AI 辅助编码趋势的推动下，‘vibe coding’ 这一术语指的是通过自然语言提示来创建软件的过程……

#research #paper #software
5个月前 · software · - · -

[Paper] 数据科学项目中风险管理方法论的综合分析

数据科学项目经常表现出高失败率，这主要是由技术限制、组织局限以及风险管理实践不足所驱动的。

#research #paper #software
5个月前 · ai · - · -

[Paper] 在迁移代码库之前，SME对Software Product Line Engineering感知的实证评估

将一组软件变体迁移到软件产品线（SPL）是一项昂贵且可能具有挑战性的工作。事实上，SPL 工程可以显著……

#research #paper #ai #machine-learning
5个月前 · devops · - · -

[Paper] 分布式和自律的最小生成树

在分布式系统中，使进程广播消息的最常见策略是一对全（one-to-all）通信。然而，这种方法不可伸缩……

#research #paper #devops
5个月前 · devops · - · -

[Paper] 一维中 beaconless geocast 协议的理论分析

Beaconless geocast 协议是用于在移动自组织无线网络中发送消息的路由协议，在这种网络中，每个节点唯一可用的信息是……

#research #paper #devops
5个月前 · ai · - · -

[Paper] 使用智能手表进行实时多模态数据采集及其在教育中的可视化

可穿戴传感器，例如 smartwatches，已在医疗、体育和教育等领域日益普及，实现了持续监测……

#research #paper #ai #computer-vision
5个月前 · devops · - · -

[Paper] 通过主动存储系统在计算连续体上卸载人工智能工作负载

对人工智能 (AI) 工作负载在各种计算环境中的需求日益增长，推动了对更高效的数据管理策略的需求。

#research #paper #devops
5个月前 · ai · - · -

[论文] IACT：面向通用 AI 代理的自组织递归模型：关于 kragent.ai 背后架构的技术白皮书

本技术白皮书介绍了交互式代理调用树（Interactive Agents Call Tree，IACT），这是一种计算模型，旨在解决 static、hard‑coded 的局限性……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 基于大型语言模型的语音对话代理

语音对话代理正趋向于 voice-native LLMs。本教程提炼了从级联式 ASR/NLU 到端到端、检索与 vision‑... 的路径。

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] PaperDebugger：基于插件的多代理系统，用于编辑器内学术写作、审阅与编辑

大型语言模型正日益嵌入学术写作工作流中，然而现有的助手仍然是编辑器的外部工具，阻碍了深度交互……

#research #paper #ai #machine-learning
5个月前 · devops · - · -

[Paper] HPC 集群上分布式内存访问机制的解决方案

本文提出并评估了基于两个不同高性能计算集群的分布式系统中远程内存访问的各种机制。我们正在比较这些方案……

#research #paper #devops
5个月前 · ai · - · -

[Paper] 基于眼部的高效情感识别：利用神经架构搜索的Time-to-First-Spike编码脉冲神经网络

Eye-based emotion recognition 使 eyewear devices 能够感知用户的情绪状态并支持 emotion-aware interaction，然而部署此类功能……

#research #paper #ai
5个月前 · ai · - · -

[Paper] 脑‑AI 融合：用于通用计算的预测性和生成式世界模型

近期在 general-purpose AI systems 与 attention-based transformers 方面的进展，为我们提供了一个潜在的窗口，以了解 neocortex 和 cerebellum，尽管它们的...

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] Associative Memory using Attribute-Specific Neuron Groups-1：在多个Cue Balls之间的学习

在本文中，我们提出了一种基于属性特定表示（例如，color、shape、size）的新 neural network model，这是关联记忆的经典示例。

#research #paper #ai
5个月前 · devops · - · -

[Paper] DOLMA：面向 HPC 应用的数据对象级内存解耦框架

内存解耦有望扩展内存容量并提升 HPC 系统的利用率。然而，访问远程内存的性能开销……

#research #paper #devops
5个月前 · devops · - · -

[Paper] Fantasy：在 GPU 集群上使用 GPUDirect Async 的高效大规模向量搜索

向量相似性搜索已成为 AI 驱动的应用（如大型语言模型（LLMs））中的关键组件。为了实现高召回率和低延迟，...

#research #paper #devops
5个月前 · ai · - · -

[论文] 度量图上的采样

Metric graphs 是通过将标准图中的边与实数轴上的线段对应，并在图的顶点处将这些线段粘合而得到的结构。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 特征选择赋能的 BERT 用于仇恨言论检测与词汇扩展

社交媒体上的辱骂性言论构成了一个持久且不断演变的挑战，这一挑战源于新俚语和旨在混淆视听的词汇的持续出现……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] EfficientFlow：高效等变流策略学习用于具身 AI

生成模型最近在视觉运动策略学习方面展现出显著的前景，使得在多样化的具身 AI 任务中实现灵活且富有表现力的控制。

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 用于最大熵强化学习的扩散模型框架

扩散模型在数据驱动学习以及从复杂的、未归一化的目标分布中采样方面取得了显著成功。基于此……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 面向自驱实验室的以数据为中心的可视化开发

Self-driving laboratories 为减少生物科学中劳动密集、耗时且常常难以重复的工作流程提供了一条有前景的路径。

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] Visual Sync: 多摄像头同步 via 跨视角对象运动

今天，人们可以轻松记录难忘的时刻，范围包括音乐会、体育赛事、讲座、家庭聚会和生日派对等多种消费……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 生成视频中的物体比看起来更慢：模型遭受 Sub‑Earth Gravity 且不懂 Galileo’s Principle……暂时

Video generators 正在日益被评估为潜在的 world models，这要求它们对 physical laws 进行编码和理解。我们调查它们的…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 生成式视频运动编辑与 3D 点轨迹

相机和物体运动是视频叙事的核心。然而，精确编辑这些捕获的运动仍然是一个重大挑战，尤其是在...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] TUNA：驯服统一视觉表征以用于原生统一多模态模型

统一多模态模型（UMMs）旨在在单一框架内共同执行多模态理解和生成。我们提出了 TUNA，一种原生的 UMM，...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 改进的 Mean Flows：关于 Fastforward 生成模型的挑战

MeanFlow（MF）最近被确立为一种一步生成建模的框架。然而，它的“fastforward”特性在…

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] Four Over Six：更精确的 NVFP4 量化与自适应块缩放

随着大语言模型规模的不断扩大，低精度数值格式（如 NVFP4）因其速度和内存优势而日益受到欢迎……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] AirSim360：在无人机视角下的全景仿真平台

360度全向理解领域因推动空间智能而受到日益关注。然而，缺乏大规模…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 大语言模型测试时计算规模化的艺术

测试时伸缩（Test-time scaling，TTS）——在推理过程中动态分配计算资源——是提升大型语言模型（LLMs）推理能力的一个有前景的方向。

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] MV-TAP：在多视角视频中跟踪任意点

多视角摄像系统能够对复杂的真实世界场景进行丰富的观测，在多视角设置中理解动态对象已成为核心……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 从音频学习视觉可供性

我们引入了 Audio-Visual Affordance Grounding (AV-AG)，这是一项从动作声音中分割对象交互区域的新任务。不同于现有方法……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] AlignSAE：概念对齐稀疏自编码器

大型语言模型（LLMs）在隐藏的参数空间中编码事实知识，这些空间难以检查或控制。虽然稀疏自编码器（SAEs）……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 学习 Sim-to-Real 类人机器人行走只需 15 分钟

大规模并行仿真已将机器人强化学习（RL）训练时间从数天缩短到数分钟。然而，要实现快速且可靠的仿真到…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] RoaD：将 Rollouts 视为 Demonstrations 用于闭环监督微调自动驾驶策略

自动驾驶策略通常通过 open-loop behavior cloning 对人类示范进行训练。然而，这类策略在协变量偏移时会受到影响。

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] LLM CHESS：通过国际象棋对LLM的推理和指令遵循进行基准测试

我们介绍了 LLM CHESS，一个旨在探究大型语言模型在推理和遵循指令能力上的泛化性的评估框架（...）。

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 非平稳环境中的离线强化学习预测

离线强化学习（RL）在从预先收集的数据集训练策略时提供了一条有前景的途径，尤其是在获取额外交互数据困难的情况下……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 一种稳健且可推广的设备无关深度学习模型，用于基于三轴腕部加速度计的睡眠-觉醒判定

研究目的：腕部加速度计被广泛用于推断睡眠-清醒状态。先前的研究显示，唤醒检测效果不佳，且缺乏跨设备的通用性。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 基于特征的语义感知调度用于能量采集联邦学习

在资源受限的边缘设备上进行联邦学习（FL）面临一个关键挑战：训练深度神经网络（DNN）所需的计算能量……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Chain-of-Ground：通过迭代推理和参考反馈提升 GUI Grounding

GUI grounding 旨在将自然语言指令与复杂用户界面中的精确区域对齐。先进的多模态大型语言模型表现出强大的……

#research #paper #ai #machine-learning #nlp #computer-vision
5个月前 · ai · - · -

[Paper] AI驱动的在不确定性下的矿物加工作业优化

全球矿物加工能力必须快速扩张，以满足关键矿产的需求，这些矿产对构建清洁能源技术至关重要。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 从原子到复合：强化学习实现互补推理的泛化

RL 对推理能力的贡献机制——是激励新技能的综合，还是仅仅放大已有行为——仍然...

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts