research — Page 74

排序:

2个月前 · ai · - · -

[Paper] 代码语言模型中的局部校准不确定性

大型语言模型（LLMs）可以根据自然语言提示生成复杂的源代码。然而，LLMs 可能会生成偏离用户期望的输出。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 进化式发现用于板层几何中子输运的序列加速方法

我们提出一种 genetic programming 方法，自动发现用于 discrete ordinates 求解的 neutron transport 问题的收敛加速方法。

#research #paper #ai
2个月前 · devops · - · -

[Paper] 理解 LLM 检查点/恢复 I/O 策略与模式

随着大语言模型（LLMs）和基础模型的规模扩大，checkpoint/restore 已成为训练和推理的关键模式。借助 3D 并行（tensor、pipeline、data），...

#research #paper #devops
2个月前 · ai · - · -

[Paper] 将E‑prop推广到深度网络

循环网络通常使用时间反向传播（BPTT）进行训练。然而，BPTT 需要存储网络中所有状态的历史以及 t...

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 区块链支持的房地产文档数据匹配

房地产行业仍然高度依赖手工文件处理和验证，使得流程低效且易受欺诈。本文提出...

#research #paper #devops
2个月前 · ai · - · -

[Paper] PackKV：通过 LLM 感知的有损压缩降低 KV 缓存内存占用

Transformer-based large language models (LLMs) 已经在广泛的实际应用中展示了显著的潜力。然而，长上下文推理……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] RedunCut：基于测量的采样与准确性性能建模用于低成本实时视频分析

实时视频分析（LVA）在大规模摄像头群中持续运行，但使用现代视觉模型的推理成本仍然很高。为了解决这个问题，动态 m...

#research #paper #ai #computer-vision
2个月前 · devops · - · -

[Paper] 数据异质性感知的客户端选择用于无线网络中的联邦学习

联邦学习（FL）使移动边缘设备作为客户端，能够协作训练去中心化模型，同时确保本地数据隐私。H...

#research #paper #devops
2个月前 · ai · - · -

[Paper] TESO Tabu 增强仿真优化用于噪声黑箱问题

仿真优化（SO）经常面临噪声评估、高计算成本以及复杂的多模态搜索景观的挑战。本文介绍……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 在进化约束多目标优化中从两个方向解耦约束

现实世界的约束多目标优化问题 (CMOPs) 通常包含多个约束，理解并利用它们之间的耦合……

#research #paper #ai
2个月前 · ai · - · -

[Paper] 使用自适应阈值法识别眼动数据中的凝视和扫视

在许多实验任务中，ocular fixations 和 saccades 的特性高度随机，它们的统计数据常被用作各种 … 的代理。

#research #paper #ai
2个月前 · ai · - · -

[Paper] Stream-DiffVSR：低延迟可流式视频超分辨率 via Auto-Regressive Diffusion

基于扩散的 video super-resolution（VSR）方法能够实现强大的感知质量，但由于依赖于……，在对延迟敏感的场景中仍不实用。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 使用 Rubric Rewards 训练 AI 合科学家

AI co-scientists 正在成为帮助人类研究人员实现研究目标的工具。这些 AI co-scientists 的一个关键特性是其能力……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 扩散了解透明性：重新利用 Video Diffusion 进行透明物体深度和法线估计

透明物体仍然是感知系统的顽疾：折射、反射和透射破坏了立体视觉、ToF 以及纯粹……的假设。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[论文] 在多轮对话中引发行为

在对话环境中识别大型语言模型（LLMs）的特定且往往复杂的行为对于其评估至关重要。近期工作提出…

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 贝尔曼校准用于离线强化学习中的 V-Learning

我们引入 Iterated Bellman Calibration，这是一种简单、模型不可知、事后（post‑hoc）校准 off‑policy 价值预测的程序，适用于无限时域的 Markov …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 用细粒度人类反馈对文本片段微调 LLMs

我们提出了一种方法和数据集，用于在偏好监督下通过反馈驱动的改进链对语言模型进行微调。给定模型的响应，……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] PROFASR-BENCH：针对高风险专业语音的上下文条件化 ASR 基准

在专业环境中的自动语音识别（ASR）面临着现有基准低估的挑战：密集的领域术语、正式语体的变体……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 多语言隐藏提示注入攻击对基于LLM的学术评审

大型语言模型（LLMs）正日益被考虑用于高影响力的工作流程，包括学术同行评审。然而，LLMs 易受到文档……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

【论文】Web World Models

语言代理日益需要持久的世界，在其中它们可以行动、记忆和学习。现有方法位于两个极端：传统的网络 fra...

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

[Paper] 端到端 Test-Time Training 用于长上下文

我们将长上下文语言建模定义为持续学习中的一个问题，而不是架构设计。在这种定义下，我们仅使用标准的 a...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 校准的多层分位数预测

我们提出了一种在线方法，用于同时保证多个分位水平的分位数预测的校准。α水平的分位数预测序列……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 随机控制微分方程

我们提出了一种训练高效的时间序列学习框架，将随机特征与受控微分方程（CDE）相结合。在这种方法……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] IDT：一种基于物理的 Transformer 用于前馈多视角固有分解

内在图像分解是视觉理解的基础，因为 RGB 图像将材料属性、光照和视角相关效应交织在一起。Rec...

#research #paper #ai #computer-vision

Newer posts

Older posts