machine-learning — Page 69

1个月前 · ai

[Paper] 关于决策代理与高阶因果过程

我们在部分可观测马尔可夫决策过程（POMDP）中的决策代理与单输入过程函数之间建立了精确的对应关系，...

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 实证评估 Frank-Wolfe 方法用于构建白盒对抗攻击

为神经网络构建对抗性攻击似乎是其在各种服务中部署的关键挑战。为了估计对抗…

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] Any4D：统一前馈度量4D重建

我们提出了 Any4D，一种可扩展的多视角 Transformer，用于度量尺度的密集前馈 4D 重建。Any4D 直接生成每像素的运动和几何……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] 基于课程的强化学习在未知弯曲管状通道中的自主无人机导航

在受限的管状环境中进行自主无人机导航仍然是一个重大挑战，因为管道的约束几何形状以及墙壁的接近……

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 异步推理：免训练交互式思考 LLMs

许多最先进的 LLM 被训练成在给出答案之前先思考。推理可以大幅提升语言模型的能力和安全性，但它也会……

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[Paper] 噪声量子学习理论

我们开发了一个用于从噪声量子实验中学习的框架，重点关注容错设备通过噪声耦合访问未表征系统……

#research #paper #ai #machine-learning
1个月前 · ai

【论文】解耦的 Q-Chunking

Temporal-difference (TD) 方法通过从自身的未来价值预测进行 bootstrapping，高效地学习 state 和 action values，但这种 self‑bootstrappi…

#research #paper #ai #machine-learning
1个月前 · ai

我在 AI agents 密集项目中的旅程...✨

概述：参加 Kaggle AI Agents Intensive 对我来说是一次全新的激动人心的体验。当我加入时，我并没有完全自信于如何…

#AI agents #Kaggle #prompt engineering #agent workflows #machine learning #hands‑on learning #capstone project
1个月前 · ai

[论文] 离散扩散语言模型的尺度行为

现代 LLM 预训练消耗大量计算资源和训练数据，这使得不同模型的 scaling behavior（或 scaling laws）成为关键的区分因素。

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 基于黑箱损坏的生成建模：自洽随机插值

Transport-based methods 已成为从大规模、干净的数据集构建 generative models 的主流范式。然而，在许多科学和工程…

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 贝叶斯符号回归 via 后验采样

Symbolic regression 是一种强大的工具，可直接从数据中发现控制方程，但其对噪声的敏感性阻碍了其更广泛的应用。Thi...

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 在多智能体环境中学习可控且多样的玩家行为

本文提出了一种强化学习框架，使得在不依赖人类游戏数据的情况下实现可控且多样的玩家行为。现有的...

#research #paper #ai #machine-learning

Newer posts

Older posts