ai — Page 66 | EUNO.NEWS

3周前 · ai

[Paper] Cube Bench：MLLMs空间视觉推理基准

我们引入了 Cube Bench，一个用于评估多模态大语言模型（MLLMs）在空间和序列推理方面的 Rubik's‑cube 基准。该基准...

#research #paper #ai #machine-learning #nlp #computer-vision
3周前 · ai

[Paper] 利用高保真数字模型和强化学习进行任务工程：完美信息下的空中灭火案例研究

随着系统工程（SE）目标从单体系统的设计与运行演变为复杂的系统群（SoS），任务工程学的学科……

#research #paper #ai #machine-learning
3周前 · ai

[Paper] 自动化立体定向放射外科计划使用人机交互推理的大型语言模型代理

立体定向放射外科 (SRS) 需要在关键结构周围进行精确的剂量塑形，但由于黑箱 AI 系统的不透明性，其临床采纳受到限制……

#research #paper #ai #machine-learning #nlp
3周前 · ai

【论文】Relu 和 softplus 神经网络作为零和回合制游戏

我们证明，ReLU 神经网络的输出可以解释为一个零和、回合制、停止游戏的价值，我们称之为 ReLU net game。 The ...

#research #paper #ai #machine-learning
3周前 · ai

[Paper] LLMs 能预测自己的失败吗？通过内部电路实现自我意识

大型语言模型（LLMs）生成流畅且复杂的输出，但往往无法识别自己的错误和幻觉。现有方法通常……

#research #paper #ai #nlp
3周前 · ai

[Paper] 使用 Gold-Standard 质量指标改进 ML 训练数据

手工标记的训练数据对许多机器学习任务至关重要。然而，训练数据质量控制在文献中受到的关注很少，d...

#research #paper #ai #machine-learning
3周前 · ai

[Paper] Performative Policy Gradient：可执行强化学习中的最优性

部署后的机器学习算法常常会影响它们所作用的环境，从而改变标准强化学习所依赖的底层动态……

#research #paper #ai #machine-learning
3周前 · ai

[Paper] 快速失败，赢取巨大成功：重新思考 Speculative Decoding 中的 Drafting 策略 via Diffusion LLMs

Diffusion Large Language Models (dLLMs) 提供快速的并行 token 生成，但其单独使用受到固有的效率‑质量权衡的困扰。W...

#research #paper #ai #machine-learning
3周前 · ai

[Paper] 通过 KL 引导层选择对混合注意力模型进行蒸馏

将预训练的 softmax attention Transformers 蒸馏为更高效的混合架构，在其中交替使用 softmax 和 linear attention 层，是一种有前景的……

#research #paper #ai #machine-learning #nlp
3周前 · ai

[Paper] LEAD：最小化学习者-专家不对称的端到端驾驶

Simulators 可以生成几乎无限的驾驶数据，但在仿真中，imitation learning policies 仍然难以实现稳健的 closed-loop performance……

#research #paper #ai #machine-learning #computer-vision
3周前 · ai

[Paper] 浅层神经网络通过可学习的通道注意力学习低阶球面多项式

我们研究在 ℝ^d 的单位球面上学习一个低阶球面多项式（次数 ℓ₀ = Θ(1) ≥ 1）的问题，通过训练一个过参数化的模型来实现。

#research #paper #ai #machine-learning
3周前 · ai

[Paper] FlashVLM：文本引导的视觉令牌选择用于大型多模态模型

大型视觉语言模型（VLM）通常在每张图像或视频帧上处理数百甚至数千个视觉 token，导致二次注意力成本和 su...

#research #paper #ai #computer-vision

Newer posts

Older posts