machine-learning — Page 6

排序:

4天前 · ai · - · -

[Paper] TopoCurate：建模交互拓扑用于工具使用代理训练

训练工具使用代理通常依赖于基于结果的过滤：对成功轨迹进行监督微调（Supervised Fine-Tuning，SFT）和对…进行强化学习（Reinforcement Learning，RL）。

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] Legal RAG Bench：面向法律 RAG 的端到端基准

我们推出了 Legal RAG Bench，这是一套用于评估法律 RAG 系统端到端性能的基准和评估方法论。作为基准，Legal RAG Bench…

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] QIME：通过本体驱动的问题构建可解释的医学文本嵌入

虽然密集的生物医学嵌入实现了强大的性能，但其黑箱特性限制了其在临床决策中的实用性。最近基于问题的 int...

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] Quasar：量化自投机加速通过内存高效验证实现快速推理

Speculative Decoding (SD) 已成为加速大型语言模型（LLM）推理的首选技术，通过将 token 生成解耦为快速 dra...

#research #paper #ai #machine-learning
5天前 · ai · - · -

理解 LSTM – 第6部分：LSTM 如何产生其最终输出

在上一篇文章中，我们已经介绍了输入门；在本文中，我们将探讨下一个组件。最终阶段：更新短期记忆这...

#LSTM #recurrent neural networks #deep learning #output gate #tanh activation #sigmoid activation #machine learning
5天前 · ai · - · -

当 AI 说谎时：自主系统中对齐欺骗的兴起

理解 AI alignment：伪装 AI alignment 发生在 AI 系统恰好执行其设计功能时——例如，阅读和总结文档……

#AI alignment #alignment faking #autonomous agents #reward hacking #AI safety #cybersecurity #machine learning
5天前 · ai · - · -

[Paper] PARWiS：在紧张预算下使用主动成对比较进行胜者判定

在受限预算下，通过主动成对比较在一组项目中确定胜者是偏好学习中的一个具有挑战性的问题。The go...

#research #paper #ai #machine-learning
5天前 · ai · - · -

决策树——嵌套决策规则的惊人力量

决策树：嵌套决策规则的非凡力量。作者：Jared Wilber https://twitter.com/jdwlbr 与 Lucía Santamaría https://twitter.com/lusantala 让我们……

#decision trees #machine learning #classification #nested rules #data science #tree algorithms
6天前 · ai · - · -

构建用于10位加法的最小Transformer

请提供您希望翻译的具体摘录或摘要文本，我将为您翻译成简体中文。

#transformer #minimal model #addition #neural networks #deep learning #machine learning #arithmetic AI
6天前 · ai · - · -

[论文] 奖励调制的局部学习在脉冲编码器中的应用：使用STDP和混合速率读出的受控基准

本文呈现了一项受生物学启发的局部学习在手写数字识别中的受控实证研究。我们评估了一种受STDP启发的竞争性……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Mode Seeking 与 Mean Seeking 相结合，实现快速长视频生成

将 video generation 从秒级扩展到分钟级面临一个关键瓶颈：虽然 short‑video 数据丰富且 high‑fidelity，但 coherent long‑form 数据却是……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] LLM 能从自己的话语中受益吗？

多轮交互与大型语言模型通常会在对话历史中保留助手自身的过去回复。在本工作中，我们重新审视……

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts