· ai
[Paper] 分类重新参数化与去噪扩散模型
基于梯度的优化在处理分类变量时通常依赖于 score-function estimators,它们是无偏的但噪声较大,或者依赖于 continuous relaxations……
基于梯度的优化在处理分类变量时通常依赖于 score-function estimators,它们是无偏的但噪声较大,或者依赖于 continuous relaxations……
投资组合优化是所有主要金融机构开展的任务。基数约束均值-方差投资组合优化(Cardinality Constrained Mean-Variance Portfolio Optimization,CCP)...
大型语言模型(LLMs)已成为许多日常应用的主流。然而,随着数据的演变,它们的知识很快就会过时。持续…
评估足球中的无球防守表现具有挑战性,因为传统指标无法捕捉限制对手的细微协同动作……
最先进的大型语言模型(LLM)流水线依赖于自举推理循环:采样多样的思考链,并强化得分最高的……
将符号约束集成到深度学习模型中可以使它们更具鲁棒性、可解释性和数据效率。尽管如此,这仍然是一个耗时的…
在强化学习中,离策略 actor-critic 方法使用时序差分更新来训练 critic,并将其作为策略(actor)的学习信号……
识别相关文本片段对于自然语言处理(NLP)中的多个下游任务非常重要,因为它有助于模型可解释性。虽然大多数片段识别方法……
我们提出一个强化学习(RL)框架,用于线性求解器的自适应精度调节,并且可以扩展到通用算法。该框架是 …
Vision-Language Models 已经在医学图像分析和疾病诊断中展示了强大的潜力。然而,在部署后,它们的性能可能…
使用 transformer 进行长期时间序列预测受到自注意力二次复杂度和统一切片刚性的阻碍,这可能会……
现有用于推断行人过街行为的范式,从统计模型到监督学习方法,表现出有限的泛化能力……