[Paper] 跨越离散‑连续鸿沟:通过耦合流形离散吸收扩散实现统一多模态生成
生成模型在离散数据(文本)的自回归方法和连续数据(图像)的扩散方法之间的分叉阻碍了……
生成模型在离散数据(文本)的自回归方法和连续数据(图像)的扩散方法之间的分叉阻碍了……
我最初的信念 在深入研究之前,我隐含地相信了几件事: - 如果一个 attention head 持续关注(attend)特定的 token,那么该 token 是……
在 multi-agent systems 中,emergent communication 领域研究 autonomous agents 如何能够独立地发展 communication strategies,而无需显式...
Spatio-temporal reasoning in time series 涉及对 temporal dynamics、spatial dependencies 和 textual context 的显式综合。This capability is vit...
背景:报告与数据系统(RADS)规范放射学风险沟通,但从叙述性报告中自动分配RADS仍具挑战性,因为……
学生在数学中的错误往往是系统性的:学习者运用一种连贯但错误的程序,并在不同情境中重复使用。我们介绍 MalruleLib,...
在企业搜索中,规模化构建高质量数据集仍然是一个核心挑战,因为获取标注数据非常困难。为了解决这个挑战……
虽然大型语言模型(LLMs)在自然语言处理方面展示了显著的潜力,但需要多步骤的复杂通用推理仍然是一个挑战。
Diffusion language models (DLMs) 已经在带有上下文示例的一般自然语言任务中展示出强大的潜力。然而,由于双向注意力……
社交媒体上的 Hate speech detection 在准确性和可解释性方面都面临挑战,尤其是对于尚未深入研究的 Indic languages。我们提出了一种新颖的…
人类智能的标志是能够通过构建性情景模拟——检索过去的经验以综合解决方案——掌握新技能的能力。
Machine unlearning 旨在从 Large Language Models (LLMs) 中忘记敏感知识,同时保持一般实用性。然而,现有方法通常…