[论文] 面向个性化文本到图像生成的方向性 Textual Inversion
Textual Inversion(TI)是一种高效的 text-to-image 个性化方法,但在复杂提示下常常失败。我们将这些失败归因于 embedding norm。
Textual Inversion(TI)是一种高效的 text-to-image 个性化方法,但在复杂提示下常常失败。我们将这些失败归因于 embedding norm。
解决 computer-aided synthesis planning 对于实现全自动、机器人辅助的合成工作流以及提高药物发现的效率至关重要。
法医科学家经常需要在诸如勒索电话、秘密录音、所谓自杀信或匿名...的案件中识别未知的说话者或作者。
Proof-of-Work (PoW) 的安全性和去中心化已在现有区块链系统中得到充分验证。然而,它巨大的能源浪费已经引发了…
随着在线学习环境的演变,个性化的需求日益显著。尽管教育资源日益丰富,教育者面临 ch...
大型语言模型中的安全对齐机制通过学习到的拒绝行为防止对有害查询作出响应,然而这些相同的机制又阻碍了……
Large-language models (LLMs) 已被证明在问答之外的分类任务中以多种方式作出响应。LLM 的响应有时……
灵巧的操作具有挑战性,因为它需要理解细微的手部运动如何通过与物体的接触影响环境。我们介绍…
通过鲁棒性评估对人工智能(AI)模型进行验证和确认,对于保证其在集成中的可靠性能至关重要……
基于块(Tile)的多处理元件(PE)加速器可以在通用矩阵乘法(GEMM)上实现竞争性的性能,但它们极其难以……
我们考虑高维中的统计任务,其损失仅通过数据在由参数所张成的固定维子空间中的投影来决定。
当 disfluencies 重叠时,Stuttering detection 失效。现有的 parametric models 难以区分复杂的、同步出现的 disfluencies(例如,'bloc...)。
在使用大型语言模型(LLMs)建模时间事件序列时,表示连续时间是一个关键且尚未充分探讨的挑战。各种策略……
图神经网络在图分类任务中已展示出显著的成功,但它们通常需要大量的计算资源,并且在……
我们引入 Do-Undo 任务和基准,以填补视觉语言模型中的关键空白:理解和生成物理上合理的场景转换……
构建通用推理模型与强化学习(RL)相结合,需要应对大量跨领域的异质性,包括推理过程中的巨大差异……
近期在组织病理学中的深度学习框架,特别是与病理基础模型(PFMs)相结合的多实例学习(MIL),已经显示出……
精心设计的提示可以提升大型语言模型的性能;自动提示优化技术旨在在不需要…
Square Kilometre Array (SKA) 项目将运营世界上最大的连续科学数据系统之一,在严格的 p… 条件下维持 petascale 成像。
自回归模型(ARMs)受到慢速顺序推理的限制。虽然掩码扩散模型(MDMs)提供了一种并行的替代方案,但它们受到 crit… 的困扰。
在本文中,我们提出了一种用于去中心化学习的差分隐私随机梯度推送(Differentially Private Stochastic Gradient Push)结合压缩通信(Compressed communication)的算法,称为 DP‑CSGP。
去噪语言模型(DLMs)已被提出作为传统语言模型(LMs)在自动语音识别(ASR)中的一种强大替代方案,动机……
大型混合专家(Mixture-of-Experts,MoE)模型推理因资源需求高和工作负载动态而具有挑战性。现有方案通常部署整个模型……
大多数软件工程(SE)研究假设进展依赖于大规模数据集和 CPU 密集型优化器。然而,这一假设是否经过严格检验……