[论文] Muses:设计、构思、生成无需训练的不存在的幻想3D生物
我们提出了 Muses,这是首个在前馈范式下实现奇幻 3D 生物生成的无训练方法。之前的方法依赖于部件感知的 opt...
3293 posts from this source
我们提出了 Muses,这是首个在前馈范式下实现奇幻 3D 生物生成的无训练方法。之前的方法依赖于部件感知的 opt...
大型语言模型(LLMs)正日益被用于在许多领域中进化问题的解决方案,这一过程受到生物进化的启发。然而……
在 multi-agent systems 中,emergent communication 领域研究 autonomous agents 如何能够独立地发展 communication strategies,而无需显式...
现有的深度估计方法根本上受限于在离散的图像网格上预测深度。这类表示方式限制了它们在任意…
导航是虚拟现实(VR)中自动探索的基本任务之一。现有技术主要关注 360- 中的路径优化。
随着 AIGC(AI 生成内容)技术的进步,越来越多的生成模型正在革新视频编辑、音乐等领域。
本卷收录了第十六届国际 Graph Computation Models 研讨会(GCM 2025)的后期论文集。研讨会在德国科布伦茨举行,...
Spatio-temporal reasoning in time series 涉及对 temporal dynamics、spatial dependencies 和 textual context 的显式综合。This capability is vit...
许多科学和工程中的重要问题涉及在已知观测过程的情况下,从噪声和/或不完整的观测中推断信号……
基础视觉、音频和语言模型通过其 latent representations 实现对 downstream tasks 的 zero-shot 性能。最近,unsupervised learning…
Memory-Augmented Generation(MAG)通过外部记忆扩展大型语言模型,以支持长上下文推理,但现有方法在很大程度上依赖于 …
量子计算长期以来被寄予在数据分析方面实现变革性进步的期待,然而由于根本性的障碍,实用的量子机器学习仍然难以实现。
近期的 text-to-video diffusion 模型能够生成引人入胜的视频序列,但它们仍然是无声的——缺失语义、情感和氛围线索……
背景:报告与数据系统(RADS)规范放射学风险沟通,但从叙述性报告中自动分配RADS仍具挑战性,因为……
Geo-localization 旨在推断给定信号的地理来源。在计算机视觉中,Geo-localization 已成为一个苛刻的 benchmark,用于 composition……
随着对话式 AI 系统日益融入日常生活,它们引发了关于用户自主性、信任以及商业利益的紧迫关注。
我们能从数据中学到比生成过程本身所包含的更多吗?仅仅通过应用确定性转换,能否构建出新的有用信息?
学生在数学中的错误往往是系统性的:学习者运用一种连贯但错误的程序,并在不同情境中重复使用。我们介绍 MalruleLib,...
文本到图像扩散模型中的机器遗忘旨在删除特定概念,同时保持整体效用。先前的扩散遗忘方法通常……
在企业搜索中,规模化构建高质量数据集仍然是一个核心挑战,因为获取标注数据非常困难。为了解决这个挑战……
虽然大型语言模型(LLMs)在自然语言处理方面展示了显著的潜力,但需要多步骤的复杂通用推理仍然是一个挑战。
LLM 代理能够推理并使用工具,但它们在长时程任务中常常因上下文无限增长和错误累积而崩溃。常见的补救措施,如...
评估机器学习(ML)模型偏差是构建可信赖且稳健的ML系统的关键。反事实公平性(CF)审计允许对b...
对机器学习模型进行表达性查询——将其视为一种 intentional data——能够使用 declarative language 对其进行验证和解释……
Diffusion language models (DLMs) 已经在带有上下文示例的一般自然语言任务中展示出强大的潜力。然而,由于双向注意力……
评估多模态大语言模型(MLLMs)的指令遵循(IF)能力对于严格评估模型输出的忠实程度至关重要。
随着 multi-agent LLM pipelines 的复杂性增加,现有的 serving paradigms 无法适应动态的 serving conditions。我们认为,agentic serving system …
我们基于概率域软化算子,构建了一个统一的稀疏知识蒸馏理论框架。虽然等价 p^{1/T} ...
社交媒体上的 Hate speech detection 在准确性和可解释性方面都面临挑战,尤其是对于尚未深入研究的 Indic languages。我们提出了一种新颖的…
虽然统一多模态模型(UMMs)在跨模态理解方面取得了显著成功,但它们在利用 su… 能力方面仍然存在显著差距。
人类智能的标志是能够通过构建性情景模拟——检索过去的经验以综合解决方案——掌握新技能的能力。
多模态医学大型语言模型在胸部X光解读方面表现出令人印象深刻的进展,但仍然面临空间推理和……
Machine unlearning 旨在从 Large Language Models (LLMs) 中忘记敏感知识,同时保持一般实用性。然而,现有方法通常…
我们提出了对自回归生成去中心化的理论分析。我们通过表达……来定义 Decentralized Discrete Flow Matching 目标。
基础模型(FMs)被视为一种变革性的突破,已开始重塑人工智能(AI)的未来,跨越学术...
扩散模型在图像和视频生成方面取得了显著成功。然而,它们固有的多步推理过程会带来巨大的计算成本……
精确且可扩展的细胞核实例分割对于计算病理学至关重要,然而千兆像素全切片图像带来了巨大的计算挑战。
尽管在高保真图像合成方面取得了令人印象深刻的进展,生成模型在逻辑密集型指令遵循方面仍然存在困难,暴露出一个持续的……
表面肌电图(sEMG)提供了一种直接的神经接口,用于解码肌肉活动,并为免键盘文本输入提供了有前景的基础……
在当今的数字环境中,终端用户反馈在软件应用的演进中发挥着关键作用,尤其是在解决阻碍使用的问题方面……
安全漏洞报告需要及时识别,以最小化软件系统中的漏洞窗口。传统的机器学习(ML)技术用于……
在任何情境下,没有可信的第三方,实体之间的信任都非常困难,而信任正是区块链旨在带入数字世界的核心。
这是第一届国际低碳计算研讨会(LOCO 2024)的论文集....
大型语言模型(LLMs)通过交互式协作显著提升了开发者在代码库级别代码生成的生产力。然而,随着...
Microservice 系统已成为 cloud-native 企业应用的支柱,因为它们具备资源弹性、松耦合架构以及轻量…
随着当代微服务系统变得越来越流行且复杂——通常包含数百甚至数千个细粒度、相互依赖的子系统……
AI 辅助的开发者服务正日益嵌入现代 IDE 中,但企业必须确保这些工具在现有的身份和访问控制范围内运行。
Execution traces 是理解、调试和优化复杂软件系统的重要信息来源。然而,来自 OS kernels 或 …