[Paper] ShadowDraw:从任意对象到阴影绘画构图艺术
我们介绍了 ShadowDraw,一个将普通 3D 对象转化为阴影绘画构图艺术的框架。给定一个 3D 对象,我们的系统预测场景参数……
3337 posts from this source
我们介绍了 ShadowDraw,一个将普通 3D 对象转化为阴影绘画构图艺术的框架。给定一个 3D 对象,我们的系统预测场景参数……
标准扩散通过高斯噪声对数据进行破坏,其傅里叶系数具有随机幅度和随机相位。虽然在无条件或……
在大型语言模型(LLMs)中,长上下文推理已通过链式思考(CoT)推断展示了其认知能力的提升。训练...
All-in-One Image Restoration (AiOIR) 任务通常涉及多样的退化,需要稳健且多功能的策略。然而,大多数现有方法 typ...
视频生成模型正在快速发展,但在需要大量语义分支或重复高…的复杂视频输出方面仍可能面临困难。
最近关于结构化文本翻译的研究仍局限于句子层面,因为它们难以有效处理复杂的文档级 XML 或 HTML …
近年来,针对 AI 生成图像(AIGI)的图像质量评估(IQA)发展迅速;然而,现有方法主要针对肖像和 ar...
尽管扩散模型如今在生成建模中占据核心位置,入门教材通常假设欧几里得数据,并且很少阐明它们的…
现实世界的物理过程并不会产生任意的变异性:它们的信号集中在紧凑且低变异性的 functional space 子集上。这个……
大语言模型(LLM)推理需要巨大的计算和能源,使得特定领域的任务成本高昂且不可持续。随着基础模型的规模不断扩大……
随着医疗保健日益转向 AI,以实现可扩展且可信赖的临床决策支持,确保模型推理的可靠性仍然是一个关键挑战。
Kubernetes 是一种帮助快速部署软件的工具。不幸的是,配置 Kubernetes 容易出错。配置缺陷并不少见。
量子近似优化算法(QAOA)是解决近端量子处理器上组合优化问题的领先方法。如何……
现代大型语言模型通过长链式思考实现了令人印象深刻的推理能力,但它们在推理期间会产生巨大的计算成本。
Spiking neural networks 提供事件驱动计算、稀疏激活和硬件效率,但训练往往收敛缓慢且缺乏稳定性。We ...
本扩展摘要介绍了自解释对比证据重新排序(Self-Explaining Contrastive Evidence Re-Ranking,简称 CER),这是一种通过事实证据重新构建检索的新方法,by f...
在表达式搜索空间中的神经架构搜索(NAS)是一个计算上非常困难的问题,但它也具有自动发现完整……的潜力。
大型语言模型(LLMs)从被动响应者向自主代理的演进,需要在学习范式上进行根本性转变——从静态……
太赫兹(THz)通信与联邦学习(FL)的融合有望实现超高速分布式学习,但现实宽带的影响……
大型语言模型(LLMs)在各种语言相关任务中展现出显著的潜力,但它们是否捕获了更深层的语言属性,……
能够通过与环境的多次交互完成复杂任务的智能体已成为一个热门的研究方向。然而,在这种 ...
大型语言模型(LLMs)已被证明在解决复杂推理任务方面非常有效。令人惊讶的是,它们的能力往往可以通过 i...
本文提出了一种创新的方法,通过在单个神经元层面的硬件冗余来确保神经网络的功能稳定性。不同于……
现代软件生态系统的规模、复杂性、互联性和自主性的不断增长带来了前所未有的不确定性,挑战了……的基础。
自适应系统(SAS)旨在通过包含四个核心功能的反馈回路来处理变化和不确定性:监控、分析、规划和执行。
大型语言模型(LLMs)已经彻底改变了通用自然语言处理以及代码合成、法律推理等领域特定的应用。
Proof-of-Vulnerability (PoV) 输入生成是软件安全中的关键任务,并支持下游应用,如路径生成和验证……
作为从函数级别到仓库级别的 code completion 任务,利用大规模 codebases 中的 contextual information 成为一个核心挑战。然而,...
在本工作中,我们提出了 FLEX,一种用于混合单元高度合法化任务的 FPGA‑CPU 加速器。我们从以下几个方面来解决挑战。首先,w...
图上的机器学习最近在多个领域取得了显著的进展,包括分子属性预测和芯片设计。然而,基准…
日志解析将原始日志转换为包含常量和变量的结构化模板。它是异常检测、故障诊断以及其他 AIOps 的基础。
基于 CXL 的计算存储(CCM)在扩展的远程内存中实现近内存处理,提供了解决数据移动成本相关问题的机会……
工作流自动化有望在日常文档相关任务中带来显著的生产力提升。虽然之前的 agentic 系统可以执行孤立的指令,t...
Spiking Neural Networks (SNNs) 由于其稀疏二进制激活,提供了一种有前景且节能的传统神经网络替代方案。How...
Hallucinations 是在创建依赖 Foundation models (FMs) 的应用时的关键关注点。了解这些细微失效在何处以及如何发生是……
在稀疏 LU 分解中,符号分解后的非零元素往往分布在稀疏矩阵的对角线和右下区域。然而,重新…
现代 GPU 软件栈要求开发者在实际启动 kernel 之前就能预判性能瓶颈;误判 floating-point 工作负载会导致……
随着现代并行机器的复杂性和规模不断增长,程序员越来越依赖软件库的组合来封装和…
参数高效微调(PEFT)通过仅更新大型预训练模型中一小部分参数,提供了一种可扩展的全模型适配替代方案。
Aurora 超级计算机于 2024 年部署在 Argonne National Laboratory,目前是全球 Top500 列表中三台 Exascale 机器之一。
我们提出了 tritonBLAS,一个快速且确定性的分析模型,利用诸如缓存层次结构以及相对代码和数据放置等架构参数,……
Normalizing Flows (NFs) 学习数据与高斯分布之间的可逆映射。先前的工作通常存在两个限制。首先,它们添加……
我们引入了“single-life”学习范式,在该范式中,我们仅在由单个人拍摄的第一人称视频上训练一个独特的vision model。我们leverag...
Graphic design 是现代视觉传播的基石,作为推广文化和商业活动的重要媒介。最近的进展已经…
我们引入 radiance meshes,这是一种使用通过 Delaunay tetrahedralization 生成的恒定密度 tetrahedral cells 来表示 radiance fields 的技术。
Reasoning models leveraging long chains of thought 采用多种认知技能,例如对其答案的 verification、backtracking、通过 alternat… 重试。
Vision Language Models (VLMs) 展示了强大的定性视觉理解能力,但在实现具身所需的度量精确空间推理方面仍然困难……
为了处理不明确或模糊的查询,AI 助手需要一套管理其不确定性的策略,以确定 (a) 何时猜测用户意图并回答…