[Paper] 重新利用 3D 生成模型进行自回归布局生成
我们介绍 LaviGen,一个将 3D 生成模型重新用于 3D 布局生成的框架。不同于之前从文本推断对象布局的方法……
我们介绍 LaviGen,一个将 3D 生成模型重新用于 3D 布局生成的框架。不同于之前从文本推断对象布局的方法……
以透明且用户友好的方式解释机器学习(ML)结果仍然是可解释人工智能(XAI)的一个挑战性任务。In t...
虽然大多数 automated theorem‑proving 方法依赖于 formal proof systems,informal theorem proving 可以更好地与 large language models 的 …
本文探讨了大型语言模型(LLMs)对不同礼貌程度和不礼貌程度的用户提示的响应。礼貌理论由...
随着 AI-assisted video creation 越来越实用,instruction-guided video editing 已成为细化生成或捕获的 footage 的关键。
越南法律文本的复杂性对公众获取司法构成了显著障碍。虽然Large Language Models提供了一种有前景的解决方案……
水下图像常因光在水中的吸收和散射而出现严重的退化,如颜色失真、对比度低以及细节模糊。
Vision Language models (VLMs) 已在广泛的基准测试中展示了强大的性能,但它们常常受到模态主导的影响,即在预测…
最近在语言模型方面的进展显著提升了自然语言理解(NLU)。尽管广泛使用的基准测试表明,大型语言模型……
图像地理定位传统上通过基于检索的地点识别或基于几何的视觉定位流水线来解决。最近的进展……
大型语言模型正日益在可靠性至关重要的场景中部署,但输出层面的不确定性信号,如 token probabilities、entropy……
就读AP Computer Science Principles(CSP)课程的中学生通常会利用网络资源(例如教程、Q&A网站)来更好地……
软件工程研究在过去几十年中在产出和参与度方面都经历了快速增长。然而,人们仍然对该领域的能力……
代码生成是指根据用户需求自动生成可执行程序。最近,研究人员已经探索了提升 corr… 的方法。
基于适配器的方法已成为对大型语言模型(LLMs)进行持续学习(CL)的成本有效方案,通过顺序学习低秩更新……
大型语言模型(LLMs)日益依赖链式思考(CoT)推理来解决复杂任务。然而,确保推理轨迹既能……
最近的工作提出了 test-time alignment 方法,依赖一个小的 aligned model 作为代理,引导更大的 base(unaligned)model 的生成。T...
在分布式深度学习中,准确预测训练时间对于资源分配、成本估算和作业调度至关重要。我们观察到,f...
我们提出了一个用于德国语手语(DGS)童话的 dataset 和 model,用于进行 sentiment analysis。首先,我们对三个层面的 val…
将复杂结构分解为更简单的子结构是一种强大的技术,具有广泛的应用范围。我们研究了 decomp 的计算……
大型语言模型 (LLMs) 在软件开发中的快速普及,使得区分 AI 生成的代码和人工编写的代码成为一项关键挑战。
随着区块链应用场景的不断扩展,联盟链对共识机制提出了更高的性能和安全性要求。
Code localization 是自主软件工程的基石。最近的进展在真实世界问题基准上取得了令人印象深刻的表现。...
大量研究依赖数据分析脚本来处理、清理和可视化数据。然而,最近的研究表明,这些脚本往往难以理解……
许多小规模的软件系统,即具有有限 codebase 或 binary size 的系统,广泛用于日常任务中,但它们的可配置性仍然在很大程度上未被……
量子软件测试近年来受到关注,促使开发了各种技术来自动化量子软件的测试。Th...
传统的基于帧的相机能够捕获丰富的上下文信息,但在动态场景中受到时间分辨率有限和运动模糊的影响。Event camera...
本文聚焦于将 flow matching models 与人类偏好对齐。一个有前景的方法是通过直接反向传播 reward gradients 来进行 fine‑tuning …
本文提出了一种图像重新照明的方法,能够在照片中对多个光照属性进行精确且连续的控制。我们……
人工智能生成内容(AIGC)工具的快速进展,使得可以按需为网页设计创建图像、视频和可视化内容。
高级自动驾驶需要能够对多模态未来不确定性进行建模且在闭环交互中保持鲁棒性的运动规划器。A...
语言模型是否能够系统性地概括仍然是一个活跃的争论。然而,经验性能(empirical performance)受包括训练(training)在内的多重因素共同影响……
LLM-as-judge 框架正日益用于自动 NLG 评估,但它们的单实例可靠性仍然了解不足。我们提出一种双管齐下的……
许多 SLT 系统悄然假设,简短的手语片段可以直接映射到口语单词。这个假设会失效,因为手语者常常创造 mea...
视频生成已经快速发展,最近的方法能够产生越来越逼真的动画效果。然而,现有的基准——主要为……
MLP 是现代深度学习(DL)架构中在表格数据监督学习中被广泛使用的主干,AdamW 是用于训练的首选优化器……
在过去的一年里,空间智能受到了越来越多的关注。许多先前的工作从视觉空间智能的角度研究它,其中……
我们研究基于截断正交多项式核构建的支持向量机(SVM)的后训练可解释性。由于相关的再现…
高效的原语空间分配是3D Gaussian Splatting的基础,因为它直接决定了表示之间的协同作用……
3D policy learning 预计能够实现更优的泛化和跨形体转移,但进展受到训练不稳定和严重过拟合的阻碍。
理解情感是智能系统能够与人类互动的基本能力。视觉语言模型(VLM)已经取得了巨大的 p...
基于电路切分的混合高性能计算(HPC)-量子工作负载将大型量子电路分解为独立的片段,但现有的...
节点嵌入充当图神经网络的信息接口,但它们的实证影响常常在不匹配的 backbones、splits 和 … 中报告。
本文介绍了 Prism——首个用于张量程序的符号化超优化器。其核心思想是 sGraph,一种符号化的层次化表示,能够紧凑地……
可靠的不确定性估计对医学图像分割至关重要,因为自动轮廓会用于下游量化和临床决策支持。
在本文中,我们专注于自动化软件开发生命周期(SDLC)中两项广泛使用的 Verification and Validation (V&V) 活动:Soft…
同时克隆非正交态的不可能性是量子理论的基础。即使允许近似误差,克隆……
随着 LLM 代理与其他追求目标的代理之间有效且安全互动的重要性日益提升,然而,最近的研究却报告了相反的趋势:LLM …