[Paper] SurgFormer:可扩展的器官变形学习,支持切除并实现实时推理
我们介绍了SurgFormer,一种用于体积网格上数据驱动软组织仿真的多分辨率门控Transformer。高保真生物力学求解器…
3122 posts from this source
我们介绍了SurgFormer,一种用于体积网格上数据驱动软组织仿真的多分辨率门控Transformer。高保真生物力学求解器…
Conversational generative AI 正在快速进入医疗领域,在这里 general‑purpose models 必须整合 heterogeneous patient signals 并支持多样的 inter…
否定是一个基本的语言运算符,但在 diffusion-based generative systems 中仍未得到充分建模。在本工作中,我们提出了一个形式化的……
虽然 diffusion models 已经彻底改变了视觉内容生成,但它们的快速普及凸显了迫切需要研究其漏洞,例如……
Concept learning 是一种在描述逻辑的知识库上进行的监督式机器学习。最先进的 concept learners 通常依赖于…
自动语音识别(ASR)受益于预训练语音和语言模型的进展,但大多数系统仍然局限于单语环境……
我们引入 NOBLE(Nonlinear lOw-rank Branch for Linear Enhancement),一种在 transformer 的线性层中添加非线性低秩分支的架构增强。
可解释人工智能(XAI)旨在提升机器学习系统的透明度和问责性,但大多数方法遵循一刀切的……
随着大语言模型(LLMs)在语言能力方面的提升,它们的推理能力正受到越来越多的关注。在人类中,推理往往表现为……
大型语言模型(LLMs)已成为人工智能的基石,推动了内容创作、搜索和推荐系统等多个领域的进步……
数学文本理解是一项具有挑战性的任务,因为其中存在专门实体以及它们之间的复杂关系。本研究提出……
本研究调查了使用大型语言模型(LLMs)进行 story point 估计的情况。story point 是无单位、针对特定项目的工作量估计,……
这篇论文讨论了模糊认知图(Fuzzy Cognitive Map,FHM)的神经实现以及相应的评估。首先,设计了一个 neural net 来实现……
Function-as-a-Service (FaaS) 平台提供可扩展且成本高效的执行,但在复杂应用中会出现更高的延迟和资源开销……
Predictive coding graphs (PCGs) 是最近提出的对预测编码网络的推广,预测编码网络是一种受神经科学启发的概率潜变量模型……
许多流行的 Python 库使用 C‑extensions 来处理性能关键的操作,使用户能够结合两者的优势:简洁性和……
为了量化 AI 对软件开发的影响,社区需要一个稳健的 AI 前基准。本研究分析了来自 1,155 条有效满意度数据。
背景:从文本规范中派生的领域模型已被证明在软件工程的早期阶段非常有用。然而,创建 co...
跨领域学习在数据因隐私或异质性而无法集中时具有挑战性,这限制了训练单一全面模型的能力……
移动代理式 AI 正在将自主能力扩展到资源受限的平台,例如边缘机器人和无人机(UAV),在这些平台上,严格的…
multi-modal generative models 的进展正在推动新应用的出现,从 storytelling 到 automated media synthesis。大多数当前的 workloads 生成简单的 …
本文研究了在欧几里得平面上,N ≥ 2 的 autonomous mobile robots 在分布式 Look-Compute-Move 模型下的 gathering problem。
高质量的多摄像头3D流媒体对于许多 AR/VR 应用中的沉浸式体验至关重要。视角数量受限——通常是由于真实…
规模化模仿学习在根本上受限于数据收集的效率。虽然handheld interfaces已经成为一种可扩展的解决方案……