[Paper] 用于条件医学图像生成的 Generative Drifting
条件医学图像生成在许多临床相关的成像任务中发挥着重要作用。然而,现有方法仍然面临一个根本性的挑战……
4586 posts from this source
条件医学图像生成在许多临床相关的成像任务中发挥着重要作用。然而,现有方法仍然面临一个根本性的挑战……
扩展 humanoid foundation models 受限于 robotic data 的稀缺。虽然 massive egocentric human data 提供了可扩展的替代方案,但弥合 …
当今一些性能最强的强化学习算法可能成本高得令人望而却步,因为它们使用测试时的 scaling 方法,例如采样 multip...
Personalized Federated Learning (PFL) 旨在学习多个任务特定模型,而不是在异构数据分布下学习单一全局模型。Exi...
我们提出 VLA Foundry,一个统一 LLM、VLM 和 VLA 训练于单一代码库的开源框架。大多数开源 VLA 工作专注于 ac...
尽管 Vision Transformers (ViTs) 在广泛的视觉任务中取得了显著成功,近期研究表明它们仍然容易受到 ad...
由于在有限的多视角数据下,难以同时建模人体外观、动作和相机视角,Human video generation 仍然具有挑战性。
大型语言模型(LLMs)仍然在多步骤逻辑推理方面存在困难。现有方法要么仅在自然语言中纯粹优化推理链……
Vision-Language-Action (VLA) 模型提供了一种有前景的自动驾驶范式,用于利用世界知识和推理能力,尤其是在长期…
Kubernetes 为扩展 Node.js 工作负载提供了两条默认路径,但两者都有结构性限制。Horizontal Pod Autoscaler 基于 CPU 利用率进行扩展……
从图像序列中对动态人脸进行精确的重建和跟踪具有挑战性,因为 non-rigid deformations、表情变化以及视点……
追求真理是民主审议和治理的核心,但政治话语呈现出不同的认识取向,范围从基于证据的理性论证到情感化的价值诉求。理性主义者强调事实、数据和逻辑推理,主张在公共决策中采用科学方法和经验检验;而情感主义者则更关注叙事、身份认同和情感共鸣,认为这些因素同样决定公众的政治判断。两种取向在实际政治过程中交织互补:理性论证提供政策的可行性和可验证性,情感诉求则激发公众参与和价值认同。为实现更具包容性的民主治理,需要在公共讨论中平衡这两种认识方式,既不忽视证据的力量,也不排除情感与价值的作用,从而在多元社会中构建更具合法性和可持续性的决策体系。
标准的 Monte Carlo 估计量 (widehat{I}_N^{mathrm{MC}}) 用于 (int f,domega),依赖于来自 (omega) 的独立样本,且其方差的阶为 (1/N)。用样本…
函数向量(FVs)是从模型在上下文学习期间的激活中提取的任务的向量表示。虽然先前的工作已经表明,多线性…
基于强化学习的控制策略已被频繁证明在许多操作任务中比分析技术更有效。Com...
有效的human-robot teaming对于机器人在human workspaces中的实际部署至关重要。然而,优化joint human-robot plans仍然是一个挑战……
大型语言模型在复杂推理任务上取得了显著进展。然而,当输入不完整时,它们经常隐式地编造信息。
细粒度、每个微批次的负载均衡对高效的 Mixture-of-Experts (MoE) 训练至关重要,但以往的所有动态调度方案都为此付出了代价……
早期的一篇论文(Hong、Potteiger 和 Zapata 2026)表明,未优化的 GPT 4.1 提示能够在一个分数范围内预测粉丝报告的体验评分,准确率为 67%……
Edge 设备(如智能手表和智能眼镜)由于功耗和计算限制,无法持续运行即使是最小的 100M‑1B 参数语言模型。
Multimodal Large Language Models 正在越来越多地被用作交互环境中的 autonomous agents,然而它们主动解决安全隐患的能力仍然有限...
自由联想规范为认知科学中研究语言、语义和文化现象提供了重要的实证数据。尽管大型...
自动定理证明是形式化方法的基础,最近的趋势是将大型语言模型(LLMs)和证明助理集成,以形成有效…
Cross-site scripting (XSS) 仍然是一个持久的网络安全漏洞,尤其因为混淆可以改变恶意负载的表面形式…
Mixture-of-Experts (MoE) 架构在现代大型语言模型和多模态模型中被广泛使用。然而,推理效率常常受到…
现代分布式文件系统依赖于无协调的、每节点页面缓存,这些缓存在集群中本地复制热点数据。虽然能够确保快速的本地访问……
在本文中,我们研究了 self-stabilizing algorithms 以层次化方式运行,用于在宏观层面确定知识产权风险……
随着演绎验证器的成熟,它们的潜在用户群正从最初的核心开发者扩展到其他用户。为了说服外部用户其适用性……
最近的工作已经展示了在进化和代理优化系统中编排大型语言模型(LLMs)的前景。然而,机制……
预训练机器学习模型(PTMs)通常通过模型中心(例如 Hugging Face)以 Pickles 等标准格式提供,以促进可访问性……
Federated learning (FL) 是跨去中心化数据源进行分布式模型学习的关键范式。每一轮 FL 的通信通常包括……
本文提出了一个框架,以弥合主观利益相关者情境与正式系统架构之间的差距。这是通过使用 Soft Systems Met… 实现的。
Green software engineering 正在成为应对信息技术日益增长的能源影响的关键响应,尤其是在持续开发中。然而,...
移动众包计算(Mobile Crowd Computing,MCdC)利用消费者智能手机的闲置计算能力,实现大规模的分布式任务处理;然而,广泛…
Memristive devices 为下一代信息处理提供了有前景的基础,通过在单一物理基底中结合存储和计算。
Particle-in-Cell (PIC) 模拟是等离子体物理的基础,但常常因粒子-网格相互作用瓶颈而导致可扩展性受限,……
大型语言模型(LLMs)表现出的从众偏差可能对基于LLM的多智能体系统(LLM-MAS)的决策构成重大挑战。
Matrix-multiply-accumulate (MMA) units,或 tensor cores,现已在现代计算架构中广泛普及。然而,它们在粒子-网格算子中的使用仍然…
数学问题求解仍然是对大型语言模型和多模态模型推理能力的一个具有挑战性的测试,然而现有的基准在规模、语言…
构建逼真、可动画的全身数字人仍然是计算机图形学和视觉领域长期存在的挑战。近期在可动画的 ava...
现代序列模型主要由 Transformers 主导,其中 self‑attention 以输入依赖的方式混合可见上下文的信息。然而,当 r...
Proximal Policy Optimization(PPO)已成为 on-policy 强化学习的主导算法,因为它具有可扩展性和经验鲁棒性……
Story Visualization 旨在生成一系列图像,忠实地描绘文本叙事,保持角色身份、空间配置、...
大型语言模型通过强化学习与可验证奖励(RLVR)实现了显著的推理改进。然而,随着模型能力的...
尽管最近取得了进展,vision-language encoders 仍面临两个核心限制:(1) 语言与 dense vision features 之间的对齐较弱,这会导致……
在本工作中,我们重新审视了主动序列预测驱动的均值估计问题,其中在每一轮都必须决定 g 的查询概率……
大型语言模型在生成过程中经常会出现不可恢复的推理错误:一旦出现错误的步骤,后续的 token 会进一步加剧错误……
Video world models 在模拟用户或代理的动作所导致的环境动态方面取得了显著成功。它们被建模为动作‑…