[Paper] 联邦层次聚类与自动选择最佳聚类数
联邦聚类(Federated Clustering,FC)是一种新兴且有前景的解决方案,用于在分布式且受隐私保护的数据中探索数据分布模式,属于无监督学习。
4654 posts from this source
联邦聚类(Federated Clustering,FC)是一种新兴且有前景的解决方案,用于在分布式且受隐私保护的数据中探索数据分布模式,属于无监督学习。
视觉设计是最先进的多模态 AI 系统的重要应用。提升这些系统需要大规模高质量的视觉‑语言数据……
当自由/开源软件(FLOSS)管理者集中项目开发时,他们可能会削弱项目的可持续性,并影响…
金融平台和企业系统经常提供交易导出功能,以支持报告、对账、审计和监管合规。
大型语言模型(LLM)推理被广泛用于交互式助手和代理系统。在对延迟敏感的部署中,推理时间可能会变得……
优化 GPU kernel 对大型语言模型(LLMs)来说,比标准代码生成任务要困难得多,因为它需要理解……
现代神经网络参数过多,剪枝通过去除冗余的神经元或连接,已成为压缩的关键方法……
自回归(AR)视频生成模型依赖于将像素压缩为离散 token 序列的视频 tokenizer。这些 token 序列的长度是 …
多模态大型语言模型(MLLMs)正日益用于执行视觉工作流,例如在 GUI 中进行导航,其中下一步取决于已验证的视觉……
现代视觉代理需要具备通用的、因果的、以及物理结构化的表征,以在实时流媒体环境中运行。然而,当前…
Unified multimodal models 旨在实现联合理解、推理和生成,但当前的 image editing benchmarks 主要局限于自然图像和……
在线视频大语言模型(VideoLLMs)在支持响应式、实时交互方面发挥关键作用。现有方法侧重于流式感知……
文本到图像生成模型发展迅速,但实现对生成图像的细粒度控制仍然困难,主要是由于对...的有限了解。
人类通过一连串的视觉观察来感知和理解现实世界的空间。因此,能够流式地维护和更新空间证据的能力……
现有的视频深度估计面临一个根本性的权衡:生成模型会出现随机的几何幻觉和尺度漂移,而判别模型……
构建用于基础模型训练的科学多模态文档推理数据集涉及规模、忠实性和现实性之间的固有权衡。
交叉熵(CE)训练为语言模型提供了密集且可扩展的监督,但它在教师强制(teacher forcing)下优化下一个标记的预测,而不是……
推理 LLMs-as-Judges,能够受益于推理时的规模扩展,为将推理模型的成功扩展到非可验证的领域提供了有前景的路径。
跨越物理、语言和感知的智能系统通常表现出 factorisable structure,但通常被建模为 monolithic neural architectures …
我们提出了 STAMP(Selective Task-Aware Mechanism for Text Privacy),一个用于任务感知文本隐私化的新框架,能够实现改进的隐私‑效用 …
Neural network verification 通常用作更大分析过程的核心组件,这些过程会生成一系列紧密相关的 verification queries。
学习良好的表征对于使用世界模型进行潜在规划至关重要。虽然预训练的视觉编码器能够生成强大的语义视觉特征,但它们……
本文是对 Perplexity 对 NIST/CAISI Request for Information 2025-0035 的回复进行轻度改编的版本,详细阐述了我们的观察和建议 c...
预训练产生的学习 parameter vector 通常被视为进一步 iterative adaptation 的起点。在本工作中,我们则将其视为……
尽管跨学科研究能够带来更大和更长期的影响,但大多数工作仍局限于单一领域的学术孤岛。最近的基于AI的……
几十年前只有超级计算机才拥有的计算能力,尤其是它们的并行性,如今已经在标准个人电脑上可用。
在遥感图像中,显著目标检测(Salient object detection, SOD)面临着显著的挑战,主要由于目标尺寸变化幅度大,以及自注意力(self‑att)的计算成本……
本研究致力于分布式数据管道(或工作流)的自动化规划与调度。我们开发了一种通用的工作流和资源图表示方法……
长上下文的 agentic 工作流已成为大型语言模型的关键使用场景,使得注意力效率对推理速度和……至关重要。
虽然 decoder-only 大型语言模型(LLMs)最近在 NLP 领域占据主导地位,但 encoder-only 架构仍然是一种成本效益高且参数高效的……
多模态代理提供了一条有前景的路径,用于自动化复杂的文档密集型工作流。然而,一个关键问题仍然存在:这些代理是否展示出通用性……
Synthetic data 已成为训练 code generation models 的关键,但它会引入大量噪声和幻觉,这些问题难以检测……
大型语言模型(LLMs)的快速发展加速了通用 AI 助手的进程。然而,现有的用于个性化助手的基准……
在不同的 HPC 站点上部署复杂的分布式科学工作流常常受到站点特定依赖和复杂构建环境的阻碍。Thi...
Deep Operator Networks(DeepONets)提供了一种 branch‑trunk 神经网络结构,用于近似在函数空间之间作用的非线性算子。在该类…
Spiking Neural Networks(SNNs)因其低功耗和计算效率在边缘计算中受到显著关注。然而,现有…
需求工程(Requirements engineering,RE)对软件成功至关重要,但其自动化仍具挑战性,因为必须考虑多个经常相互冲突的质量属性……
随着 AI agents 在医疗保健和执法等高风险领域的使用日益增多,使它们的行为与社会、法律、伦理、同理心等保持一致……
需求可追溯性在确保软件质量和应对需求变更方面发挥着重要作用。需求追踪链接(例如…)
在基于领导者的状态机复制(SMR)协议中,领导者的出站带宽是天然的吞吐瓶颈。纠删码可以缓解……
尽管脉冲神经网络(SNNs)的时间脉冲动力学能够实现低功耗的时间模式捕获能力,但它们也会带来固有的不一致……
我们形式化了 subtime 的概念——一种在纠缠系统内部进行可逆信息交换的模式——并展示了经典时间如何作为一种渐近……
本工作提出了一个量子力学框架,用于分析基于量化的优化算法。基于量化的搜索的采样过程……
NCCL 是大规模分布式训练中集体 GPU 通信的事实标准,严重依赖插件来自定义运行时行为。Ho...
在代码仓库中解决问题是软件工程的重要组成部分。各种近期系统使用大型语言模型自动解决问题。
RTL 生成的要求不仅仅是软件代码合成:设计必须在语法上有效、可综合、功能正确且硬件高效。Exis...
自动化程序修复(APR)可以减少开发人员用于调试的时间,使他们能够专注于软件开发的其他方面。自动生成……
Code LLMs 仍然在代码执行推理方面表现不佳,尤其是在较小的模型中。现有方法依赖于使用教师生成的监督微调(supervised fine-tuning,SFT)……