[Paper] TaxoBell: 高斯盒嵌入用于自监督分类体系扩展
Taxonomies 构成了跨多个领域的结构化知识表示的骨干,使得 e‑commerce catalogs、semantic search 等应用成为可能,…
4750 posts from this source
Taxonomies 构成了跨多个领域的结构化知识表示的骨干,使得 e‑commerce catalogs、semantic search 等应用成为可能,…
高效地优化电池充电协议具有挑战性,因为每次评估都慢、成本高且不可微分。许多现有方法……
神经网络通常在高度过参数化的 regime 中进行训练,然而实证证据始终表明,许多参数在...期间会变得冗余。
复现 system-level concurrency bugs 需要 input data 和 system calls 的精确 interleaving order。这个过程具有挑战性,因为这样的 …
科学工作流管理系统(SWfMS),如 Nextflow,已成为进行可重复、可扩展和可移植的 c...
实验性的机器人优化通常需要对每个候选策略进行数秒到数分钟的评估。所选择的评估时间会影响优化,因为...
本文介绍了SiliconHealth,一个面向资源受限地区,特别是撒哈拉以南地区的综合区块链医疗基础设施。
本文介绍了SiliconHealth,一个面向资源受限地区,特别是撒哈拉以南地区的综合区块链医疗基础设施。
面向领域的元数据模式对于提升研究软件的可发现性和可重用性,以及遵循 FAIR4RS 原则至关重要。然而,ma...
深度学习库如 Transformers 和 Megatron 现在已在现代 AI 程序中被广泛采用。然而,当这些库出现缺陷时,范围从...
从 Cloud-Native 到 AI-Native 架构的转变正在从根本上重塑软件工程,用概率性的微服务取代确定性微服务。
在 fault-tolerant quantum computing 中,需要大量的 physical qubits 来构建单个 logical qubit,并且单个 quantum node 可能能够 t...
Zero-Knowledge(ZK)证明系统是密码学协议,能够(以压倒性概率)证明对 (X, W) 属于关系 R,且…
当需要在一组代理人之间分配资源并遵循平等主义社会福利时,目标是最大化效用最小的代理人的效用。
大规模、计算密集型的应用,如高性能计算、人工智能和大数据的广泛部署正导致……
Cluster workload allocation 通常需要复杂的配置,导致可用性差距。本文介绍了一种 semantic, intent‑driven scheduling paradigm。
LLM 推理延迟在决定用户体验和运营成本方面至关重要,直接影响在 SLO 约束下的吞吐量。即使是短暂的延迟峰值……
并行拜占庭容错(BFT)协议被视为解决许可区块链共识可扩展性问题的有前景的方案。
在本研究中,我们提出了 SafePlanner,这是一种系统化的测试框架,用于识别自动驾驶系统(ADS)中 Plan 模型的安全关键缺陷……
差分隐私联邦学习(DP-FL)在严格的隐私预算下由于为保持隐私而引入的巨大噪声,导致收敛速度缓慢。
我们提出了一种基于 Byzantine Consistent Broadcast 的现代支付系统中的事务驱动动态重配置协议,该协议能够实现高性能……
通用矩阵乘法(GEMM)是科学计算中的核心算法之一。单线程 GEMM 实现已得到良好优化,...
Split Federated Learning (SFL) 使资源受限的边缘设备与计算资源丰富的服务器之间能够进行协作训练。通信开销是一个…
隐形水印已成为验证 AI 生成图像内容的关键机制,主要平台正在大规模部署水印方案……
像 SAM2 这样的 Video object segmentation 方法通过基于 memory 的架构实现了强大的性能,但在视角大幅变化时会因可靠性…
在本研究中,我们使用真实的会议论文提交,探讨在 Elo 排名审稿系统中大型语言模型(LLM)代理审稿人的动态。Mu...
尽管视频生成模型取得了快速进展,但数据在影响运动方面的作用仍然了解不足。我们提出了 Motive(MOTIon attribution for Vi...)。
推荐系统的演进已经将偏好存储从 rating matrices 和 dense embeddings 转向了 agentic era 中的 semantic memory。然而现存…
最近大型语言模型(LLMs)在强推理能力方面的发展推动了数学、编码和科学等多个领域的研究。
大型语言模型在使用链式思考(Chain-of-Thought,CoT)时,往往能更有效地解决复杂推理任务,但代价是需要更长、低带宽的 token 序列。
在大多数人物再识别(ReID)方法中,Tracklet 质量常常被视为事后考虑,绝大多数研究仅关注架构的修改……
我们引入了软件工程 AI 生产力指数(APEX‑SWE),这是一项用于评估前沿 AI 模型是否能够执行具有经济价值的……的基准。
Mixture of Experts (MoE) 模型正成为大型语言模型 (LLMs) 的最新范式。然而,由于内存限制,MoE 模型带有 bi…
准确的个体识别对于监测稀有两栖动物至关重要,但侵入性标记往往不适用于极危物种。我们 e...
从 radiographs 中诊断牙科疾病既耗时又具挑战性,因为诊断证据往往非常微妙。现有方法依赖于……
图像合成模型的快速出现对 AI 生成图像检测器的泛化能力构成了挑战。然而,现有方法往往依赖于 mo...
随着大型语言模型(LLMs)深入嵌入数字平台和决策系统,人们对其政治偏见的担忧日益增长。虽然……
机器学习算法在司法、医疗保健和金融等关键决策领域无处不在,这导致对公平性的需求大幅增长。
CLASSIX算法是一种快速且可解释的数据聚类方法。在其原始形式中,该算法利用对数据点的排序来…
研究人员提出了许多 text-to-SQL 技术,以简化数据分析并加速基于数据库的应用程序开发。为了比较…
将大型语言模型(LLMs)对齐,以服务于具有异质且可能冲突偏好的用户,是个性化和可信...的核心挑战。
组织病理学分析依赖于苏木精-伊红(H&E)染色,但荧光显微镜提供了互补的信息。将荧光…
检索增强生成(Retrieval-Augmented Generation)在软件工程中通常依赖向量相似度搜索,该搜索捕捉主题相似性,但在多跳推理时可能会失效……
强化学习(RL)已成为后训练大型语言模型(LLMs)的核心范式,尤其用于复杂推理任务,但它常常……
我们研究一种去中心化协作请求问题,旨在优化边缘网络中时间敏感客户端的信息新鲜度,...
Chain-of-Thought (CoT) 推理已被证明能够通过鼓励逐步的中间推理来提升大语言模型的效果,近期的进展……
最近在 natural language processing 方面的发展凸显了文本作为生态学新兴数据来源的价值。文本资源携带着独特的信息,能够……
当前的上下文增强方法,例如 retrieval-augmented generation,对于解决知识密集型推理任务至关重要。然而,它们通常...