[Paper] 使用基于 CLIP 的语义对齐进行 Web 规模多模态摘要
我们引入 Web-Scale Multimodal Summarization,一个轻量级框架,通过结合从网络来源检索的文本和图像数据来生成摘要。G...
3122 posts from this source
我们引入 Web-Scale Multimodal Summarization,一个轻量级框架,通过结合从网络来源检索的文本和图像数据来生成摘要。G...
模型上下文协议(MCP)标准化了基于基础模型(FM)的代理通过调用工具与外部系统交互的方式。然而,要理解……
LLM agents 越来越多地对外部系统进行操作,但 tool effects 是即时的。在出现 failures、speculation 或 contention 时,losing branches 可能泄漏 unintended …
我们推出 “Testimole-conversational”,这是一个庞大的意大利语讨论板帖子集合。该语料库规模巨大,超过 300 亿词。
在过去几年里,状态跟踪任务,尤其是 permutation composition,已成为了解序列模型架构极限的试验平台……
人类视觉系统通过将当前观察与先前观察到的信息整合,适应目标和场景的变化,并进行推理……
虚拟机放置是云计算中的一个关键挑战,旨在高效利用数据中心的物理机资源。虚拟机放置...
在 pull-based 开发模型中,代码贡献以 pull request(PR)的形式提交,以便接受其他开发者的审查和批准,目标是……
自动代码修订(Automated Code Revision,ACR)工具旨在通过根据审稿人反馈自动生成代码修订来减少人工工作量。虽然 ACR 工具已经显示……
本文提出了一种自动化方法,基于变更度量的聚类,对软件开发过程中的源代码变更进行分类。该方法……
量子计算的进步日益威胁当前密码系统所保护的数据的安全性和隐私,尤其是那些依赖于 public-key…
大型语言模型(LLMs)取得了显著进展,参数高效微调(PEFT)已成为下游任务适配的关键技术……
Platonic Representation Hypothesis 认为,来自 neural networks 的表征正在收敛到一个共同的 reality 的 statistical model。我们展示了……
Transformer 架构已成为现代深度学习的基础,但其核心的自注意力机制存在二次计算复杂度的……
部署大型语言模型(LLMs)在实时系统中仍然具有挑战性,因为它们需要大量计算资源并且存在隐私问题。我们提出……
在众多计算领域中,包括多……,对 large‑scale、ill‑conditioned 和 indefinite algebraic equations 的高效求解普遍需求。
边缘-云协同为基础模型的隐私保护部署提供了有前景的范式,其中轻量级的本地设备模型能够适应领域特定的……
在缺失数据的情况下进行学习可能导致偏差的预测和较差的泛化能力等问题,而 data imputation methods 仅...
随着云计算向 Exascale 级别(10^5+ 节点)扩展,主流的“Newtonian”编排范式——以 Kubernetes 为代表——正趋于……
在复杂的、实验驱动的领域中实现科学发现的自动化,不仅仅是对程序的迭代突变;它需要结构化的 hypothesis management……
Quality-Diversity (QD) 算法旨在在行为利基中发现多样且高性能的解决方案。然而,QD 搜索往往因增量……
小岛屿发展中国家(SIDS)在气候驱动的灾害面前暴露程度不成比例地高,但它们常常依赖脆弱的陆地网络,而这些网络在……时会失效。
联邦低秩适配 (FedLoRA) 已经促进了对基础模型进行通信高效且隐私保护的微调,以用于下游任务。在……
通过观看人类视频来学习操作技能的能力有望为机器人学习打开一个高度可扩展的新数据来源。在这里,…