[Paper] 使用单次概率前向传播和代码生成加速贝叶斯神经网络的执行
机器学习模型在诊断、天气预报、自然语言处理(NLP)和自动驾驶等领域表现出色,但它们对不确定性的处理有限……
3360 posts from this source
机器学习模型在诊断、天气预报、自然语言处理(NLP)和自动驾驶等领域表现出色,但它们对不确定性的处理有限……
我们介绍了 SuperIntelliAgent,这是一种代理学习框架,将可训练的小型 diffusion model(学习者)与冻结的大型语言模型(t...)相耦合。
近期在 generative world models 方面的进展,使得在创建 open-ended game environments 上取得了显著进展,已从 static scene synthesis 向……发展。
最近在 text-to-video (T2V) 和 image-to-video (I2V) 模型方面的进展,使得从简单的文本创建视觉上引人注目且动态的视频成为可能……
自动化漏洞修补对于软件安全至关重要,最近在大型语言模型(LLMs)方面的进展展现了有前景的能力,用于……
水下目标跟踪具有挑战性,因为波长相关的衰减和散射会严重扭曲不同深度和水体条件下的外观……
我们提出 LFM2,一系列旨在实现高效 on‑device 部署和强大任务能力的 Liquid Foundation Models。使用 hardware‑in‑the‑loop 架构……
Split learning 被广泛认为是一种通过在分布式设备上训练模型来解决数据隐私问题的方法,从而避免引发数据共享的……
伊朗的中小企业(SMEs)日益利用Telegram进行销售,实时互动对转化至关重要。然而,dev...
Direct Preference Optimization(DPO)是一种在各个领域广泛使用的基于人类反馈的强化学习(RLHF)方法。最近的研究已经…
我们研究在随机到达顺序模型下的在线无权二分匹配问题,设有 $n$ 个离线顶点和 $n$ 个在线顶点,采用学习增强的……
我们提出了Hierarchical AI-Meteorologist,一个LLM-agent系统,利用层次化的forecast推理和天气信息生成可解释的天气报告。
在单一 tokenizer 中统一多模态的理解、生成和重建表示仍然是构建统一模型的关键挑战。此前...
新手用户和专家用户在任务导向对话中有不同的系统性偏好。然而,迎合这些偏好是否真的能提升用户……
现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……
尽管在 multilingual speech processing 方面取得了近期进展,非洲语言在研究和已部署的系统中仍然代表性不足,尤其是当 i...
在当代零售业,可供选择的产品种类繁多(例如 clothing、groceries、cosmetics、frozen goods),这使得预测需求变得困难,防止 s...
程序合成是根据一组规范(例如一组输入‑输出示例)生成计算机程序的过程。它可以被建模为……
Knowledge-enhanced text generation 旨在通过利用内部或外部知识源来提升生成文本的质量。虽然语言模型已经…
赌博障碍是一种复杂的行为成瘾,难以理解和处理,伴随严重的身体、心理和社会后果……
图表到代码的生成是自动化数据可视化中的关键任务,它将复杂的图表结构转换为可执行程序。虽然最近的 Multi-m...
本工作探讨了构建“能够记忆的机器”的挑战,将长期记忆框定为高效超长上下文建模的问题。W...
大规模视觉语言模型(LVLMs)在需要视觉信息的任务中展现出先进的能力,包括目标检测。这些能力……
基于变异的故障定位(Mutation-based Fault Localization,MBFL)已被广泛探索用于自动化软件调试,利用人工变异体来识别有缺陷的代码实体……
内容无关模型,由 Censor‑Hillel、Cohen、Gelles 和 Sel(PODC 2022;Distributed Computing 2023)提出,捕捉了一种极其弱的形式的…
联邦边缘学习(FEEL)为边缘人工智能(AI)提供了有前景的基础,通过实现协作模型训练,同时保护 d...
现代云应用构建在独立、多样的 microservices 之上,提供 scalability、flexibility 和 usage-based billing。然而,结构的 d...
在 Android 应用中动态解析方法可达性仍然是一个关键且基本未解决的问题。尽管在 GUI 测试方面取得了显著进展……
Split learning (SL) 将主要计算任务从多个资源受限的用户设备 (UE) 卸载到基站 (BS),同时保留本地数据……
Vibe coding,作为备受推崇的将 AI 技术用于编程的方式,面临两个巨大的障碍:目标指定的困难(“prompt engineering”是……)。
随着大型语言模型(LLMs)重塑软件开发,将 LLM‑增强的实践融入软件工程(SE)教育已成为迫切需求。虽然现有研究探讨了 LLMs 在教育中的…
高容量核 Hopfield 网络表现出一种被称为“优化岭”的特性,其特点是极端的稳定性。虽然之前将其与“谱浓度”联系在一起,...
我们提出 Areon,这是一族延迟友好、权益加权的多提议者权益证明共识协议。通过允许每个时隙拥有多个提议者并且……
生物神经元展现出非凡的智能:它们保持内部状态,选择性地与其他神经元通信,并自组织成复杂的……
使用非侵入式视觉系统进行老年人护理的跌倒检测仍然是一个重要但尚未解决的问题。受到严格隐私要求的驱动,infere...
Reservoir computing (RC) 是一种强大的框架,用于预测 nonlinear dynamical systems,然而 reservoir topology——尤其是连接中的 symmetry——的作用仍未得到充分研究。
我们通过建立有限扰动基础来实现局部 credit assignment,从而将 Equilibrium Propagation (EP) 从无限小扰动的限制中解放出来。通过……
我们调查了大型语言模型(LLMs)在不同任务难度上的泛化能力,这是一项对有效数据策划和评估至关重要的问题。E...
虽然现代扩散模型在生成高质量且多样化的图像方面表现出色,但它们仍然在高保真组合和多模态控制方面存在困难,...
学习在新平台和新场景中仅通过少量示例来学习新的机器人任务仍然具有挑战性。虽然其他形态——人类…(后文保持不变)
大型语言模型是强大的通用模型,但解决诸如人类最后考试(HLE)之类的深层复杂问题仍然在概念上……
Vision-Language Models (VLMs) 仍然缺乏空间智能方面的鲁棒性,在空间理解和推理任务上表现不佳。我们...
Synthetic data has become increasingly important for training large language models, especially when real data is scarce, expensive, or privacy-sensitive. Many ... 合成数据在训练大型语言模型方面变得越来越重要,尤其是在真实数据稀缺、成本高昂或涉及隐私的情况下。许多 …
是否可以仅凭相机轨迹——它在空间中划出的路径——而不观看像素来感知视频的内容?本文首次系统地探讨了这一问题……
MLLM 在孤立查询上表现出强大的推理能力,但它们是 de novo ——每个问题独立求解,且常常重复相同的错误。Existi...
因果效应估计在网络系统中是数据驱动决策的核心。在这种情境下,对某一单元的干预可能会溢出到其他单元,...
尽管技术取得了显著进步,AI 系统仍可能受益于生物学原理,例如递归连接和能效机制……
Gliomas 是一种脑肿瘤类型,具有高死亡率,这意味着早期且准确的诊断对于肿瘤的治疗干预至关重要……