Areon:延迟友好且弹性多提议者共识
我们提出 Areon,这是一族延迟友好、权益加权的多提议者权益证明共识协议。通过允许每个时隙拥有多个提议者并且……
3376 posts from this source
我们提出 Areon,这是一族延迟友好、权益加权的多提议者权益证明共识协议。通过允许每个时隙拥有多个提议者并且……
生物神经元展现出非凡的智能:它们保持内部状态,选择性地与其他神经元通信,并自组织成复杂的……
使用非侵入式视觉系统进行老年人护理的跌倒检测仍然是一个重要但尚未解决的问题。受到严格隐私要求的驱动,infere...
Reservoir computing (RC) 是一种强大的框架,用于预测 nonlinear dynamical systems,然而 reservoir topology——尤其是连接中的 symmetry——的作用仍未得到充分研究。
我们通过建立有限扰动基础来实现局部 credit assignment,从而将 Equilibrium Propagation (EP) 从无限小扰动的限制中解放出来。通过……
我们调查了大型语言模型(LLMs)在不同任务难度上的泛化能力,这是一项对有效数据策划和评估至关重要的问题。E...
虽然现代扩散模型在生成高质量且多样化的图像方面表现出色,但它们仍然在高保真组合和多模态控制方面存在困难,...
学习在新平台和新场景中仅通过少量示例来学习新的机器人任务仍然具有挑战性。虽然其他形态——人类…(后文保持不变)
大型语言模型是强大的通用模型,但解决诸如人类最后考试(HLE)之类的深层复杂问题仍然在概念上……
Vision-Language Models (VLMs) 仍然缺乏空间智能方面的鲁棒性,在空间理解和推理任务上表现不佳。我们...
Synthetic data has become increasingly important for training large language models, especially when real data is scarce, expensive, or privacy-sensitive. Many ... 合成数据在训练大型语言模型方面变得越来越重要,尤其是在真实数据稀缺、成本高昂或涉及隐私的情况下。许多 …
是否可以仅凭相机轨迹——它在空间中划出的路径——而不观看像素来感知视频的内容?本文首次系统地探讨了这一问题……
MLLM 在孤立查询上表现出强大的推理能力,但它们是 de novo ——每个问题独立求解,且常常重复相同的错误。Existi...
因果效应估计在网络系统中是数据驱动决策的核心。在这种情境下,对某一单元的干预可能会溢出到其他单元,...
尽管技术取得了显著进步,AI 系统仍可能受益于生物学原理,例如递归连接和能效机制……
Gliomas 是一种脑肿瘤类型,具有高死亡率,这意味着早期且准确的诊断对于肿瘤的治疗干预至关重要……
大型语言模型(LLM)推理通常面临高解码延迟以及在异构边缘‑云环境中的可扩展性受限。现有的…
人工智能在电信领域的崛起,从优化无线接入网络到管理用户体验,已显著增加了数据量和训练需求……
训练大型语言模型(LLMs)进行推理通常依赖于带有任务特定验证器的强化学习(RL)。然而,许多现实世界的推理‑
量化对象姿态估计的不确定性对于稳健的控制和规划至关重要。尽管姿态估计是一个研究成熟的机器人问题……
近年来,具身智能中的 Vision-Language-Action(VLA)模型发展迅速。然而,现有的 adversarial attack 方法需要高成本……
大型多模态模型(LMM)因其强大的指令遵循能力和一致性,正日益被用作多模态评估系统中的评审者。本文提出 Multi-Crit 基准,用于测试 LMM 能否充当可靠的评审...
AI/ML 模型卡可以包含针对 AI/ML 模型与预期用途的基准评估,但在模型训练期间进行的一次性评估并不能……
我们介绍 EvilGenie,一个用于编程环境中 reward hacking 的基准。我们从 LiveCodeBench 获取问题,并创建一个环境,使得 agents …
动作质量评估(AQA)从动作视频中预测细粒度的执行分数,已广泛应用于体育、康复和技能评估……
AI模型在日常设备中的广泛应用凸显了一个关键挑战:预测错误会降低用户体验。虽然现有的解决方案……
优化大型语言模型(LLMs)以实现多轮对话结果仍然是一个重大挑战,尤其是在像 AI mar... 这样的目标导向设置中。
AI/ML模型已迅速崭露头角,作为解决先前未解决问题的创新,其放大人类偏见的意外后果……
更深的视觉Transformer往往表现不如较浅的模型,这挑战了常见的尺度假设。通过对ViT-...的系统性实证分析,...
我们推出 Qwen3-VL,这是截至目前 Qwen 系列中最强大的视觉语言模型,在广泛的多模态基准上实现了卓越的性能……
大型语言模型在生成创意文本方面的能力日益提升,然而大多数关于 AI 生成诗歌的研究仍聚焦于英语——一种占主导地位的语言……
最近,Freedman 和 Mulligan 的研究表明,浅层多层感知器在训练过程中会自发地形成 Kolmogorov‑Arnold 几何(KAG)结构,在 t...
尽管图卷积网络(GCNs)在基于骨架的动作识别中取得了显著成功,但它们的性能往往依赖于大量的实验室…
大型语言模型(LLMs)最近在基于文本属性的图机器学习领域引发了革命,但将LLMs应用于图异常检测、...
算法已被估计在 2012 年至 2023 年间将 AI 训练 FLOP 效率提升了 22,000 倍 [Ho et al., 2024]。运行小规模的消融实验…
在大型语言模型(LLMs)预训练中加入metadata最近被视为一种加速训练的有前景的方法。然而,以前的工作强调……
现代云数据库将扩展呈现为二元决策:通过添加节点进行 scale-out,或通过增加每节点资源进行 scale-up。这种单维视角 i...
大型语言模型(LLMs)在广泛任务中展现出卓越的能力,但其内部机制仍然大多不透明。在本文中,w...
处理缺失数据是数据驱动分析中的核心挑战。现代 imputation 方法不仅旨在实现精确重建,而且在 … 方面也有所不同。
交互式分割模型,例如 Segment Anything Model(SAM),在自然图像上展示了显著的泛化能力,但表现不佳……
生成式 AI 的兴起使得在医疗、金融和公共政策等领域能够生成高保真度的合成表格数据,这不仅提升了数据可用性,还带来了诸多挑战和机遇。随着合成数据质量的不断提升,研究人员和从业者开始探索其在数据共享、隐私保护以及模型训练等方面的潜在应用。然而,合成数据的真实性、偏差以及对下游任务的影响仍是亟待解决的问题。本文综述了当前生成式 AI 在合成表格数据生成中的最新进展,重点讨论了模型架构、评估指标以及实际应用场景,并提出了未来研究的可能方向。
Large language models (LLMs) achieve state-of-the-art results across many natural language tasks, but their internal mechanisms remain difficult to interpret. I...
视频扩散模型在帧级保真度方面表现出色,但仍在运动连贯性、动态性和真实感方面存在困难,常常会产生抖动、重影或 …
大型语言模型(LLMs)在许多基准测试中取得了令人印象深刻的结果,但它们在规划和有状态推理方面的能力仍不明确。我们研究了……
智能电网是经典电力基础设施与先进通信网络和智能控制的融合,旨在创建一个网络物理环境……
端到端(E2E)自动驾驶模型在开放环评估中表现出强大的性能,但往往会出现级联错误和泛化能力差的问题……
口腔癌在全球范围内非常常见,且大多在晚期才被诊断,因为它在视觉上与良性、癌前以及恶性病变非常相似。
Latent reasoning 代表了 Transformer 语言模型的一个新发展,与 chain-of-thought 相比,它在压缩推理长度方面显示出潜力。