[Paper] 多智能体强盗问题中的程序公平性
在多智能体多臂赌博机(MA-MAB)的背景下,公平性通常被简化为结果:最大化福利、降低不平等或平衡效用……
在多智能体多臂赌博机(MA-MAB)的背景下,公平性通常被简化为结果:最大化福利、降低不平等或平衡效用……
从视觉观察中推断物理动作是推动 machine intelligence 在物理世界中发展的基本能力。实现这一点需要…
Large Language Models (LLMs) 已经展现出卓越的能力,但仍然容易受到旨在绕过 safety guardrails 的对抗性 “jailbreak” 攻击。
在资源受限的边缘设备上部署基于 Python 的 AI 代理会面临运行时优化的挑战:需要大量线程来掩盖 I/O 延迟,但 Python 的 Global Interpreter Lock(GIL)阻止了真正的并行执行,导致 CPU 利用率不佳。为了解决这一问题,我们提出了一种混合执行模型,结合多进程(multi-process)和多线程(multi-threading)策略:对 CPU 密集型任务使用 Python 的 multiprocessing,对 I/O 密集型操作则在独立线程中使用异步 I/O(asynchronous I/O)。这种方式能够绕过 GIL 处理计算密集型工作负载,并高效地将 I/O 与计算重叠,从而在受限硬件上提升整体吞吐量。我们在 Raspberry Pi 4 上部署了实时目标检测流水线(object detection pipeline),实验表明该模型相较于纯多线程实现实现了 2.5 倍的加速,同时保持了低内存开销。
条件语言模型的内在评估指标,如 perplexity 或 bits-per-character,已在单语和多语环境中被广泛使用……
对大型语言模型(LLMs)进行选择性知识擦除对于遵守GDPR以及模型安全至关重要,然而当前的unlearning方法将行为抑制与真正的…混为一谈。
多智能体系统 (MAS) 通过协调多个代理实现复杂推理,但由于多步执行和重复... 常常导致高推理延迟。
研究材料的光电子结构可能需要计算伪厄米 Hamiltonian 的数千个最小特征对。
大型语言模型(LLMs)在自然语言任务中取得了令人印象深刻的表现,并且正日益在真实世界的应用中部署。尽管...
大型语言模型正日益用于代码生成和调试,但它们的输出仍可能包含来自训练数据的错误。Dist...
AI agent frameworks 的兴起引入了 agent skills,即包含指令和 executable code 的 modular packages,能够动态扩展 agent 的能力……
尽管 transaction throughput 已经开发超过15年,仍然是区块链面临的关键挑战之一,通常其上限为……