[Paper] SkillReducer:优化 LLM 代理技能的 Token 效率
基于 LLM 的编码代理依赖于技能——预打包的指令集,用以扩展代理的能力,但每一个注入上下文的技能内容的 token …
4611 posts from this source
基于 LLM 的编码代理依赖于技能——预打包的指令集,用以扩展代理的能力,但每一个注入上下文的技能内容的 token …
自动化放射学报告摘要旨在将冗长的发现提炼为简洁的临床印象,但现有的多模态模型常常在...方面遇到困难。
FLEURS 提供 100 多种语言的 n-way 并行语音,但北库尔德语不在其中,这限制了对自动语音识别的基准测试和……
对更高的预测精度和更快的执行性能的需求在神经网络领域持续增长。大型语言模型的出现和成功……
数据中心对我们的数字社会至关重要,但它们消耗了全球相当大比例的电力,且需求预计将继续增长。为了提升它们的…
元启发式算法,如粒子群优化(PSO)和进化算法(EA),在探索解空间方面表现出色,但缺乏机制来实现……
机器学习(ML)模型的日益可用,尤其是基础模型,使它们能够在各种下游应用中使用,从 s...
Hackathons 是有时间限制的协作活动,通常以软件创作为目标。虽然过去已经对 Hackathons 进行过研究,但现有工作主要关注……
始终开启的 edge cameras 生成连续的视频流,其中冗余帧会通过挤占 top‑k 搜索的正确结果,降低 cross‑modal retrieval 的效果。T...
Scratch 是最受初学者欢迎的编程环境,全球已创建超过 11.5 亿个项目。不同于传统语言,正确性在……
编译量子电路是量子计算的主要瓶颈,考虑到未来几年所需的规模,这一过程很可能会变得不可接受地漫长。Techniq...
我们考虑用于分布式决策任务的三种分类系统:具有无限计算和证书的系统,由 Balliu、D'Angelo、Fraigniaud 等人定义,……
在数据流网络中引入动态功耗管理策略(如时钟门控和功率门控)已被证明能够显著降低能量……
对联邦学习(FL)的后门攻击通常使用合成的角落补丁或分布外(OOD)模式进行评估,这些模式不太可能出现……
现代 AI 的快速发展正迅速将传统工业系统转变为庞大、智能且可能无人化的自主运营环境。
非线性计算对于各种信息处理任务至关重要。光学实现具有吸引力,因为被动光传播可以操控……
合成 human motion 发展迅速,但 realistic hand motion 和 bimanual interaction 仍未得到充分研究。Whole-body models 往往忽略细粒度的——
相似性度量被广泛用于解释神经网络用于解决任务的表征几何结构。然而,由于现有方法比较 t...
获取用于3D人体网格估计的标注数据集具有挑战性,因为存在深度歧义,并且从单目图像对3D几何进行标注本身就很困难。
现代文本到图像(Text-to-Image,T2I)扩散模型已实现了显著的语义对齐,但它们常常存在显著的多样性缺失,趋向于……
在操作过程中对人手和物体的精确3D理解仍然是自体视觉的一个重大挑战。现有的hand‑object...
在视觉场景生成方面取得了巨大的进展,现在可以将单张图像转化为可探索的3D世界,但没有声音,沉浸感仍然不完整。我们介绍…
循环网络不需要雅可比传播来进行在线适应。隐藏状态已经通过前向传播携带了时间信用;即时导...
线性表示假设认为神经网络激活以线性混合的方式编码高级概念。然而,在叠加的情况下,这种……
大语言模型的 scaling laws 在很大程度上取决于 optimizer 和 parameterization。现有的 hyperparameter transfer laws 主要是为…
我们推出了 ParaSpeechCLAP,这是一种双编码器对比模型,可将语音和文本风格的字幕映射到共同的嵌入空间,支持广泛的……
AI-augmented ecosystems(多个 AI 组件通过共享数据和基础设施进行交互的互联系统)正成为架构的常态……
我们提出使用 Vision-Language Models (VLMs) 来进行 macro placement 在 chip floorplanning 中,这是一项复杂的优化任务,最近已经显示出有希望的进展。
机器人映射系统通常通过机器人自身的传感器和摄像头来构建度量-语义场景表示。然而,这些“第一人称……”
现代分布式系统集成异构服务、具有不同模式版本的 REST API、GraphQL 端点以及具有专有负载的 IoT 设备……
视觉语言模型(VLMs)在各种任务中展示了令人印象深刻的能力,激发了利用这些模型来监督机器人学习的努力。
Flow‑GRPO 成功地将强化学习应用于流模型,但在所有步骤中使用了统一的信用分配。这忽略了时间结构……
我们提出了一种用于离线数据下策略学习的交叉拟合去偏置装置。该学习原理的一个关键结果是即使在 ... sqrt N regret。
面部识别系统正日益在执法和安保领域部署,在这些场景中,算法决策可能带来重大的社会后果。
联邦学习(Federated Learning,FL)正因其能够利用大量分散的数据并保持隐私而被更广泛地采用。然而,despi…
心理量表的开发传统上需要广泛的专家参与、反复修订以及大规模的试点测试,才能进行psychometric评估。
对于任意 Δ,记 k_Δ 为满足 ((k+1)(k+2) le Delta) 的最大整数 k。我们给出一个分布式 LOCAL 算法,该算法在给定整数 (k < k_Δ) 时,计算出一个有效的 …
新兴的生成式 AI 部署正日益在去中心化且异构的边缘设备上执行推理,而不是在单一可信服务器上……
多模态大语言模型(MLLMs)通过提升输入保真度实现更强的视觉理解,但随之而来的视觉标记增长使得联合…
已知反思性写作有助于学生元认知技能的发展,然而学习者常常难以进行深入的反思,限制了学习……
每四年,经济合作与发展组织(OECD)会进行一次PISA测试,以评估全球青少年学生的知识水平,并用于比较各国教育体系。
Agentic 知识图谱问答 (KGQA) 需要智能体对知识图谱 (KG) 进行迭代交互,这在训练数据方面带来了挑战……
静态时序分析(STA)对电子设计自动化(EDA)流程至关重要,但仍然是计算瓶颈。虽然现有的基于GPU的STA引擎……
在生物医学中,data-driven 方法的快速采用加剧了对 privacy、governance 和 regulation 的担忧,限制了原始数据的共享并阻碍了……
Edge AI 系统越来越依赖联邦学习在分布式、隐私保护和资源受限的环境中训练感知模型。Ye...
元启发式优化领域因大量使用新 nature-inspired metaphor 的新算法涌现而变得活跃,但这些算法缺乏明确的方法论……
像 Scratch 这样的块式编程环境已在计算机科学教育中被广泛采用,但基于鼠标的 drag-and-drop 界面可能会带来挑战……
具有多样结构特征的图在建模和优化任务中发挥核心作用。能够生成不同类型的图……