【论文】ASTRO:自适应拼接基于动力学引导的轨迹展开
离线强化学习(Offline reinforcement learning, RL)使得智能体能够从预先收集的数据集学习最优策略。然而,包含次优和碎片化的…
离线强化学习(Offline reinforcement learning, RL)使得智能体能够从预先收集的数据集学习最优策略。然而,包含次优和碎片化的…
机器学习模型在诊断、天气预报、自然语言处理(NLP)和自动驾驶等领域表现出色,但它们对不确定性的处理有限……
我们介绍了 SuperIntelliAgent,这是一种代理学习框架,将可训练的小型 diffusion model(学习者)与冻结的大型语言模型(t...)相耦合。
自动化漏洞修补对于软件安全至关重要,最近在大型语言模型(LLMs)方面的进展展现了有前景的能力,用于……
我们提出 LFM2,一系列旨在实现高效 on‑device 部署和强大任务能力的 Liquid Foundation Models。使用 hardware‑in‑the‑loop 架构……
Split learning 被广泛认为是一种通过在分布式设备上训练模型来解决数据隐私问题的方法,从而避免引发数据共享的……
伊朗的中小企业(SMEs)日益利用Telegram进行销售,实时互动对转化至关重要。然而,dev...
我们研究在随机到达顺序模型下的在线无权二分匹配问题,设有 $n$ 个离线顶点和 $n$ 个在线顶点,采用学习增强的……
我们提出了Hierarchical AI-Meteorologist,一个LLM-agent系统,利用层次化的forecast推理和天气信息生成可解释的天气报告。
在当代零售业,可供选择的产品种类繁多(例如 clothing、groceries、cosmetics、frozen goods),这使得预测需求变得困难,防止 s...
Knowledge-enhanced text generation 旨在通过利用内部或外部知识源来提升生成文本的质量。虽然语言模型已经…
本工作探讨了构建“能够记忆的机器”的挑战,将长期记忆框定为高效超长上下文建模的问题。W...