[论文] LFM2 技术报告
我们提出 LFM2,一系列旨在实现高效 on‑device 部署和强大任务能力的 Liquid Foundation Models。使用 hardware‑in‑the‑loop 架构……
我们提出 LFM2,一系列旨在实现高效 on‑device 部署和强大任务能力的 Liquid Foundation Models。使用 hardware‑in‑the‑loop 架构……
Split learning 被广泛认为是一种通过在分布式设备上训练模型来解决数据隐私问题的方法,从而避免引发数据共享的……
伊朗的中小企业(SMEs)日益利用Telegram进行销售,实时互动对转化至关重要。然而,dev...
Direct Preference Optimization(DPO)是一种在各个领域广泛使用的基于人类反馈的强化学习(RLHF)方法。最近的研究已经…
我们研究在随机到达顺序模型下的在线无权二分匹配问题,设有 $n$ 个离线顶点和 $n$ 个在线顶点,采用学习增强的……
我们提出了Hierarchical AI-Meteorologist,一个LLM-agent系统,利用层次化的forecast推理和天气信息生成可解释的天气报告。
在单一 tokenizer 中统一多模态的理解、生成和重建表示仍然是构建统一模型的关键挑战。此前...
新手用户和专家用户在任务导向对话中有不同的系统性偏好。然而,迎合这些偏好是否真的能提升用户……
现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……
尽管在 multilingual speech processing 方面取得了近期进展,非洲语言在研究和已部署的系统中仍然代表性不足,尤其是当 i...
在当代零售业,可供选择的产品种类繁多(例如 clothing、groceries、cosmetics、frozen goods),这使得预测需求变得困难,防止 s...
程序合成是根据一组规范(例如一组输入‑输出示例)生成计算机程序的过程。它可以被建模为……