[Paper] 埃塞俄比亚卫生设施选址:利用 LLMs 将专家知识整合到算法规划中
埃塞俄比亚卫生部正在升级卫生站,以改善对基本服务的获取,特别是在农村地区。然而,资源有限,需要……
埃塞俄比亚卫生部正在升级卫生站,以改善对基本服务的获取,特别是在农村地区。然而,资源有限,需要……
Vision-Language-Action(VLA)模型正逐渐成为端到端自动驾驶系统中极为有效的规划模型。然而,当前的工作大多…
我们提出了一种新颖的 probabilistic approach 用于 optimal path experimental design。在该方法中,discrete path optimization problem 被定义在 static navigation 上……
Transformer 预训练正日益受到内存和计算需求的限制,键值(KV)缓存已成为训练期间的主要瓶颈。
Predictive Process Monitoring 是 process mining 的一个分支,旨在预测正在进行的过程的结果。最近,它利用机器学习和深度学习……
随着视觉语言模型(VLMs)处理日益复杂和多模态的任务,键值(KV)缓存的快速增长对内存和计算资源提出了显著的压力……
从人类示范中学习结构化任务表征对于理解长时程操作行为,尤其是双手协作的情况,至关重要。
信息过载和错误信息在从大型新闻集合中提取有意义的叙事时带来了重大挑战。本文定义了na...
大型畜牧业对人类健康和环境构成重大风险,同时也易受到诸如传染病等威胁。
Diffusion models 现在能够生成高质量、多样化的样本,且对更强大模型的关注日益增加。虽然 ensembling 是一种众所周知的提升方法……
检索增强生成(Retrieval‑Augmented Generation,RAG)已成为一种强大的方法,通过整合……提升大型语言模型的问答能力。
我们提出了 Map2Thought,一个能够为 3D VLM 提供显式且可解释的空间推理的框架。该框架基于两个关键组件:Metr...
大型语言模型(LLMs)在各个领域表现出卓越的性能,但它们面临着关键的安全问题。模型编辑已经成为一种有效的…
我们报告了大型语言模型(LLMs)在理解“Jabberwocky”语言方面的惊人能力,在这种语言中,大多数或全部内容词已被随机……
本白皮书概述了“technical debt”主题,并提出了一种在团队中管理 technical debt 的方法。本白皮书基于…
PubMed-OCR 是一个以 OCR 为中心的科学文章语料库,来源于 PubMed Central Open Access PDFs。每页图像都使用 Google Cloud Vision 进行标注……
背景与动机。在线用户反馈是需求工程的宝贵资源,但其数量庞大且噪声较多,使得分析变得困难。现有的…
三维装箱问题(3D-BPP)是运筹学和物流领域长期存在的挑战。经典启发式算法和构造方法……
GitHub 原生支持通过 GitHub Actions 实现工作流自动化。然而,工作流的维护常常被软件开发者视为一种负担,他们经常……
脉冲神经网络(SNN)采用受神经可塑性启发的无监督学习方法,有望成为人工智能的新框架。
Function-as-a-Service(FaaS)已成为无服务器云计算的核心范式,但优化 FaaS 部署仍然具有挑战性。使用函数 fu...
我们研究 bots 如何在 Ethereum 生态系统的开源讨论中做出贡献,以及它们是否会影响开发者的情感基调。我们的数据集覆盖了36,8...
大型语言模型(LLMs)向自主代理的演进已经将 AI 编码的范围从局部代码生成扩展到复杂的、仓库级…
高维投资组合优化在复杂约束下面临显著的计算挑战,传统优化方法难以应对 t...