[Paper] Pharo 中面向仓库级代码补全的包感知方法
Pharo 提供了一个基于语义启发式的高级补全引擎,它在惰性架构中协调特定的 fetcher。这些启发式…
4750 posts from this source
Pharo 提供了一个基于语义启发式的高级补全引擎,它在惰性架构中协调特定的 fetcher。这些启发式…
分布式 AI 系统在计算、通信和部署层面面临关键的内存管理挑战。基于 RRAM 的内存计算遭受……
我们提出了 Mesh4D,一种用于单目 4D 网格重建的前馈模型。给定一个动态物体的单目视频,我们的模型能够重建该物体的…
最近,Quantum Visual Fields(QVFs)在模型紧凑性和收敛速度方面表现出有希望的改进,用于学习提供的2D或3D信号……
夜间颜色恒常性仍然是计算摄影中的一个具有挑战性的问题,因为低光噪声和复杂的照明条件。我们提出了 RL‑A…
从图像中恢复干净且精确的几何形状对于机器人技术和增强现实至关重要。然而,现有的 geometry foundation models 仍然存在 se...
我们证明了在线多校准的紧致下界,确立了其与边际校准之间的信息论分离。在一般设置下…
功能性抓取与灵巧机器人手是实现工具使用和复杂操作的关键能力,但进展受到两个方面的限制……
指称表达分割(RES)和指称表达理解(REC)分别对表达式描述的对象进行分割和检测,而指称表达…
随着语言模型的能力日益提升,用户期望它们不仅提供准确的响应,还能表现出符合多样化人类偏好的行为……
多样性、数量和质量的操作数据对于训练有效的机器人策略至关重要。然而,由于硬件和物理设置的限制……
大型语言模型受到“幻觉”——由语义噪声引起的逻辑不一致——的困扰。我们提出,当前的架构在一个“Metric…”中运行。
相机控制的生成式视频重新渲染方法,例如 ReCamMaster,已经取得了显著进展。然而,尽管它们在单视角…
人类可以轻松预测物体在交互过程中的运动或变化——想象一只杯子被提起、一把刀在切割,或一个盖子被关闭。W...
我们使用机器学习和人工智能:1)从新闻和社交媒体中衡量各国的和平水平;2)开发在线工具,以……
能够在现实世界中进行推理和规划的智能体需要具备预测其行为后果的能力。虽然 world models 具备这种…
我提出一个新颖的框架,将随机微分方程(SDE)与深度生成模型相结合,以改进机器学习中的不确定性量化。
一次性预测使得仅使用一个标记示例就能快速将 pretrained foundation models 适配到新任务,但缺乏原则性的 uncertainty quantification。
我们提出 textsc{MineNPC-Task},一个由用户编写的基准和评估工具,用于在开放世界 Minecraft 中测试具备记忆感知、混合主动性的 LLM 代理……
大型语言模型(LLMs)在工具调用和工具使用方面表现出卓越的能力,但仍会出现幻觉现象,即它们会选择错误的工具……
脑磁共振成像(MRI)在研究神经发育、衰老和疾病方面发挥核心作用。一个关键的应用是大脑年龄预测……
MoE3D 是一种 mixture-of-experts 模块,旨在锐化深度边界并减轻现有 feed-forward 3D … 中的飞点伪影(红色标出)。
普适人工智能日益依赖于在设备上进行学习的系统,这些系统在严格的资源约束下提供低延迟和能源高效的计算。Liq...
股票市场价格预测是一个重要的跨学科研究领域,位于金融、统计学和经济学的交叉点。预测...
大型视觉语言模型(VLMs)功能强大,但常常因偏向文本提示而非视觉证据而产生幻觉。我们在……中研究了这种失效模式。
在本研究中,我们旨在更好地将 Johns Hopkins Fall Risk Assessment Tool (JHFRAT) 的跌倒风险预测与额外的临床意义测量对齐……
实体链接(将文本中模糊的提及映射到知识库中的实体)是诸如知识图谱构建、问答等任务的基础步骤。
当研究人员将 large language models 用于文献审阅或假设生成等自主任务时,计算费用会迅速累积。A...
大型语言模型(LLMs)已经彻底改变了基于文本的代码自动化,但它们在 graph-oriented engineering workflows 中的潜力仍未得到充分探索……
大型语言模型(LLMs)的快速发展引发了对使用合成数据训练未来模型的日益兴趣。然而,这会产生自我‑c...
链式思考(CoT)推理已成为多模态大型语言模型在视频理解任务中的强大工具。然而,它的必要性和...
具身问答(EQA)在3D环境中通常需要收集分布在多个视角且部分被遮挡的上下文。Ho...
现有的长期个性化对话系统在调和无限的交互流与有限的上下文约束方面遇到困难,常常因 memory...
自然语言推理(NLI)一直是评估语言模型在自然语言理解方面的重要任务,但其逻辑属性……
大型语言模型(LLMs)在复杂推理方面常常受到高计算成本和延迟的阻碍,而资源高效的 Small Language Models (SL...
文档问答(DocQA)专注于基于给定文档回答问题,但现有的 DocQA 代理缺乏有效的工具利用和……
针对作物病害分析的 Visual Question Answering 需要准确的视觉理解和可靠的语言生成。本工作提出了一种轻量级的 vi...
LLM 驱动的 agentic 应用程序正日益自动化复杂的多步骤任务,但由于组件异构,如何高效地为其提供服务仍然是一个挑战。
设计科学仪器通常需要在大型且高度受约束的设计空间中进行探索,并使用计算成本高的物理仿真。这些...
癫痫是一种慢性神经系统疾病,以反复的非诱发性发作为特征,影响全球超过5000万人,并带来显著风险……
癫痫是一种慢性神经系统疾病,以反复的无诱因发作为特征,影响全球超过5000万人,并带来显著的风险……
隐私保护的联邦平均是保护联邦学习中客户端隐私的核心方法。本文中,我们研究了在异步…
提出了一项跨配置基准测试,以在通用开发项目的背景下探索 AVX / NEON 内在函数的能力和局限性。
在摩尔定律的驱动下,晶体管的尺寸已被压缩到纳米尺度。需要先进的量子输运(QT)求解器来准确……
由 AI 编码代理生成的 Pull request(PR)描述是向人工审阅者传达代码更改的主要渠道。然而,alignment b...
本文对 Untappd 进行了一项纵向伦理分析。Untappd 是一款社交饮酒应用,通过徽章(badges)、连胜(streaks)以及社交功能将啤酒消费游戏化。
无许可共识协议需要一种稀缺资源来调节领袖选举并提供 Sybil 抵抗。现有范式如 Proof of Work …
Neural-Symbolic (NeSy) 人工智能已经成为一种有前景的方法,用于将神经网络的学习能力与可解释性相结合。