· ai
[Paper] Lang3D-XL: 语言嵌入的 3D 高斯用于大规模场景
在3D表示中嵌入语言字段,通过将几何与描述性意义关联,实现对空间环境更丰富的语义理解。Th...
在3D表示中嵌入语言字段,通过将几何与描述性意义关联,实现对空间环境更丰富的语义理解。Th...
我们提出 Multi-view Pyramid Transformer (MVP),一种可扩展的多视角 transformer 架构,能够直接从十到数百...重建大型 3D 场景。
我们提出了 GRAPE(Group RepresentAtional Position Encoding),一个基于群作用的统一位置编码框架。GRAPE 将两类……
在真实世界的视频中,叙事通常通过多个镜头展开——这些镜头虽然不连续,却在语义上相连,共同传达一个连贯的叙事……
LLM-based agents 正在快速被接入专家决策支持系统,但在混乱且高风险的环境中,它们很少让团队更聪明:人机团队的……
Carbon-aware 调度器的目标是通过在碳强度低的时段运行灵活的工作负载,以降低数据中心的运营碳足迹。Mos...
我们提出了一种构建大型因果模型(LCMs)的新范式,利用当今大型语言模型(LLMs)中潜在的巨大潜能。我们描述……
大型语言模型(LLMs)正日益被部署在需要推理的场景中,例如多步骤问题求解和 chain-of-thought。 然而,...
流处理是一种计算范式,支持对各种应用的实时数据处理。在 Meta,公司内部广泛用于 …
近期的强化学习(RL)技术在语言模型中取得了显著的推理提升,但仍不清楚后训练的……
大多数视觉生成模型在应用扩散或自回归建模之前,会将图像压缩到潜在空间中。然而,现有的方法,例如 VAEs ……
利用一组配对叙事的数据集,我们研究大型语言模型(LLMs)在可靠区分不连贯和连贯故事方面的程度……