research — Page 104

排序:

3个月前 · software · - · -

[论文] TritonForge：基于性能分析的自动化 Triton 内核优化框架

高性能 GPU kernel 优化仍然是现代机器学习工作负载中一项关键但劳动密集的任务。虽然 Triton，这个领域特定的…

#research #paper #software
3个月前 · ai · - · -

[论文] 改进并行 C++ Intel AVX-512 SIMD 线性遗传编程解释器

我们将最近的 256 SSE 向量工作扩展到 512 AVX，实现了四倍加速。我们使用 MAGPIE（Machine Automated General Performance Improvement via Evolution of ...）。

#research #paper #ai
3个月前 · ai · - · -

[Paper] 进化卓越：LLM-based Agents 的自动优化

基于大型语言模型（LLMs）的 Agentic AI 系统在自动化复杂工作流方面具有巨大的潜力，涵盖从软件开发到客户支持等领域。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] Astra: 通用交互式世界模型与自回归去噪

最近在 diffusion transformers 方面的进展使视频生成模型能够从文本或图像生成高质量的视频片段。然而，world model...

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] Selfi：自我改进的重建引擎通过 3D 几何特征对齐

新视角合成（Novel View Synthesis，NVS）传统上依赖于具有显式3D归纳偏置的模型，并结合来自Structure-from-Motion的已知相机参数……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 高效重建动态场景：一次一个 D4RT

理解并重建来自 video 的动态场景的复杂几何和运动仍然是 computer vision 中的一项艰巨挑战。本文介绍…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 相同内容，不同答案：跨模态不一致性在 MLLMs 中

我们引入了两个新的基准 REST 和 REST+（Render-Equivalence Stress Tests），以实现对多模态大型模型中跨模态不一致性的系统评估。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 统一扩散Transformer用于高保真文本感知图像修复

文本感知图像恢复（TAIR）旨在从包含退化文本内容的低质量输入中恢复高质量图像。虽然扩散模型……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] OSMO：开源触觉手套用于人类到机器人技能转移

人类视频演示为学习机器人策略提供了丰富的训练数据，但仅靠视频无法捕捉对 mast... 至关重要的丰富接触信号。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

【论文】SAQ：稳定子感知量子纠错解码器

量子误差校正（QEC）解码面临着一个基本的准确性‑效率权衡。像最小权重完美匹配（MWPM）这样的经典方法表现出……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] LiDAS: 用于夜间感知的光照驱动动态主动感知

夜间环境对基于相机的感知构成了重大挑战，因为现有方法被动地依赖场景光照。我们引入 Lighting-...

#research #paper #ai #computer-vision
3个月前 · software · - · -

[Paper] 探索经验软件工程研究中的分叉路径花园：多宇宙分析

在 empirical software engineering (SE) 研究中，研究人员在决定如何处理数据、使用何种操作化以及选择哪些……方面拥有相当大的自由。

#research #paper #software
3个月前 · ai · - · -

[Paper] 自演化 3D 场景生成（单张图像）

从单张图像生成高质量、纹理化的 3D 场景仍然是视觉和图形学中的一个根本性挑战。最近的 image-to-3D 生成器能够恢复 re...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] UniLayDiff：一种用于内容感知布局生成的统一扩散Transformer

内容感知布局生成是图形设计自动化中的关键任务，专注于创建视觉上吸引人的元素排列，使其无缝……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 开放聚合物挑战赛：赛后报告

机器学习（ML）为发现可持续聚合物材料提供了一条强有力的途径，但由于缺乏大规模、高质量的……，进展受限。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 基于拓扑优化的无监督密度估计学习

Kernel density estimation 是机器学习、Bayesian inference、stochastic dynamics 和 signal processing 等众多算法的关键组成部分……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 重新审视大语言模型训练中下游指标的规模特性

虽然 Large Language Models (LLMs) 的 scaling laws 传统上侧重于 proxy metrics 如 pretraining loss，但预测 downstream task performance 一直是……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 朝向可信的检索增强生成与稀疏自编码器

检索增强生成（RAG）通过将输出基于检索到的证据进行 grounding，提升了大语言模型（LLMs）的事实性，但忠实性仍可能出现失败……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 无标签，无问题：使用多模态验证器训练视觉推理器

Visual reasoning 具有挑战性，需要精确的 object grounding 并理解复杂的 spatial relationships。现有方法分为两大类：...

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 加速旋转不变卷积用于 UAV 图像分割

旋转不变性对于无人机航拍影像中的精确对象级分割至关重要，因为目标可能具有任意方向并呈现细微的…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 可解释的异常检测用于工业物联网数据流

工业维护正被 Internet of Things 和 edge computing 改造，产生连续的数据流，需要实时、适应性的决策……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 去中心化信任用于空间AI：基于区块链的Federated Learning跨多供应商LEO卫星网络

space AI 的崛起正通过灾害检测、边境监视和气候监测等应用，重塑政府和产业，...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] SATGround: 一种空间感知的遥感视觉定位方法

视觉语言模型（VLMs）正崭露头角，成为遥感领域强大的通用工具，能够在多样任务中整合信息并实现……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] DAO‑GP 漂移感知在线非线性回归高斯过程

真实世界的数据集通常表现出随时间变化的动态特征，其特征是数据分布的演变。忽视这种现象，通常称为概念…

#research #paper #ai #machine-learning

Newer posts

Older posts