research — Page 79

排序:

2个月前 · software · - · -

[论文] XTrace：一种非侵入式动态追踪框架，用于生产环境中的 Android 应用

随着移动应用的复杂性呈指数级增长，用户设备环境的碎片化加剧，确保 online application 的稳定性……

#research #paper #software
2个月前 · ai · - · -

[Paper] HiStream：通过消除冗余的流式传输实现高效高分辨率视频生成

高分辨率视频生成虽然对数字媒体和电影至关重要，但由于扩散模型的二次复杂度，在计算上成为瓶颈，...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 超越记忆：多模态序回归基准，揭示视觉语言模型中的流行度偏差

我们揭示了最先进的视觉语言模型（VLMs）中显著的流行偏差，这些模型在著名建筑上的准确率最高可提升34%……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 通过量化不确定性优化 Masked Diffusion Models 中的解码路径

Masked Diffusion Models（MDMs）提供灵活的非自回归生成，但这种自由带来了一个挑战：最终输出质量对……高度敏感。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 用于计算型现场检测传感器的自主不确定性量化

计算型现场检测（POC）传感器能够在缺乏医疗资源的紧急、偏远和资源受限地区，实现快速、低成本且易于获取的诊断。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 流媒体视频指令微调

我们提出了 Streamo，这是一种实时流式视频 LLM，充当通用交互式助手。与现有专注于狭窄场景的在线视频模型不同……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[论文] Fast SAM2 with 文本驱动 Token 剪枝

Segment Anything Model 2 (SAM2) 是一种视觉基础模型，在基于提示的视频目标分割方面取得了显著进展，但其实际部署仍面临挑战……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] C2LLM 技术报告：通过自适应交叉注意力池化实现代码检索的新前沿

我们提出 C2LLM——Contrastive Code Large Language Models，这是一个包含 0.5B 和 7B 规模的代码嵌入模型系列。基于 Qwen-2.5-Coder 骨干，...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] TICON：一种用于组织病理学表征学习的切片级Tile Contextualizer

在大型全切片图像（WSI）中，对小块（tiles）的解释通常需要更大的图像上下文。我们提出了 TICON，一种基于 transformer 的 tile 表示方法……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 你的推理基准可能并未测试推理：揭示抽象推理基准中的感知瓶颈

像抽象与推理语料库（ARC）和 ARC-AGI 这样的推理基准被广泛用于评估人工智能的进展，并且常常 ...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 测量 LLM 评估中的所有噪声

从噪声中分离信号是实验科学的核心。将成熟的统计方法有效地应用于 LLM evals 需要考虑……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[论文] 并行标记预测语言模型

我们提出了并行令牌预测（Parallel Token Prediction，PTP），这是一种用于语言模型中并行序列生成的通用框架。PTP 联合预测多个相互依赖的 t...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 变分校正算子学习：具备后验误差估计的Reduced basis neural operator

最小化 PDE‑残差损失是促进神经算子物理一致性的常用策略。然而，标准形式往往缺乏变分 c...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 经济生产力的尺度定律：在 LLM 辅助的咨询、数据分析和管理任务中的实验证据

本文推导了“Scaling Laws for Economic Impacts”——即大语言模型（LLMs）的训练算力与专业……之间的经验关系。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 数据处理不等式是否反映实践？关于低层任务的效用

Data processing inequality 是信息论中的一个原理，指出对观测到的信号进行处理时，信号的信息内容不能增加。

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 学习在神经形状表示上求解 PDE

在形状上求解偏微分方程（PDE）是许多形状分析和工程任务的基础；然而，现有的 PDE 求解器主要在多边形/三角网格上运行……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] AndroidLens: 长延迟评估与嵌套子目标的 Android GUI Agents

图形用户界面（GUI）代理可以通过自动化在移动设备上频繁执行的长延迟任务，显著提升生产力。然而，ex...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 转录组条件化个性化De Novo药物生成用于AML的Metaheuristic Assembly与Target-Driven Filtering

急性髓系白血病（AML）由于其极端的分子异质性和高复发率，仍然是临床上的挑战。虽然精准医学已经引入……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 通过多教师知识蒸馏实现模型合并

Model merging 已成为一种轻量级的替代方案，用于 joint multi-task learning (MTL)，但合并模型的泛化属性仍然在很大程度上未被探讨。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 基于掩码的表格分割后处理用于结构坐标提取

结构化数据从表格中提取在扫描文档和数字档案的文档图像分析中发挥着关键作用。虽然已经有许多方法……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 使用 Spike-Driven Video Transformer 的外科场景分割，具备实时潜力

现代外科系统日益依赖 intelligent scene understanding，以提供及时的 situational awareness，提升 intra-operative safety。 Within...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] SMART SLM：结构化记忆与推理Transformer，小型语言模型用于精准文档辅助

Engineering Manuals（EM）的用户发现阅读 EM 很困难，因为它们篇幅很长，格式密集，包含书面文档、逐步 …

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] GriDiT：因式分解的网格式扩散用于高效长图像序列生成

现代深度学习方法通常将图像序列视为顺序堆叠帧的大张量。然而，这种直接的表示是否…

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] ReaSeq：通过推理释放世界知识用于序列建模

工业推荐系统在日志驱动范式下面临两个根本性的限制：(1) 基于ID的项目表示的知识贫乏导致……

#research #paper #ai #nlp

Newer posts

Older posts