[论文] XTrace:一种非侵入式动态追踪框架,用于生产环境中的 Android 应用
随着移动应用的复杂性呈指数级增长,用户设备环境的碎片化加剧,确保 online application 的稳定性……
随着移动应用的复杂性呈指数级增长,用户设备环境的碎片化加剧,确保 online application 的稳定性……
高分辨率视频生成虽然对数字媒体和电影至关重要,但由于扩散模型的二次复杂度,在计算上成为瓶颈,...
我们揭示了最先进的视觉语言模型(VLMs)中显著的流行偏差,这些模型在著名建筑上的准确率最高可提升34%……
Masked Diffusion Models(MDMs)提供灵活的非自回归生成,但这种自由带来了一个挑战:最终输出质量对……高度敏感。
计算型现场检测(POC)传感器能够在缺乏医疗资源的紧急、偏远和资源受限地区,实现快速、低成本且易于获取的诊断。
我们提出了 Streamo,这是一种实时流式视频 LLM,充当通用交互式助手。与现有专注于狭窄场景的在线视频模型不同……
Segment Anything Model 2 (SAM2) 是一种视觉基础模型,在基于提示的视频目标分割方面取得了显著进展,但其实际部署仍面临挑战……
我们提出 C2LLM——Contrastive Code Large Language Models,这是一个包含 0.5B 和 7B 规模的代码嵌入模型系列。基于 Qwen-2.5-Coder 骨干,...
在大型全切片图像(WSI)中,对小块(tiles)的解释通常需要更大的图像上下文。我们提出了 TICON,一种基于 transformer 的 tile 表示方法……
像抽象与推理语料库(ARC)和 ARC-AGI 这样的推理基准被广泛用于评估人工智能的进展,并且常常 ...
从噪声中分离信号是实验科学的核心。将成熟的统计方法有效地应用于 LLM evals 需要考虑……
我们提出了并行令牌预测(Parallel Token Prediction,PTP),这是一种用于语言模型中并行序列生成的通用框架。PTP 联合预测多个相互依赖的 t...
最小化 PDE‑残差损失是促进神经算子物理一致性的常用策略。然而,标准形式往往缺乏变分 c...
本文推导了“Scaling Laws for Economic Impacts”——即大语言模型(LLMs)的训练算力与专业……之间的经验关系。
Data processing inequality 是信息论中的一个原理,指出对观测到的信号进行处理时,信号的信息内容不能增加。
在形状上求解偏微分方程(PDE)是许多形状分析和工程任务的基础;然而,现有的 PDE 求解器主要在多边形/三角网格上运行……
图形用户界面(GUI)代理可以通过自动化在移动设备上频繁执行的长延迟任务,显著提升生产力。然而,ex...
急性髓系白血病(AML)由于其极端的分子异质性和高复发率,仍然是临床上的挑战。虽然精准医学已经引入……
Model merging 已成为一种轻量级的替代方案,用于 joint multi-task learning (MTL),但合并模型的泛化属性仍然在很大程度上未被探讨。
结构化数据从表格中提取在扫描文档和数字档案的文档图像分析中发挥着关键作用。虽然已经有许多方法……
现代外科系统日益依赖 intelligent scene understanding,以提供及时的 situational awareness,提升 intra-operative safety。 Within...
Engineering Manuals(EM)的用户发现阅读 EM 很困难,因为它们篇幅很长,格式密集,包含书面文档、逐步 …
现代深度学习方法通常将图像序列视为顺序堆叠帧的大张量。然而,这种直接的表示是否…
工业推荐系统在日志驱动范式下面临两个根本性的限制:(1) 基于ID的项目表示的知识贫乏导致……