[Paper] 类型与依赖的协同演化:面向仓库级 Python 代码的类型推断
Python 的动态类型机制虽然提升了灵活性,但也是大规模软件中大量运行时类型错误的主要来源,这激发了 …
Python 的动态类型机制虽然提升了灵活性,但也是大规模软件中大量运行时类型错误的主要来源,这激发了 …
随着移动应用的复杂性呈指数级增长,用户设备环境的碎片化加剧,确保 online application 的稳定性……
高分辨率视频生成虽然对数字媒体和电影至关重要,但由于扩散模型的二次复杂度,在计算上成为瓶颈,...
我们揭示了最先进的视觉语言模型(VLMs)中显著的流行偏差,这些模型在著名建筑上的准确率最高可提升34%……
Masked Diffusion Models(MDMs)提供灵活的非自回归生成,但这种自由带来了一个挑战:最终输出质量对……高度敏感。
计算型现场检测(POC)传感器能够在缺乏医疗资源的紧急、偏远和资源受限地区,实现快速、低成本且易于获取的诊断。
我们提出了 Streamo,这是一种实时流式视频 LLM,充当通用交互式助手。与现有专注于狭窄场景的在线视频模型不同……
Segment Anything Model 2 (SAM2) 是一种视觉基础模型,在基于提示的视频目标分割方面取得了显著进展,但其实际部署仍面临挑战……
我们提出 C2LLM——Contrastive Code Large Language Models,这是一个包含 0.5B 和 7B 规模的代码嵌入模型系列。基于 Qwen-2.5-Coder 骨干,...
在大型全切片图像(WSI)中,对小块(tiles)的解释通常需要更大的图像上下文。我们提出了 TICON,一种基于 transformer 的 tile 表示方法……
像抽象与推理语料库(ARC)和 ARC-AGI 这样的推理基准被广泛用于评估人工智能的进展,并且常常 ...
从噪声中分离信号是实验科学的核心。将成熟的统计方法有效地应用于 LLM evals 需要考虑……