· ai
[Paper] 泛化结果会泛化吗?
大型语言模型(LLM)的分布外(OOD)泛化能力对其部署至关重要。先前的研究评估LLM的泛化……
大型语言模型(LLM)的分布外(OOD)泛化能力对其部署至关重要。先前的研究评估LLM的泛化……
近期的视频生成模型展示了令人印象深刻的合成能力,但仍受单模态条件的限制,限制了它们的整体工作……
视觉生成模型(例如 diffusion models)通常在压缩的潜在空间中运行,以平衡训练效率和样本质量。与此同时,...
本文首次进行大规模现场研究,探讨通用 AI 代理在 open-world web 环境中的采纳、使用强度和使用案例。
随着网络威胁的复杂性和多样性不断升级,静态honeypots已不足以应对,必须采用自适应、情报驱动的欺骗。在……
基于指令的图像编辑数据集的质量和多样性正在不断提升,然而用于基于指令的……的大规模高质量数据集仍然不足。
众包平台,例如 Stack Overflow,已经改变并影响了软件开发实践。在这些平台上,开发者分享和复用……
近期的视频生成器实现了惊人的写实效果,但在三维空间上仍然根本不一致。我们提出了 WorldReel,这是一种原生的四维视频生成器……
我们提出了一种新颖的基于图的 EEG 表征学习方法,称为梯度对齐(GEEGA),它利用多域信息来学习 EEG 表征……
为什么现代 language models 在进行 next-word prediction 训练后,似乎能够生成连贯的文档并捕捉长程结构?在这里我们展示……
用于代码的大型语言模型(LLM4Code)显著提升了开发者的生产力,但也因依赖开源仓库而引发了隐私担忧……
未来的 AI 系统可能在评估期间隐藏其能力(“sandbagging”),从而误导开发者和审计员。我们对 sandbag...进行压力测试。