· ai
[论文] LiteEmbed:适配 CLIP 到稀有类别
大规模视觉语言模型(如 CLIP)能够实现强大的零样本识别,但在预训练期间很少见到的类别上表现不佳,包括……
大规模视觉语言模型(如 CLIP)能够实现强大的零样本识别,但在预训练期间很少见到的类别上表现不佳,包括……
从单张图像估计物理上准确、simulation-ready 的服装具有挑战性,因为缺乏 image-to-physics 数据集,并且该问题是病态的 n...
表格基础模型(TFMs)最近在结构化数据上展示了强大的上下文学习能力,实现了与 t... 相媲美的零样本性能。
词义消歧(WSD)已广泛使用 WordNet、BabelNet 和 Oxford Dictionary of English 等语义框架进行评估。然而,对于...
文本到图像(T2I)模型日益流行,产生了大量在线的 AI 生成图像。为了比较模型质量,基于投票的排行榜……
虽然 GUI 代理在明确指令和完成指令下表现出强大的性能,但在实际部署中需要与用户更复杂的实现保持一致。
大规模优化是现代商业决策的关键支柱。然而,构建这些模型往往劳动密集型且耗时。我们…
Taxonomies 构成了跨多个领域的结构化知识表示的骨干,使得 e‑commerce catalogs、semantic search 等应用成为可能,…
高效地优化电池充电协议具有挑战性,因为每次评估都慢、成本高且不可微分。许多现有方法……
神经网络通常在高度过参数化的 regime 中进行训练,然而实证证据始终表明,许多参数在...期间会变得冗余。
Skild AI 正在构建通用机器人软件,刚刚完成了由 SoftBank 主导的 14亿美元融资轮……
实验性的机器人优化通常需要对每个候选策略进行数秒到数分钟的评估。所选择的评估时间会影响优化,因为...