· ai · - · -
[Paper] 利用 Model Soups 对湄公河三角洲的非物质文化遗产图像进行分类
湄公河三角洲的非物质文化遗产(ICH)图像分类因标注数据有限、视觉相似度高等因素而面临独特的挑战……
湄公河三角洲的非物质文化遗产(ICH)图像分类因标注数据有限、视觉相似度高等因素而面临独特的挑战……
储层扩展可以在非线性混合下提升在线独立成分分析(ICA)的效果,但 top‑n 白化可能会丢弃注入的特征。我们正式…
Claude 代理技能的快速激增提出了一个核心问题:如何有效利用、管理和扩展代理技能生态系统。
基于指令的视频编辑取得了快速进展,但现有方法常常在精确的视觉控制方面遇到困难,因为自然语言本质上是……
低位注意力(如 SageAttention)已成为加速模型推理的有效方法,但其在训练中的适用性仍然较差……
检索增强生成(Retrieval‑Augmented Generation,RAG)系统通常采用检索融合技术,例如多查询检索和倒数排名融合(reciprocal rank fusion,RRF)来增加……
从与犯罪相关的文档中提取关键信息是执法机构的一项关键任务。命名实体识别 (NER) 可以执行……
强化学习与可验证奖励(RLVR)通过对大型语言模型(LLMs)进行优化,显著提升了它们的推理能力……
Scaling laws 假设在更多数据上训练的更大模型始终优于较小的模型——这一假设驱动了计算机视觉中的模型选择,但……
大型语言模型(LLMs)正日益被提出作为战略决策环境中的代理,但它们在结构化的地缘政治模拟中的行为仍然……
现代语言模型在有界上下文中进行推理,这一固有约束对长期推理构成了根本障碍。我们识别 recursion a...
Think-Answer 推理器(如 DeepSeek‑R1)通过利用可解释的内部推理取得了显著进展。然而,尽管经常出现……