· ai
[Paper] 超越标签的思考:Vocabulary-Free 细粒度识别,基于 Reasoning-Augmented LMMs
Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下,区分元类内部视觉上相似的类别。Exi...
Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下,区分元类内部视觉上相似的类别。Exi...
高性能计算(HPC)工作负载正变得日益多样化,作业特征呈现出很大的变动性,然而集群调度仍然……
深度神经网络经常利用捷径。这些是与训练数据中的输出标签相关联的虚假线索,但与任务语义无关。
基于高性能计算(HPC)的模拟在天体物理学和宇宙学(A&C)中至关重要,帮助科学家研究和理解复杂的……
对项目(题目或任务)难度的准确估计对教育评估至关重要,但面临冷启动问题。虽然大型语言模型…
手写文本识别和光学字符识别解决方案在处理现代时代的数据时表现出色,但效率在 La... 时会下降。
我们研究了一个 Hopf 代数 Markov 链的动力学性质,其状态空间是带标签叶子的二叉根森林。这个 Markov 动力系统……
Mixture-of-Experts(MoE)已成为大规模语言模型(LLMs)中的主导架构,因为它能够通过稀疏专家激活来扩展模型容量……
记忆增强的脉冲神经网络(SNN)有望实现能效高的类脑计算,但它们在不同感官模态间的泛化仍未得到充分验证……
本文研究了可修复系统的双目标冗余分配问题(RAP),其目标定义为成本最小化和可用性最大化……
现代潜在扩散模型(LDM)通常在低层次的变分自编码器(VAE)潜在空间中运行,这些空间主要针对像素级的重建进行优化。
单目深度估计仍然具有挑战性,因为最近的基础模型,如 Depth Anything V2 (DA-V2),在处理与真实世界图像相差甚远的情况时表现不佳。