[Paper] MobileI2V:在移动设备上实现快速且高分辨率的图像到视频转换
最近,视频生成取得了快速进展,越来越多的关注集中在移动设备上的图像到视频(I2V)合成上。然而,子...
最近,视频生成取得了快速进展,越来越多的关注集中在移动设备上的图像到视频(I2V)合成上。然而,子...
可读性评估旨在评估文本的阅读难度。近年来,深度学习技术已逐步应用于可读性……
空间认知是现实世界多模态智能的基础,使模型能够有效地与物理环境交互。虽然多模态 ...
我们研究两层神经网络,并使用一种基于粒子的算法——共识优化(CBO)进行训练。我们比较了 CBO 在……方面的表现。
It looks like the text you’d like translated is incomplete. Could you please provide the full passage (including the “> **Source:** …” line at the top) so I can translate it accurately while preserving the required formatting?
大规模专家混合(Mixture of Experts,MoE)模型的训练面临着由于动态 token 路由导致的严重负载不平衡而产生的关键内存瓶颈。Thi...
遥感变化描述是一个新兴且受欢迎的研究任务,旨在用自然语言描述已发生变化的感兴趣内容……
文本属性图需要模型能够有效地将强大的文本理解与结构化推理相结合。现有方法要么依赖 …
深度神经网络(DNN)和 Kolmogorov‑Arnold 网络(KAN)因其灵活性和表达能力而成为函数逼近的热门方法。然而……
在标准 Transformer(TF)架构中,刚性且统一的计算分配可能限制其效率和可扩展性,尤其是在大规模……
最近的分而治之推理方法,尤其是基于思路链(Chain-of-Thought,CoT)的方式,显著提升了 Text-to-SQL 的能力……
Lindsey(2025)通过四项实验研究语言模型的内省意识,发现模型有时能够检测并识别注入的……