[Paper] StretchTime: 自适应时间序列预测 via 辛注意力
Transformer 架构已经在时间序列预测中建立了强基准,但它们通常依赖于假设均匀、ind…的位置信息编码。
3122 posts from this source
Transformer 架构已经在时间序列预测中建立了强基准,但它们通常依赖于假设均匀、ind…的位置信息编码。
虽然世界模型已经成为具身智能的基石,通过使代理能够基于动作条件的预测来推理环境动力学……
回归神经网络(NNs)通常通过最小化 mean squared prediction error 来进行训练,而该误差对异常值和数据污染高度敏感,……
像 MIT、Apache-2.0 和 BSD-3-Clause 这样的宽松许可证主导了开源 AI,表明模型、数据集和代码等制品可以自由使用,……
安全关键的应用,如自动驾驶汽车和工业物联网,正在采用使用深度神经网络的语义通信(SemCom)系统,以 redu...
基于LLM的工具正以快速的速度自动化更多的软件开发任务,但目前没有严格的方法来评估不同架构选择——...
现代深度神经网络(DNN)应用将多个 DNN 模型集成到推理流水线中,以满足定制任务的严格延迟要求。T...
本文研究了将多模态 Genetic Algorithm 与 Graph Neural Network 相结合对课程表优化的影响。Graph Neural Net……
张量是当今人工智能(AI)系统中最基础且最关键的数据结构。张量的自然属性,尤其是 memory-c...
Federated learning(FL)是一种去中心化学习范式,已在资源受限的Internet of Things(IoT)环境中得到广泛采用。这些设备,典型……
今天的 LLM(预)训练和研究工作流通常会将大量计算资源分配给大规模消融研究。尽管有相当的 c...
Compute Express Link (CXL) 3.0 及以后版本允许集群的计算节点通过硬件缓存一致性共享数据,并且在缓存行粒度上进行共享。
在 GPU 加速的数据分析中,当数据规模超出 GPU 内存容量时,CPU 到 GPU 的数据传输开销会成为性能瓶颈。
欧洲防务局修订的能力发展计划(Capability Development Plan,CDP)将提升地面作战能力、加强士兵装备列为优先事项。
大型语言模型面临一种新兴且关键的威胁,称为延迟攻击。由于 LLM 推理本身成本高昂,即使是适度的减速也可能 tr...
Adaptive learning systems 根据 performance metrics 优化内容传递,但忽视了 neurodivergent 所特有的 dynamic attention fluctuations。
在边缘设备上部署视觉语言模型(VLMs)面临资源受限以及在分布漂移下性能下降的挑战。虽然测试-...
规划已成为当代智能体系统在处理复杂、长时程任务时的核心能力,然而现有方法主要依赖于……
Chain-of-Thought 推理被广泛用于提升多模态大语言模型 (MLLMs) 的可解释性,然而生成的推理的忠实性……
尽管最先进的 LLM 能够解决数学问题,但我们发现它们在混合表示法的数值比较上会出错:“Which is larger, 5.7 times …”。
预测编码(PC)是一种在生物学上可行的替代标准反向传播(BP)的方法,它通过最小化相对于网络激活的能量函数来……
确保大型、异质水分配系统(WDS)的微生物安全通常需要管理适当水平的消毒剂残留……
多模态大型语言模型(MLLMs)已经快速发展,但它们在医学中的应用仍受限于领域覆盖、模态对齐等方面的差距,...
现有用于分析神经网络激活的方法,如 PCA 和稀疏自编码器,依赖于强结构假设。生成模型提供……