[Paper] ShapeCond:快速Shapelet引导的Dataset Condensation用于时间序列分类
时间序列数据支持许多领域(例如金融和气候科学),但其快速增长给存储和计算带来压力。Dataset condensation 可以缓解……
4663 posts from this source
时间序列数据支持许多领域(例如金融和气候科学),但其快速增长给存储和计算带来压力。Dataset condensation 可以缓解……
我们通过神经复形的紧支撑 Moore 复形来研究 ample groupoids 的同调。设 (A) 为一个拓扑阿贝尔群。对于 (n ge 0),设 (C_n(mathcal G;A)) ……
隐私是一项维系患者-提供者信任的人权。临床记录捕捉患者的私人脆弱性和个体性,这些被用于...
Computer-use agents (CUAs) 在过去一年取得了巨大的进展,但它们仍然经常产生偏离用户原始意图的误对齐行为。
我们提出了下一概念预测(Next Concept Prediction,NCP),一种建立在下一标记预测(Next Token Prediction,NTP)之上的生成式预训练范式。NCP 预测离散概念,...
Transformer 架构已经在时间序列预测中建立了强基准,但它们通常依赖于假设均匀、ind…的位置信息编码。
虽然世界模型已经成为具身智能的基石,通过使代理能够基于动作条件的预测来推理环境动力学……
回归神经网络(NNs)通常通过最小化 mean squared prediction error 来进行训练,而该误差对异常值和数据污染高度敏感,……
像 MIT、Apache-2.0 和 BSD-3-Clause 这样的宽松许可证主导了开源 AI,表明模型、数据集和代码等制品可以自由使用,……
安全关键的应用,如自动驾驶汽车和工业物联网,正在采用使用深度神经网络的语义通信(SemCom)系统,以 redu...
基于LLM的工具正以快速的速度自动化更多的软件开发任务,但目前没有严格的方法来评估不同架构选择——...
现代深度神经网络(DNN)应用将多个 DNN 模型集成到推理流水线中,以满足定制任务的严格延迟要求。T...
本文研究了将多模态 Genetic Algorithm 与 Graph Neural Network 相结合对课程表优化的影响。Graph Neural Net……
张量是当今人工智能(AI)系统中最基础且最关键的数据结构。张量的自然属性,尤其是 memory-c...
Federated learning(FL)是一种去中心化学习范式,已在资源受限的Internet of Things(IoT)环境中得到广泛采用。这些设备,典型……
今天的 LLM(预)训练和研究工作流通常会将大量计算资源分配给大规模消融研究。尽管有相当的 c...
Compute Express Link (CXL) 3.0 及以后版本允许集群的计算节点通过硬件缓存一致性共享数据,并且在缓存行粒度上进行共享。
在 GPU 加速的数据分析中,当数据规模超出 GPU 内存容量时,CPU 到 GPU 的数据传输开销会成为性能瓶颈。
欧洲防务局修订的能力发展计划(Capability Development Plan,CDP)将提升地面作战能力、加强士兵装备列为优先事项。
大型语言模型面临一种新兴且关键的威胁,称为延迟攻击。由于 LLM 推理本身成本高昂,即使是适度的减速也可能 tr...
Adaptive learning systems 根据 performance metrics 优化内容传递,但忽视了 neurodivergent 所特有的 dynamic attention fluctuations。
在边缘设备上部署视觉语言模型(VLMs)面临资源受限以及在分布漂移下性能下降的挑战。虽然测试-...
规划已成为当代智能体系统在处理复杂、长时程任务时的核心能力,然而现有方法主要依赖于……
Chain-of-Thought 推理被广泛用于提升多模态大语言模型 (MLLMs) 的可解释性,然而生成的推理的忠实性……
尽管最先进的 LLM 能够解决数学问题,但我们发现它们在混合表示法的数值比较上会出错:“Which is larger, 5.7 times …”。
预测编码(PC)是一种在生物学上可行的替代标准反向传播(BP)的方法,它通过最小化相对于网络激活的能量函数来……
确保大型、异质水分配系统(WDS)的微生物安全通常需要管理适当水平的消毒剂残留……
多模态大型语言模型(MLLMs)已经快速发展,但它们在医学中的应用仍受限于领域覆盖、模态对齐等方面的差距,...
现有用于分析神经网络激活的方法,如 PCA 和稀疏自编码器,依赖于强结构假设。生成模型提供……
大型推理模型通过扩展推理时的 chain-of-thought 实现了强大的性能,但这种范式面临二次成本、上下文长度限制……
AI 代理能预测它们在任务上是否会成功吗?我们通过在任务的前期、进行中和结束后获取成功概率估计来研究 agentic uncertainty。
本文提出了针对主动磁悬浮系统的数据驱动最优导数反馈控制器的设计与实现。一个直接的,mod...
Tokenization 是神经语言建模在形态丰富语言(MRLs)如土耳其语中的关键设计选择,因为该语言具有高度的生产性黏着构词。
学习既在语义上有意义又在不同运行之间保持稳定的无监督表征仍然是现代表征学习中的核心挑战。
深度神经网络的分类性能在很大程度上依赖于获取大规模、准确标注的数据集。然而,在医学影像领域,获取……
真实的 sound propagation 对于虚拟场景的沉浸感至关重要,然而物理上精确的 wave-based simulations 在计算上仍然难以承受……
通用 AI 架构能否超越预测,去发现支配宇宙的物理定律?真正的智能依赖于 “world models” —— ca...
视觉大语言模型(VLLMs)的视觉能力一直落后于其语言能力。尤其是,许多基准测试…
完全无监督的 segmentation pipelines 天真地寻找最显著的对象(如果存在的话)。因此,文献中报告的大多数方法……
贝叶斯最优实验设计(BOED)旨在最大化实验的期望信息增益(EIG)。这需要对似然进行估计,...
用于文本到图像生成的多模态扩散变换器(MMDiTs)保持独立的文本和图像分支,并在它们之间实现双向信息流……
Transformer 架构的平滑性已在泛化、训练稳定性和对抗鲁棒性方面得到广泛研究。Ho...
虽然 large-scale text-to-image diffusion models 在 visual quality 上持续提升,但它们日益增长的规模扩大了 state-of-the-art 模式之间的差距。
大型语言模型(LLMs)在生成代码时常会出现细微但关键的错误,尤其是在处理复杂任务时。现有的自动修复方法通常依赖于…
教学视频编辑仅使用文本提示对输入视频进行编辑,实现直观的自然语言控制。尽管进展迅速,大多数 m...
我们研究了大语言模型(LLMs)在多目标对齐中的一种持续性失效模式:训练仅在部分目标上提升性能……
多轮 jailbreak 捕捉了安全对齐聊天机器人的真实威胁模型,其中单轮攻击仅是一个特例。然而现有方法 br...
认知科学中的一个核心问题是,概念表征是汇聚到共享的流形以支持泛化,还是分散成正交的……