Source

arXiv

4663 posts from this source

排序:

2个月前 · ai · - · -

[Paper] ShapeCond：快速Shapelet引导的Dataset Condensation用于时间序列分类

时间序列数据支持许多领域（例如金融和气候科学），但其快速增长给存储和计算带来压力。Dataset condensation 可以缓解……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 群体同调的通用系数定理与 Mayer-Vietoris 序列

我们通过神经复形的紧支撑 Moore 复形来研究 ample groupoids 的同调。设 (A) 为一个拓扑阿贝尔群。对于 (n ge 0)，设 (C_n(mathcal G;A)) ……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 去标识化悖论：在大语言模型时代对 HIPAA Safe Harbour 的批评

隐私是一项维系患者-提供者信任的人权。临床记录捕捉患者的私人脆弱性和个体性，这些被用于...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 当行动偏离任务时：检测并纠正 Computer-Use Agents 中的不匹配行动

Computer-use agents (CUAs) 在过去一年取得了巨大的进展，但它们仍然经常产生偏离用户原始意图的误对齐行为。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 在离散潜在空间中的下一个概念预测导致更强的语言模型

我们提出了下一概念预测（Next Concept Prediction，NCP），一种建立在下一标记预测（Next Token Prediction，NTP）之上的生成式预训练范式。NCP 预测离散概念，...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] StretchTime: 自适应时间序列预测 via 辛注意力

Transformer 架构已经在时间序列预测中建立了强基准，但它们通常依赖于假设均匀、ind…的位置信息编码。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] WorldArena：一个统一的基准，用于评估具身世界模型的感知与功能效用

虽然世界模型已经成为具身智能的基石，通过使代理能够基于动作条件的预测来推理环境动力学……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 使用 $β$-divergences 的可证明鲁棒回归神经网络学习

回归神经网络（NNs）通常通过最小化 mean squared prediction error 来进行训练，而该误差对异常值和数据污染高度敏感，……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Open AI 供应链中的 Permissive-Washing：许可证完整性的大规模审计

像 MIT、Apache-2.0 和 BSD-3-Clause 这样的宽松许可证主导了开源 AI，表明模型、数据集和代码等制品可以自由使用，……

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 验证基于 DNN 的语义通信对抗 Generative Adversarial Noise

安全关键的应用，如自动驾驶汽车和工业物联网，正在采用使用深度神经网络的语义通信（SemCom）系统，以 redu...

#research #paper #software
2个月前 · ai · - · -

[Paper] 驯服 Scylla：理解编码海域的多头代理守护进程

基于LLM的工具正以快速的速度自动化更多的软件开发任务，但目前没有严格的方法来评估不同架构选择——...

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] PARD：通过主动请求丢弃提升推理流水线的 Goodput

现代深度神经网络（DNN）应用将多个 DNN 模型集成到推理流水线中，以满足定制任务的严格延迟要求。T...

#research #paper #devops
2个月前 · ai · - · -

[Paper] 用图神经网络增强遗传算法：排课案例研究

本文研究了将多模态 Genetic Algorithm 与 Graph Neural Network 相结合对课程表优化的影响。Graph Neural Net……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] TreeTensor：使用受约束的树形张量提升嵌套数据上的 AI 系统

张量是当今人工智能（AI）系统中最基础且最关键的数据结构。张量的自然属性，尤其是 memory-c...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] RIFLE：鲁棒蒸馏式 FL 用于资源受限的物联网网络上的深度模型部署

Federated learning（FL）是一种去中心化学习范式，已在资源受限的Internet of Things（IoT）环境中得到广泛采用。这些设备，典型……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

【论文】Modalities：一个 PyTorch 原生框架，用于大规模 LLM 训练与研究

今天的 LLM（预）训练和研究工作流通常会将大量计算资源分配给大规模消融研究。尽管有相当的 c...

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[论文] 面向 CXL 的 CPU 故障弹性

Compute Express Link (CXL) 3.0 及以后版本允许集群的计算节点通过硬件缓存一致性共享数据，并且在缓存行粒度上进行共享。

#research #paper #devops
2个月前 · devops · - · -

[Paper] ZipFlow：一个基于编译器的框架，用于释放现代 GPU 的压缩数据传输

在 GPU 加速的数据分析中，当数据规模超出 GPU 内存容量时，CPU 到 GPU 的数据传输开销会成为性能瓶颈。

#research #paper #devops
2个月前 · ai · - · -

[Paper] CAPSARII 方法用于网络安全可穿戴、超低功耗网络传感器的士兵健康监测

欧洲防务局修订的能力发展计划（Capability Development Plan，CDP）将提升地面作战能力、加强士兵装备列为优先事项。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 重新思考延迟拒绝服务：攻击 LLM 服务框架，而非模型

大型语言模型面临一种新兴且关键的威胁，称为延迟攻击。由于 LLM 推理本身成本高昂，即使是适度的减速也可能 tr...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 协调注意力：为‘混乱’的 Neurodivergent 学习状态带来和谐

Adaptive learning systems 根据 performance metrics 优化内容传递，但忽视了 neurodivergent 所特有的 dynamic attention fluctuations。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] LQA：一种轻量化量化自适应框架用于边缘上的视觉语言模型

在边缘设备上部署视觉语言模型（VLMs）面临资源受限以及在分布漂移下性能下降的挑战。虽然测试-...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] TodoEvolve：学习构建智能体规划系统

规划已成为当代智能体系统在处理复杂、长时程任务时的核心能力，然而现有方法主要依赖于……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] SPD-Faith Bench: 诊断并提升多模态大语言模型的 Chain-of-Thought 忠实性

Chain-of-Thought 推理被广泛用于提升多模态大语言模型 (MLLMs) 的可解释性，然而生成的推理的忠实性……

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

[论文] LLMs 对数字的了解超出它们能表达的程度

尽管最先进的 LLM 能够解决数学问题，但我们发现它们在混合表示法的数值比较上会出错：“Which is larger, 5.7 times …”。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 关于预测编码网络的无限宽度和深度极限

预测编码（PC）是一种在生物学上可行的替代标准反向传播（BP）的方法，它通过最小化相对于网络激活的能量函数来……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 通过 Surrogate-assisted Neuroevolution 优化供水系统中的氯化

确保大型、异质水分配系统（WDS）的微生物安全通常需要管理适当水平的消毒剂残留……

#research #paper #ai
2个月前 · ai · - · -

[Paper] MedMO：用于医学影像的多模态大型语言模型的定位与理解

多模态大型语言模型（MLLMs）已经快速发展，但它们在医学中的应用仍受限于领域覆盖、模态对齐等方面的差距，...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 学习 LLM 激活的生成式元模型

现有用于分析神经网络激活的方法，如 PCA 和稀疏自编码器，依赖于强结构假设。生成模型提供……

#LLM interpretability #diffusion models #activation steering #meta‑model research
2个月前 · ai · - · -

[Paper] InftyThink+: 有效且高效的无限时域推理通过强化学习

大型推理模型通过扩展推理时的 chain-of-thought 实现了强大的性能，但这种范式面临二次成本、上下文长度限制……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] Agentic 不确定性揭示 Agentic 过度自信

AI 代理能预测它们在任务上是否会成功吗？我们通过在任务的前期、进行中和结束后获取成功概率估计来研究 agentic uncertainty。

#agentic uncertainty #model calibration #confidence estimation #AI agents #benchmark
2个月前 · ai · - · -

[Paper] 主动磁悬浮系统的最优导数反馈控制：基于数据驱动方法的实验研究

本文提出了针对主动磁悬浮系统的数据驱动最优导数反馈控制器的设计与实现。一个直接的，mod...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 大规模最佳土耳其子词策略：数据、词汇与形态学相互作用的系统评估

Tokenization 是神经语言建模在形态丰富语言（MRLs）如土耳其语中的关键设计选择，因为该语言具有高度的生产性黏着构词。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 从核心到细节：无监督解耦与 Entropy-Ordered Flows

学习既在语义上有意义又在不同运行之间保持稳定的无监督表征仍然是现代表征学习中的核心挑战。

#normalizing flows #unsupervised disentanglement #entropy-ordered latent space #representation learning #generative models
2个月前 · ai · - · -

[Paper] 可靠的误标检测用于视频胶囊内镜数据

深度神经网络的分类性能在很大程度上依赖于获取大规模、准确标注的数据集。然而，在医学影像领域，获取……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 预计算声传播的互惠潜在场

真实的 sound propagation 对于虚拟场景的沉浸感至关重要，然而物理上精确的 wave-based simulations 在计算上仍然难以承受……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 从开普勒到牛顿：归纳偏置引导Transformer中的学习世界模型

通用 AI 架构能否超越预测，去发现支配宇宙的物理定律？真正的智能依赖于 “world models” —— ca...

#transformers #inductive bias #physics discovery #machine learning
2个月前 · ai · - · -

[Paper] 超越冗余的视角：任务复杂性在 VLLMs 中 Vision Token 专化中的作用

视觉大语言模型（VLLMs）的视觉能力一直落后于其语言能力。尤其是，许多基准测试…

#research #paper #ai #computer-vision
2个月前 · ai · - · -

【论文】PANC：先验感知 Normalized Cut 用于目标分割

完全无监督的 segmentation pipelines 天真地寻找最显著的对象（如果存在的话）。因此，文献中报告的大多数方法……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 超强化基于仿真的推断用于贝叶斯最优实验设计

贝叶斯最优实验设计（BOED）旨在最大化实验的期望信息增益（EIG）。这需要对似然进行估计，...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] Prompt Reinjection：缓解多模态 Diffusion Transformers 中的 Prompt Forgetting

用于文本到图像生成的多模态扩散变换器（MMDiTs）保持独立的文本和图像分支，并在它们之间实现双向信息流……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Vision Transformer 微调受益于非平滑组件

Transformer 架构的平滑性已在泛化、训练稳定性和对抗鲁棒性方面得到广泛研究。Ho...

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] NanoFLUX：蒸馏驱动的压缩大型文本到图像生成模型用于移动设备

虽然 large-scale text-to-image diffusion models 在 visual quality 上持续提升，但它们日益增长的规模扩大了 state-of-the-art 模式之间的差距。

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] TraceCoder：基于追踪的多智能体框架用于自动调试 LLM 生成的代码

大型语言模型（LLMs）在生成代码时常会出现细微但关键的错误，尤其是在处理复杂任务时。现有的自动修复方法通常依赖于…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] RFDM：残差流扩散模型用于高效因果视频编辑

教学视频编辑仅使用文本提示对输入视频进行编辑，实现直观的自然语言控制。尽管进展迅速，大多数 m...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 揭示多目标对齐中的跨目标干扰

我们研究了大语言模型（LLMs）在多目标对齐中的一种持续性失效模式：训练仅在部分目标上提升性能……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

【论文】SEMA：简单而有效的多轮越狱攻击学习

多轮 jailbreak 捕捉了安全对齐聊天机器人的真实威胁模型，其中单轮攻击仅是一个特例。然而现有方法 br...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 数的表征几何

认知科学中的一个核心问题是，概念表征是汇聚到共享的流形以支持泛化，还是分散成正交的……

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts