Source

arXiv

4576 posts from this source

排序:

19小时前 · ai · - · -

[Paper] 递归多智能体系统

递归或循环语言模型最近作为一种新的扩展轴出现，通过在潜在状态上迭代细化相同的模型计算来加深 …

#research #paper #ai #machine-learning #nlp
19小时前 · ai · - · -

[Paper] DV-World：真实场景下的数据可视化代理基准测试

现实世界的数据可视化（DV）需要本土环境的落地、跨平台的演进以及主动的意图对齐。然而，现有的基准 o...

#research #paper #ai #nlp
19小时前 · ai · - · -

[Paper] 模型应多快投入监督？在 Tsallis 损失连续体上训练推理模型

在仅有输出级监督的后训练阶段，将推理模型适配到新任务时，会在可验证奖励的强化学习（RLVR）下停滞。

#research #paper #ai #machine-learning
19小时前 · ai · - · -

[论文] Teacher Forcing 作为广义贝叶斯：混沌动力学中切换代理的优化几何不匹配

身份教师强制（ITF）能够实现对混沌动力系统的确定性递归代理模型的稳定训练，并且在动力学方面表现出极高的有效性。

#research #paper #ai #machine-learning
19小时前 · ai · - · -

[Paper] 面向自然语言语义的函数式几何代数

分布式和神经方法在自然语言语义学中几乎完全建立在传统线性代数之上：vectors, matrices, tensors……

#research #paper #ai #machine-learning #nlp
19小时前 · devops · - · -

[Paper] Pythia: 面向可预测性驱动的Agent原生LLM服务

随着 LLM 应用变得日益复杂，开发者越来越多地采用 multi-agent architectures，将工作流分解为专门的、协作的…

#research #paper #devops
19小时前 · ai · - · -

[Paper] TSN-Affinity：相似度驱动的参数复用用于持续离线强化学习

持续离线强化学习（CORL）旨在从随时间收集的数据集中学习一系列任务，同时保持对先前任务的性能……

#research #paper #ai #machine-learning
19小时前 · ai · - · -

[Paper] 多模态不确定性下稳健灵巧抓取的变分神经信念参数化

接触变异性、感知不确定性和外部扰动使抓取执行具有随机性。期望质量目标忽略尾部结果，且常常 …

#research #paper #ai #machine-learning
19小时前 · ai · - · -

[论文] RLHF 注释的三种模型：扩展、证据与权威

基于偏好的对齐方法，最突出的是人类反馈强化学习（Reinforcement Learning with Human Feedback，RLHF），利用人类标注者的判断来塑造大型语言模型……

#research #paper #ai #machine-learning #nlp
19小时前 · ai · - · -

[Paper] 条件性错位：常见干预可能将新出现的错位隐藏在情境触发因素之后

对语言模型进行微调可能导致出现性错位（EM）[Betley et al., 2025b]。在狭窄的 misaligned behavior genera 分布上训练的模型……

#research #paper #ai #machine-learning
19小时前 · ai · - · -

[Paper] 鲁棒Deepfake检测：通过校准的互补集成缓解空间注意力漂移

当前的 deepfake 检测模型在干净的学术数据集上实现了 state-of-the-art 性能，但在真实世界中会出现严重的 spatial attention drift。

#research #paper #ai #computer-vision
19小时前 · ai · - · -

[Paper] 不让行人掉队：用于自适应交通信号控制的脆弱道路使用者实时检测与跟踪

当前的人行横道信号采用固定时序，未根据行人行为进行调整，这可能会使易受伤害的道路使用者（VRUs）如……

#research #paper #ai #machine-learning #computer-vision
19小时前 · ai · - · -

[Paper] 可解释人工智能用于喷流标记：在 Lund Jet Plane 上的 GNNExplainer、GNNShap 与 GradCAM 的比较研究

图神经网络（如 ParticleNet）和基于点云的 transformer 网络（如 ParticleTransformer）在 jet 上实现了最先进的性能。

#research #paper #ai #machine-learning
19小时前 · ai · - · -

[Paper] QCalEval：针对量子校准图理解的视觉语言模型基准测试

量子计算校准依赖于对实验数据的解释，而校准图提供了最通用的人类可读表示……

#research #paper #ai #computer-vision
20小时前 · software · - · -

[Paper] 从线程到轨迹：一个多LLM管道用于从GitHub Issue讨论中提取社区知识

在大规模开源软件（OSS）项目中解决复杂的后期制作问题需要大量的认知努力，因为开发者需要……

#research #paper #software
20小时前 · ai · - · -

[Paper] 当错误可能有益时：Policy Gradient的非完美奖励分类

通过 reinforcement learning 训练语言模型通常依赖于不完美的 proxy rewards，因为能够精确定义预期行为的 ground truth rewards 并不存在……

#research #paper #ai #machine-learning
20小时前 · ai · - · -

[论文] 从句法到情感：对LLMs情感推断的机制分析

大型语言模型（LLMs）正越来越多地用于情感敏感的人机交互应用，但对于情感识别在内部是如何实现的知之甚少。

#research #paper #ai #nlp
20小时前 · ai · - · -

[Paper] RESTestBench：用于评估 LLM 生成的 REST API 测试用例在自然语言需求下有效性的基准

现有的 REST API 测试工具通常使用 code coverage 和 crash-based fault metrics 进行评估。然而，最近基于 LLM 的方法越来越多地生成…

#research #paper #ai #machine-learning
20小时前 · ai · - · -

[Paper] Luminol-AIDetect：基于困惑度的文本洗牌下快速零样本机器生成文本检测

机器生成文本（MGT）检测需要在不同生成模型之间识别结构上不变的信号，而不是依赖于特定模型的指纹……

#research #paper #ai #machine-learning #nlp
20小时前 · ai · - · -

[论文] SIEVES：选择性预测通过视觉证据评分实现泛化

多模态大语言模型（MLLMs）在视觉语言任务上取得了越来越强的性能。即使传统的视觉问答基准……

#research #paper #ai #machine-learning #computer-vision
20小时前 · ai · - · -

[论文] G-Loss：图引导的语言模型微调

传统的损失函数，包括 cross-entropy、contrastive、triplet 和 supervised contrastive 损失，用于微调预训练语言模型……

#research #paper #ai #machine-learning #nlp
20小时前 · ai · - · -

[Paper] PSI-Bench：面向临床基础且可解释的抑郁患者模拟器评估

Patient simulators 正在 mental health training 中获得关注，因为它们提供了对复杂且敏感的 patient interactions 的可扩展曝光。Simulating depre…

#research #paper #ai #machine-learning #nlp
20小时前 · software · - · -

[Paper] 社会身份在 software engineering 中重要吗？评估 research software engineers 的案例

社会身份是心理学中的一个概念，指的是个体身份中源自其群体成员资格的部分。在本文中，我们……

#research #paper #software
20小时前 · ai · - · -

[Paper] 互相强制：双模式自进化用于快速自回归音视频角色生成

在本工作中，我们提出了 Mutual Forcing，一种用于快速自回归音视频生成并实现长时域音视频同步的框架。我们的做法……

#research #paper #ai #computer-vision
20小时前 · ai · - · -

[Paper] 放大不变图像分类：基于域泛化与稳定稀疏嵌入签名

Magnification shift 是实现稳健的 histopathology 分类的主要障碍，因为在一种成像尺度上训练的模型往往在另一种尺度上泛化能力差……

#research #paper #ai #computer-vision
21小时前 · ai · - · -

[Paper] 指令-证据对比双流解码用于具象视觉语言推理

视觉语言模型（VLMs）在指令遵循和开放式视觉语言推理方面表现出色，但它们经常生成流畅的 ...

#research #paper #ai #computer-vision
21小时前 · software · - · -

[Paper] 关键开发者角色与组织耦合在Microservices中的纵向分析

基于微服务的系统带来了显著的组织协作挑战，然而个人开发者在塑造组织耦合方面的作用（...）。

#research #paper #software
21小时前 · ai · - · -

[Paper] 提升黑盒少样本知识蒸馏的多样性

Knowledge distillation (KD) 是一种广为人知的技术，能够在几乎不牺牲性能的情况下，将大型网络（teacher）有效压缩为更小的网络（student）……

#research #paper #ai #machine-learning #computer-vision
21小时前 · ai · - · -

[Paper] 多样化图像先验用于黑盒无数据知识蒸馏

知识蒸馏（KD）是将复杂教师网络的专业知识转移到高效学生模型中的关键机制。然而，在去中心化…

#research #paper #ai #machine-learning #computer-vision
21小时前 · ai · - · -

[Paper] Sketch2Arti: 基于草图的 CAD 对象关节建模

关节建模旨在推断3D对象的可移动部件及其运动参数，从而实现交互式动画、仿真和形状编辑。在……

#research #paper #ai #computer-vision
21小时前 · devops · - · -

[Paper] SpecFed：通过投机解码和压缩传输加速联邦 LLM 推理

Federated inference 通过对 distributed model predictions 进行 weighted averaging，提升了 edge computing 中 LLM 的性能。然而，autoregressive LLM inference …

#research #paper #devops
21小时前 · software · - · -

[论文] 基于场景的分布式机器人系统测试

我们提出了用于自动生成和执行系统级测试的 SCenario Specification Language（SCSL）。SCSL 针对复杂的分布式系统（例如……）。

#research #paper #software
22小时前 · ai · - · -

[Paper] SAFEdit：多代理分解能否解决指令式代码编辑的可靠性挑战？

指令式代码编辑是大型语言模型（LLMs）的一个重大挑战。在 EditBench 基准测试中，40 个评估模型中有 39 个实现了任务成功……

#research #paper #ai #machine-learning
22小时前 · ai · - · -

[Paper] 学习可泛化的多模态表示用于软件漏洞检测

源代码及其伴随的注释是互补且自然对齐的模态——代码编码结构逻辑，而注释捕捉开发者意图……

#research #paper #ai #machine-learning
23小时前 · devops · - · -

[论文] 两种高效的消息传递 Exclusive Scan 算法

并行扫描原语计算由 p 个连续排名的处理器贡献的输入向量的逐元素包含或排除前缀和，基于关联操作……

#research #paper #devops
1天前 · devops · - · -

[Paper] Volitional Multiagent Atomic Transactions: 描述人类及其机器

形式模型用于并发和分布式系统，描述的是机器；操作这些机器的人要么被忽略，要么被视为外部环境。然而 k...

#research #paper #devops
1天前 · devops · - · -

[Paper] 经济和生态影响：sector coupling 在计算集群中的应用

可再生能源的比重上升不可避免地增加了电力生产的波动性。sector coupling 的概念意味着波动...

#research #paper #devops
1天前 · ai · - · -

[论文] EvoTSC：通过遗传编程进化用于时间序列分类的特征学习模型

时间序列分类是跨多个领域的重要分析任务。然而，由于标签的稀缺，它的实际应用常常受到阻碍。

#research #paper #ai #machine-learning
1天前 · devops · - · -

[Paper] 动态计算环境中微服务的自适应管理：分类法与未来方向

基于微服务的云应用面临工作负载变化、请求路径演进、网络条件多变、干扰以及故障。这些动态 c...

#research #paper #devops
1天前 · devops · - · -

[Paper] CacheFlow：高效 LLM 服务与 3D 并行 KV 缓存恢复

KV 缓存恢复已成为在服务长上下文 LLM 工作负载时的主要瓶颈，包括多轮对话、检索增强生成……

#research #paper #devops
1天前 · ai · - · -

[Paper] Spark 策略工具包：语义合约与可扩展执行用于 Spark 中的策略学习

在 Spark 中，自定义 policy-learning 流水线因两个耦合系统的原因而失败：逐行 Python 执行使推断变得不切实际，以及 driver-side 候选 …

#research #paper #ai #machine-learning
1天前 · ai · - · -

[论文] 6G 时代的万物互联：范式、驱动因素、潜力与未来方向

万物互联 (IoE) 代表了物联网 (IoT) 的演进，通过将人、数据、流程和事物整合到一个统一的智能体系中……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 种群规模对 BEAGLE GPU 基于遗传编程运行性能的影响

Beagle framework 通过 GPU-based Genetic Programming，实现了先前因 CPU 限制而在实际时间范围内无法实现的人口动态。

#research #paper #ai
1天前 · ai · - · -

[Paper] Tuna-2：Pixel Embeddings 胜过 Vision Encoders，实现多模态理解与生成

统一的多模态模型通常依赖预训练的视觉编码器，并为理解和生成使用不同的视觉表征，从而导致误…

#research #paper #ai #computer-vision
1天前 · ai · - · -

[Paper] World‑R1：强化 3D 约束用于文本到视频生成

近期的 video foundation models 展示了令人印象深刻的 visual synthesis，但常常出现 geometric inconsistencies。虽然现有方法尝试…

#research #paper #ai #computer-vision
1天前 · ai · - · -

[论文] OmniShotCut：全局关系式镜头边界检测与 Shot-Query Transformer

Shot Boundary Detection（SBD）旨在自动识别镜头切换并将视频划分为连贯的镜头。虽然SBD在文献中被广泛研究……

#research #paper #ai #computer-vision
1天前 · ai · - · -

[Paper] 基于模式的知识组件的学生代码提交个性化示例生成

Adaptive programming practice 通常依赖于 fixed libraries 的 worked examples 和 practice problems，这需要大量的创作工作，并且可能无法…

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 多类和列表学习的最优样本复杂度

虽然 binary classification 在 VC dimension 下的最优 sample complexity 已经得到充分确立，但确定 multiclass classification 的最优 sample complexity …

#research #paper #ai #machine-learning

Newer posts

Older posts