Source

arXiv

4662 posts from this source

排序:

2个月前 · ai · - · -

[Paper] T3D：通过轨迹自蒸馏与直接判别优化实现少步 Diffusion 语言模型

Diffusion large language models (DLLMs) 有潜力通过并行解码多个 token 来实现快速文本生成。然而，在实践中，它们的 i...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 像科学家一样思考：物理引导的 LLM Agent 用于方程发现

通过 symbolic, interpretable formulas 解释观测到的现象是科学的根本目标。最近，large language models (LLMs) 已经出现作为…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 关于带投影噪声的朗之万动力学的隐式正则化

我们研究噪声投影到等距群作用的正交方向上的 Langevin dynamics。引入此数学模型是为了提供新的 …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] “抱歉，我没听清”：语音模型如何错过最重要的内容

尽管 speech recognition systems 在 standard benchmarks 上实现了低 word error rates，但它们在实际部署中的短小、高风险 utterances 往往会失败。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] Moonshine v2：Ergodic Streaming Encoder ASR 用于对延迟敏感的语音应用

延迟敏感的语音应用（例如实时转录、语音指令和实时翻译）需要低的 time-to-first-token (TTFT) 和高的 transc...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

【论文】Olmix：在语言模型开发全过程中的数据混合框架

数据混合——确定来自不同领域的数据比例——是训练语言模型（LMs）的首要关注点。虽然现有的混合方法……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 检测检索增强生成中压缩令牌表示的溢出

高效的长上下文处理仍然是当代大型语言模型（LLMs）的关键挑战，尤其在资源受限的环境中。因此……

#token compression #retrieval-augmented generation #overflow detection #LLM #NLP
2个月前 · ai · - · -

[Paper] 面向 On-Policy SFT：分布判别理论及其在 LLM 训练中的应用

监督微调（SFT）在计算上高效，但相比强化学习（RL）通常会导致较差的泛化能力。这一差距主要是…

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] DeepGen 1.0：轻量化统一多模态模型，推动图像生成与编辑

当前用于图像生成和编辑的统一多模态模型通常依赖于大规模参数（例如 >10B），导致训练成本高昂……

#multimodal-model #image-generation #diffusion-transformer #deep-learning #computer-vision
2个月前 · ai · - · -

[论文] 视觉推理基准：评估多模态 LLM 在小学课堂真实视觉问题上的表现

AI模型在文本推理方面已经取得了state-of-the-art的成果；然而，它们在对空间和关系结构进行推理的能力仍然是一个关键的……

#research #paper #ai #machine-learning #nlp
2个月前 · software · - · -

[Paper] 使用大语言模型进行IoT网络未知攻击检测：一种鲁棒且数据高效的方法

网络攻击的快速演变持续推动未知（zero-day）威胁的出现，对网络入侵检测构成了重大挑战。

#research #paper #software
2个月前 · ai · - · -

[Paper] TexSpot：3D 纹理增强与空间均匀点潜在表示

高质量的3D纹理生成仍然是一个根本性的挑战，因为当前主流的 multi-view diffusion pipelines 所固有的视角不一致性。...

#research #paper #ai #computer-vision
2个月前 · devops · - · -

[论文] OServe：通过时空工作负载编排加速 LLM 服务

为大型语言模型（LLMs）提供服务可以通过在多个设备上并行化模型本身和输入请求而获得巨大的收益，但传入的工作负载……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 关于在开源 Android 与 iOS 开发中采用 AI Coding Agents

AI coding agents 正日益为软件开发做出贡献，但它们对移动开发的影响却很少得到实证关注。在这…

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] PPTAM$η$: 能源感知 CI/CD 流水线用于基于容器的应用

现代基于容器的微服务通过快速部署周期不断演进，但 CI/CD 流水线仍很少衡量能耗，尽管已有先前的研究……

#research #paper #software
2个月前 · software · - · -

[Paper] Performance Antipatterns：天使还是恶魔？功耗

已知 Performance antipatterns 会降低 microservice-based systems 的响应性，但它们对 energy consumption 的影响仍然大多未被探索。

#research #paper #software
2个月前 · ai · - · -

[Paper] ModelWisdom：一个用于 TLA+ 模型可视化、摘要与修复的综合工具包

TLA+ 中的模型检查提供了强大的正确性保证，但从业者在解释 counterexamples 时仍然面临重大挑战，unders...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] PrefillShare：在多 LLM 分离式服务中实现 KV 重用的共享 Prefill 模块

多智能体系统正日益协调多个专门的语言模型来解决复杂的现实问题，通常在共享的上下文中调用它们……

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 通过手动和自动代码审查推荐的质量改进研究

已经提出了几种基于深度学习（DL）的技术来自动化代码审查。然而，目前尚不清楚这些方法在推荐方面的有效程度……

#research #paper #software
2个月前 · software · - · -

[论文] 通过小型语言模型作为评审提升代码生成

大型语言模型（LLMs）在自动代码生成方面表现出卓越的能力。虽然在主流语言上效果显著，但在……方面可能表现不佳。

#research #paper #software
2个月前 · ai · - · -

[Paper] MUSE：多租户模型服务与无缝模型更新

在 binary classification 系统中，decision thresholds 将 model scores 转换为 actions。选择合适的 thresholds 依赖于 t 的具体分布……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[论文] 设计可扩展的 Rate Limiting 系统：算法、架构与分布式解决方案

在分布式系统中，设计一个同时具备准确性、可用性和可扩展性的 rate limiter 是一个根本性的挑战，主要原因是……

#rate limiting #redis #distributed systems #sliding window algorithm #scalability
2个月前 · ai · - · -

[Paper] 基于 LoRA 的参数高效 LLM 用于边缘恶意软件检测的持续学习

边缘设备的激增迫切需要能够在严格的计算约束下实时检测恶意软件的安全解决方案。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 预测性联想记忆：通过时间共现实现超越相似性的检索

当前对神经系统中记忆的研究方法依赖于基于相似性的检索：给定一个 query，找到最具表征相似性的存储状态。这…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SurfPhase：稀疏视频中的两相流 3D 界面动力学

两相流中的界面动力学支配动量、热和质量传递，但在实验上仍然难以测量。传统技术面临……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] YOR：用于通用机器人技术的您的专属移动机械臂

近期在机器人学习方面的进展引起了人们对能够最终接近人类水平能力的平台的极大兴趣。这种兴趣，c...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 数据重复胜过数据规模化在 Long‑CoT 监督微调中

在 chain-of-thought 数据上进行 Supervised fine-tuning (SFT) 是推理语言模型的关键后训练步骤。标准的机器学习直觉表明…

#chain-of-thought #fine-tuning #large language models #data efficiency
2个月前 · ai · - · -

[Paper] SCRAPL：用于机器学习的随机路径散射变换

欧氏距离在小波散射变换系数（称为路径）之间提供了用于感知质量评估的有信息的梯度……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] GENIUS：生成式流体智力评估套件

统一多模态模型（UMMs）在视觉生成方面取得了显著进展。然而，现有基准主要评估结晶智力，……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] LCIP：Loss-Controlled 逆投影高维图像数据

投影（或降维）方法 P 旨在将高维数据映射到通常的二维散点图，以进行可视化探索。逆投影方法…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] TabICLv2：更好、更快、可扩展且开放的表格基础模型

表格基础模型，例如 TabPFNv2 和 TabICL，最近在预测基准中取代了梯度提升树，展示了……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 权重衰减提升语言模型可塑性

在大型语言模型（LLM）开发中，主流范式是先对基础模型进行预训练，然后进行进一步的训练以提升性能和模型……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 恰逢其时：Token-Level Early Stopping for Diffusion Language Models

扩散语言模型通过迭代细化生成文本，这一过程通常计算效率低下，因为许多标记在达到稳定状态后……

#research #paper #ai #machine-learning #nlp
2个月前 · devops · - · -

[Paper] Min‑Sum 均匀覆盖问题（自主移动机器人）

我们研究在给定的有限线段以及具有有限正半径的圆上，对 n 台移动机器人群的 min-sum uniform coverage problem，其中……

#research #paper #devops
2个月前 · ai · - · -

[论文] PhyCritic：用于物理 AI 的多模态批评模型

随着大型多模态模型的快速发展，可靠的judge和critic模型已成为开放式评估和preference alignment的关键。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 学习组合用于跨领域 Agentic 工作流生成

自动生成 agentic 工作流——可执行的 operator 图或代码，用于编排推理、验证和修复——已成为一种实用的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] TEGRA：文本编码与图和检索增强用于误信息检测

误信息检测是一项关键任务，能够显著受益于外部知识的整合，就像人工事实核查一样。在本...

#research #paper #ai #nlp
2个月前 · ai · - · -

[论文] FastFlow：通过Bandit推断加速生成流匹配模型

Flow-matching 模型在图像和视频生成方面提供了最先进的保真度，但其固有的顺序去噪过程使其速度较慢。Existin...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 推理模型的安全恢复仅需几步早期引导

基于强化学习（RL）的后训练用于显式链式思考（例如 GRPO）提升了多模态大规模推理模型的推理能力。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[论文] Large Language Models 能让每个人都快乐吗？

大型语言模型（LLMs）中的错位指的是未能同时满足安全、价值和文化维度的要求，导致模型产生偏离预期的行为。

#large language models #misalignment #benchmark #AI safety #NLP
2个月前 · ai · - · -

[Paper] 首届国际 StepUP 脚步生物特征识别竞赛：方法、结果与剩余挑战

Biometric footstep recognition，基于人们在行走时脚下独特的压力模式，是一个新兴领域，应用正日益增长……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] SteuerLLM：本地专用大型语言模型用于德国税法分析

大型语言模型（LLMs）展示了强大的通用推理和语言理解能力，但在受严格形式约束的领域中，它们的性能会下降。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] PuriLight：一种轻量级 Shuffle 与 Purification 框架用于单目深度估计

我们提出了 PuriLight，一个轻量且高效的框架，用于自监督单目深度估计，以应对计算效率方面的双重挑战……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 交互式 LLM 辅助的课程学习用于多任务进化策略搜索

多任务策略搜索是一个具有挑战性的问题，因为策略需要在训练案例之外进行泛化。课程学习已被证明是有效的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] PELLI：框架用于有效集成LLMs以实现高质量软件生成

最近的研究表明，当 LLMs 被适当地提示和配置时，它们表现出混合的结果。这类结果往往能够达到或超过 baseline...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] VulReaD：基于知识图谱的软件漏洞推理与检测

软件漏洞检测（SVD）是现代系统中的关键挑战。大型语言模型（LLMs）提供自然语言解释以及预…

#research #paper #ai #machine-learning
2个月前 · software · - · -

[论文] LLMware 生态系统中的隐藏许可风险

大型语言模型（LLMs）正日益被集成到软件系统中，催生了一类新系统，称为 LLMware。超越传统……

#research #paper #software
2个月前 · ai · - · -

[Paper] ISD-Agent-Bench：用于评估基于LLM的教学设计代理的综合基准

大型语言模型（LLM）代理在自动化教学系统设计（ISD）方面展现出有希望的潜力，教学系统设计是一种系统化的教育开发方法……

#research #paper #ai #nlp

Newer posts

Older posts