research — Page 114

排序:

3个月前 · ai · - · -

[Paper] 通过跨层融合重建 KV 缓存以增强 Transformers

Transformer 解码器在各种任务中取得了强劲的结果，但 KV 缓存所需的内存在长序列长度下变得难以承受。虽然 …

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 基于指南的医学推理在 LLMs 中的训练与评估

机器学习在医学早期预测方面最近表现出突破性性能，然而，过于关注提升预测准确性导致了一个 …

#research #paper #ai #nlp
3个月前 · software · - · -

[Paper] 可运行目录：Monorepo vs. Multi-repo 辩论的解决方案

现代软件系统日益给传统的代码库组织策略带来压力。Monorepos 提供一致性，但往往面临可扩展性问题……

#research #paper #software
3个月前 · devops · - · -

[Paper] 关于 HPC 系统中能效分析的挑战：评估 Synthetic Benchmarks 与 Gromacs

本文讨论了在分析合成基准测试和 Gromacs 软件包在 Fritz 与 Alex HPC 系统上的能效时所遇到的挑战。

#research #paper #devops
3个月前 · devops · - · -

[Paper] 分布式量子计算与 Fan‑Out 操作及 Qudit：分布式全局门的案例（初步研究）

近年来，关于分布式量子计算的大量研究主要集中在纠缠对和分布式双量子比特门的使用上。但也有关于 ef… 的研究。

#research #paper #devops
3个月前 · devops · - · -

[Paper] FFTrainer：大语言模型训练中的快速故障切换与几乎免费状态管理

近期在大型语言模型（LLMs）方面的发展提出了对高效且稳健训练的新需求。随着LLM集群规模的扩大，节点故障、...

#research #paper #devops
3个月前 · software · - · -

[Paper] Sigmoid函数的形式分析与通用逼近定理的形式化证明

本文提出了对 sigmoid 函数的形式化分析，并在 Isabelle/HOL 中给出了 Universal Approximation Theorem (UAT) 的完整机械化证明，...

#research #paper #software
3个月前 · devops · - · -

[Paper] AutoPas 中分子动力学模拟的向量化参数调优

Molecular Dynamics simulations 可以帮助科学家在原子尺度上获取对物理过程的宝贵洞察。本工作探讨了各种技术……

#research #paper #devops
3个月前 · devops · - · -

[Paper] 双边缘辅助计算卸载与资源分配用于空间-空中-海洋集成网络

在本文中，我们提出了一种双边缘辅助的计算卸载与资源分配方案，专为空间‑空中‑海洋集成网络（SAMINs）量身定制。

#research #paper #devops
3个月前 · software · - · -

[Paper] 探索大型语言模型在新手程序错误定位中的潜力与局限

新手程序员常常在错误定位方面面临挑战，因为他们的经验有限且对编程语法和逻辑的理解不足。传统的 me...

#research #paper #software
3个月前 · software · - · -

[Paper] HarnessAgent：规模化自动模糊测试 Harness 构建的工具增强 LLM 流水线

基于大型语言模型（LLM）的技术在生成程序模糊测试的 harnesses 方面取得了显著进展。然而，将它们应用于任意函数……

#research #paper #software
3个月前 · devops · - · -

[Paper] TokenScale：及时且精准的自动扩缩容，适用于分离式 LLM 服务的 Token Velocity

在 LLM 服务中，架构向 prefill/decode (PD) 解耦的转变提升了资源利用率，但在应对现代工作负载的突发性方面存在困难。

#research #paper #devops
3个月前 · ai · - · -

[Paper] VS-Graph：可扩展且高效的图分类使用超维计算

图分类是一个基础任务，涉及从分子属性预测到材料设计等多个领域。虽然图神经网络（GNN）取得了……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] Vibe Coding 安全吗？在真实世界任务中对代理生成代码的漏洞进行基准评估

Vibe 编码是一种新的编程范式，人类工程师指示大型语言模型（LLM）代理完成复杂的编码任务，几乎不需要监督……

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] MagicQuillV2：精确且交互式的图像编辑与分层视觉提示

我们提出 MagicQuill V2，这是一种新颖的系统，引入了分层组合范式用于生成式图像编辑，弥合了语义……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] CAMEO：多视角扩散模型的对应注意力对齐

多视角扩散模型最近作为一种强大的新视角合成范式出现，然而支撑其视图一致性的底层机制仍未被完全阐明……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] OneThinker：全能图像和视频推理模型

强化学习（RL）最近在多模态大型语言模型（MLLMs）中引发视觉推理方面取得了显著成功。然而，现有的...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] PPTArena：用于代理式 PowerPoint 编辑的基准

我们推出 PPTArena，这是一项用于 PowerPoint 编辑的基准，衡量在自然语言指令下对真实幻灯片进行可靠修改的能力。相比之下…

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] MultiShotMaster：可控的多镜头视频生成框架

当前的视频生成技术在单镜头剪辑（single-shot clips）方面表现出色，但在生成需要灵活镜头安排、连贯性的叙事多镜头视频（multi-shot videos）方面仍然困难，……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] Video4Spatial：迈向具备上下文引导的视频生成的视觉空间智能

我们调查视频生成模型是否能够展现视觉空间智能，这是一种对人类认知至关重要的能力，仅使用视觉数据。为此……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] ViSAudio：端到端视频驱动的双耳空间音频生成

尽管视频到音频生成取得了进展，该领域主要关注单声道输出，缺乏空间沉浸感。现有的binaural方法仍然……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 学习无需加速度测量的物理一致拉格朗日控制模型

本文研究了涉及非保守力的拉格朗日系统的建模与控制，采用一种不需要加速度的混合方法...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] MAViD：用于音频-视觉对话理解与生成的多模态框架

我们提出 MAViD，一个用于 Audio-Visual Dialogue 理解和生成的全新 Multimodal 框架。现有方法主要关注非交互式的……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] SMP：可复用的 Score-Matching Motion Priors 用于基于物理的角色控制

Data-driven motion priors 能够引导 agents 产生自然行为，在创建逼真的虚拟角色方面发挥关键作用。Adversaria...

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts