Source

arXiv

4611 posts from this source

排序:

0个月前 · ai · - · -

[论文] 修订还是重新求解？分解多LLM流水线中二次传递收益

多模型（Multi-LLM）修订流水线，其中第二个模型审阅并改进第一个模型生成的草稿，普遍认为其收益来源于真正的 er...

#research #paper #ai #machine-learning #nlp
0个月前 · software · - · -

[Paper] 可移植且安全的 COBOL CI/CD：工业迁移的经验教训

持续集成与交付（CI/CD）流水线对于维持大型软件系统的演进至关重要。在受监管的行业中，面对遗留的...

#research #paper #software
0个月前 · ai · - · -

[Paper] OkanNet：轻量级深度学习架构用于基于MRI图像的脑肿瘤分类

医学成像技术，尤其是磁共振成像（MRI），被公认为神经系统疾病诊断和治疗计划的金标准……

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] 使用算法配置技术寻找低星差的三维 Kronecker 点集

L∞星差距是衡量点集在给定空间中分布均匀程度的指标。低星差距的点集被用于设计……

#research #paper #ai
0个月前 · ai · - · -

[Paper] 可扩展的预训练大型 Mixture of Experts 语言模型在 Aurora 超级计算机上

从头预训练大型语言模型（LLMs）需要巨量的计算资源。Aurora 超级计算机是一台 ExaScale 机器，拥有 127,488 个 Intel PVC（P…）。

#research #paper #ai #machine-learning
0个月前 · devops · - · -

[论文] RISC-V 已经准备好用于机器学习吗？可移植的高斯过程使用异步任务

Gaussian processes 在 machine learning 领域被广泛使用，但仍然计算量大，限制了它们在各种硬件上的高效可扩展性。

#research #paper #devops
0个月前 · devops · - · -

[论文] 快速确定性分布式 Degree Splitting

我们在 LOCAL 中获得了用于计算更平衡的定向和度分割的更好算法。我们结果的重要因素是与 hypergraph sinkl… 的关联。

#research #paper #devops
0个月前 · ai · - · -

[Paper] G-ICSO-NAS：在梯度与群体之间切换档位，实现鲁棒的神经架构搜索

Neural Architecture Search (NAS) 已成为自动机器学习中的关键技术。基于进化算法 (EA) 的方法展示了卓越的……

#research #paper #ai
0个月前 · devops · - · -

[Paper] MPI-Q：大规模经典‑量子异构混合分布式计算的消息通信库

经典-量子系统的异构性（不同的数据特性、执行范式和同步机制等）使得现有的分布式……

#research #paper #devops
0个月前 · devops · - · -

[Paper] 在 Kubernetes 上回收空闲 CPU 周期：稀疏域多路复用用于并发 MPI-CFD 仿真

当 MPI 并行仿真在共享的 Kubernetes 集群上运行时，传统的 CPU 调度会使大多数已分配的周期在同步时处于空闲状态……

#research #paper #devops
1个月前 · devops · - · -

[Paper] TENT：一种声明式 Slice Spraying Engine，实现去聚合 LLM 服务中的高性能与弹性数据移动

现代 GPU 集群建立在复杂的异构互连层次结构之上，范围从多轨 RDMA 到专有的织物，例如 Multi-Node NV……

#research #paper #devops
1个月前 · ai · - · -

【论文】基于集合的价值函数表征与神经近似输入受限离散时间系统的稳定域

分析具有可稳定受控不变集（CISs）的非线性系统，需要准确估计它们的稳定域（DOS）以及…

#research #paper #ai
1个月前 · ai · - · -

[Paper] MAC-Attention：一种匹配‑修正‑完成方案，用于快速且精确的注意力计算

Long-context decoding 在 LLM 中是 IO‑bound：每个 token 会重新读取不断增长的 KV cache。之前的加速通过 compression 来削减字节，但这会降低 fidelity，o...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 基于特征分析和图卷积神经网络（GCN）的不同频段癫痫发作检测（来自脑电图（EEG）信号）

癫痫发作是一种神经系统疾病，其特征是大脑中异常且过度的电活动，导致复发性的发作事件。E...

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] 源已知标识符：面向分布式应用的三层身份系统

分布式应用需要满足存储效率、时间顺序可排序、嵌入来源元数据、零查询可验证、conf...

#research #paper #devops
1个月前 · ai · - · -

[Paper] OmniRoam：通过长时程全景视频生成实现世界漫游

使用视频生成模型对场景进行建模近年来已引起日益增长的研究兴趣。然而，大多数现有方法依赖于透视视频……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 视频模型提前推理：利用计划承诺进行迷宫求解

视频扩散模型展现出诸如解迷宫和拼图等新兴推理能力，但人们对它们在生成过程中的推理方式知之甚少……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 使用基于Transformer的源代码表示自动识别可并行循环

自动并行化仍然是软件工程中的一个挑战性问题，尤其是在识别可以安全执行循环的代码区域时……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 3D几何计算机视觉中博士级编码的基准测试

AI辅助编码已迅速重塑软件实践和研究工作流，但当今的模型仍然难以为复杂的三维地质力学代码生成正确的结果。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 基于奖励的在线 LLM 路由通过 NeuralUCB

本研究探讨了在成本感知的大语言模型（LLM）路由中使用 NeuralUCB。现有的路由方法大致可分为监督…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[论文] Tucker Attention：对近似注意力机制的推广

对多头自注意力（MHA）中 self-attention 机制内存占用的降低的追求催生了一系列丰富的方法，例如，gro...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 隐蔽地通过数据驱动的语音时序适配提升可懂度

人类说话者常常通过整体放慢语速来帮助那些在语言理解上有挑战的听众，例如听力受限或非母语的成年人。

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 三元认知架构：通过时空与认知摩擦约束自主行为

当前的自主 AI 代理主要由大型语言模型（Large Language Models，LLMs）驱动，处于认知轻盈状态：它们在没有…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] ContextClaim：用于可验证声明检测的基于上下文的范式

Verifiable claim detection 询问一个主张是否表达了一个事实陈述，原则上可以依据外部证据进行评估。作为一种早期过滤……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 机器人操作的混合框架：整合强化学习和大型语言模型

本文提出了一种新的混合框架，将强化学习（RL）和大型语言模型（LLMs）相结合，以提升机器人操作任务。B...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 针对 Gumbel Watermarking 的精细检测

我们提出了一种简单的检测机制，用于Aaronson（2022）提出的Gumbel水印方案。新的机制已被证明在概率上接近最优……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 构建安全 AI 代理：关于系统层防御间接提示注入攻击的视角

AI 代理，主要由大型语言模型（LLMs）驱动，容易受到间接提示注入的影响，即在不可信…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 可扩展的 AI 辅助工作流管理用于探测器设计优化的分布式计算

生产与分布式分析（PanDA）系统，最初为 CERN 大型强子对撞机（LHC）上的 ATLAS 实验开发，已发展为 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 条件极化引导用于伪装目标检测

伪装目标检测（Camouflaged object detection，COD）旨在识别与背景高度融合的目标。近期研究表明，optical characteristics……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 跨神经网络追踪等价的机制解释

Mechanistic interpretability (MI) 是一种新兴的神经网络解释框架。给定任务和模型，MI 旨在发现简洁的算法式 …

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] Phyelds：用于聚合计算的 Pythonic 框架

Aggregate programming 是一种基于场的协同范式，已有十多年的探索，并在包括传感器网络在内的多个领域取得了成功的应用。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 通过LLM衍生的抽象提升结构映射以实现叙事中的类比推理

类比推理是人类在问题解决和论证中实现概括的关键驱动力。然而，叙事结构之间的类比仍然具有挑战性……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 在 Camera Dropbox 中扩展 MONA：复现、学习批准与 Reward-Hacking 缓解的设计意义

Myopic Optimization with Non‑myopic Approval (MONA) 通过限制代理的规划视野，同时提供远见的 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SurgNavAR：一种用于光学透视式头戴显示器的增强现实外科导航框架

增强现实（AR）设备配备头戴显示器（HMD），能够在手术期间将三维术前影像数据直接叠加到患者身上。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 对齐验证与部署：目标加权交叉验证用于空间预测

Cross-validation (CV) 通常用于在没有独立测试数据时估计预测风险。它的有效性取决于假设有效……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 结构特征工程用于生成引擎优化：内容结构如何影响引用行为

AI 驱动的搜索引擎的激增已经将信息发现从传统的基于链接的检索转变为直接答案生成，并带有选择性……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 量化跨模态交互在多模态胶质瘤生存预测中的 InterSHAP：对加性信号整合的证据

多模态深度学习在癌症预后中的应用通常被认为能够受益于协同的跨模态交互，但这一假设尚未直接……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 气象驱动的 GPT4AP：在数据稀缺环境中用于大气空气污染的多任务预测 LLM

准确的空气污染预测对于环境监测和政策支持至关重要，然而数据驱动模型往往受到有限的泛化能力限制。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 协变量能解释这些群体差异的原因吗？参考组的选择可能会颠倒 Oaxaca‑Blinder 分解的结论

科学家经常想解释为什么两个组的结果不同。例如，两家医院的患者死亡率差异可能是由于……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 三模态深度学习用于胶质瘤生存预测：整合组织病理学、基因表达和MRI的可行性研究

Multimodal deep learning 通过整合 histopathology 和 genomic data 提高了脑肿瘤的预后准确性，然而 volumetric M...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 通过多尺度自适应图注意力学习结构-功能脑表征以实现认知洞察

理解大脑结构与功能的相互作用是解释智力的关键，但将它们联合建模具有挑战性，因为结构和功能……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 为外科基础模型扩展视频预训练

Surgical video understanding 对于 computer-assisted interventions 至关重要，然而现有的 surgical foundation models 仍受限于数据规模有限，...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] SurgTEMP：具备时间感知的外科视频问答与文本引导的视觉记忆用于腹腔镜胆囊切除术

外科手术本质上复杂且风险高，需要广泛的专业知识和持续的专注，以便在不断变化的术中场景中顺利导航。Computer...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] NeuroBRIDGE：行为条件化的 Koopman Dynamics 与 Riemannian Alignment 用于从纵向 Functional Connectome 预测早期药物使用启动

对有药物使用启动风险的青少年进行早期识别至关重要，但却很困难，因为大多数预测因素将连通性视为静态或交叉……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 在代码生成中随处思考

最近在推理大型语言模型（LLMs）方面的进展主要依赖于前置思考，即在给出最终答案之前进行推理。然而，这...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 医疗团队使用智能辅导系统的生理与语义模式

有效的协作需要团队通过社会共享学习调节（Socially Shared Regulation of Learning，SSRL）来管理复杂的认知和情绪状态。Physiological syn...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 改写新闻：追踪新闻机构之间的编辑重用

本文研究了多语言新闻报道中的句子级文本复用，分析了复用内容在文章中的出现位置。我们提出了一种弱监督方法……

#research #paper #ai #nlp
1个月前 · software · - · -

[Paper] BayesInsights：在 Bloomberg 使用 Bayesian Networks 对软件交付和开发者体验进行建模

随着工业中的 software 规模和复杂性增长，公司生成和使用的 engineering data 量也随之增加。理想情况下，这些数据可以用于 f...

#research #paper #software

Newer posts

Older posts