Source

arXiv

4576 posts from this source

排序:

6天前 · ai · - · -

[Paper] “AI” 能成为医生吗？关于临床 LLM 的共情、可读性和对齐性的研究

大型语言模型（LLMs）在医疗保健中的部署日益增多，但它们与临床标准的沟通对齐仍然缺乏充分量化……

#research #paper #ai #machine-learning #nlp
6天前 · ai · - · -

[Paper] 工作记忆约束在数据稀缺下为Transformer的学习提供支架

我们研究将类人工作记忆约束整合到Transformer架构中，并实现了几种受认知启发的注意力机制……

#research #paper #ai #machine-learning #nlp
6天前 · ai · - · -

[Paper] GeoRect4D: 几何兼容的生成式校正用于动态稀疏视图3D重建

从稀疏多视角视频重建动态3D场景是高度不适定的，常导致几何崩塌、轨迹漂移和漂浮伪影……

#research #paper #ai #computer-vision
6天前 · ai · - · -

[Paper] 基于物理约束的内部冰层厚度合成用于不完整层痕迹

内部冰层通过 radar 成像提供了关于 snow accumulation 和 ice dynamics 的关键证据，但 radar 派生的层界观测往往不完整……

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] SWE-chat：真实用户在真实环境中的编码代理交互

AI coding agents 正在大规模采用，但我们缺乏关于人们实际如何使用它们以及它们的产出在实践中有多少是有用的实证证据。...

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] 探索高阶自相似性用于视频理解

时空自相似（STSS），捕捉跨帧的视觉对应关系，为视频的时间动态提供了一种有效的表示方式……

#research #paper #ai #computer-vision
6天前 · software · - · -

[Paper] Autark：用于原型制作城市可视分析系统的 Serverless Toolkit

可视分析（VA）系统的开发传统上是一项劳动密集型的过程，需要在设计方法论与复杂的软件工程之间取得平衡……

#research #paper #software
6天前 · software · - · -

[Paper] 通过 ROC 曲线下面积评估软件缺陷预测模型可能产生误导

背景：Receiver Operating Characteristic (ROC) 曲线被广泛用于评估 Software Defect Prediction (SDP) 模型的性能，这些模型估计 …

#research #paper #software
6天前 · ai · - · -

[Paper] RespondeoQA：拉丁语-英语双语问答基准

我们推出了一个用于双语拉丁语和英语环境下的问答与翻译基准数据集，包含约 7,800 对问答。T...

#research #paper #ai #nlp
6天前 · ai · - · -

[Paper] 动态定价下的锚点-恢复让步用于LLM增强的货运谈判

货运经纪公司在动态定价条件下每日协商数千个承运人费率，模型经常在对话中途修改目标。Classica…

#research #paper #ai #machine-learning #nlp
6天前 · ai · - · -

[Paper] CO₂ 封存混合求解器，使用等几何交替方向和基于配点的鲁棒变分物理信息神经网络 (IGA-ADS-CRVPINN)

本文提出了一种用于CO₂封存问题的混合求解器。该求解器使用 IGA-ADS（IsoGeometric Analysis Alternating Directions solver）来...

#research #paper #ai
6天前 · ai · - · -

[Paper] 利用 LLM-as-a-Judge 在自由文本法律问答中的判决倾向通过 Prompt Optimization

本研究探讨了提示设计和评审选择在 LLM-as-a-Judge 对自由文本法律问答评估中的作用。我们考察了自动……

#research #paper #ai #machine-learning #nlp
6天前 · ai · - · -

[Paper] QuanForge：用于量子神经网络的变异测试框架

随着深度学习与量子计算的协同效应日益增强，Quantum Neural Networks (QNNs) 通过利用量子 … 已成为一种有前景的范式。

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] Learning Hippo: 多吸引子动力学与稳定性效应在生物学细致的 CA3 扩展的 Hopfield 网络中

我们提出了一个在生物学上细致的扩展，基于经典的 Hopfield/Marr 自联想记忆模型用于 CA3，实现了十个群体（两个不对称……）。

#research #paper #ai
6天前 · devops · - · -

分布式量子增强优化：用于高维搜索的地形预调节方法

随着变量数量的增加，优化问题变得根本性地具有挑战性。由于搜索空间的体积呈指数增长，经典……

#research #paper #devops
6天前 · devops · - · -

[Paper] 针对大规模稠密交互高阶问题的分布式量子优化

许多现实世界的问题自然地被表述为高阶优化（HUBO）任务，这些任务涉及密集的多变量交互，具有挑战性……

#research #paper #devops
6天前 · ai · - · -

[Paper] 一个显式算子解释了现代神经网络在序列和语言建模中的端到端计算

我们建立了状态空间模型（state space models）与一种用于捕获数据中长程依赖的最先进架构之间的数学对应关系，并且一个…

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] 评估 Assurance Cases 作为文本属性图的结构与溯源分析

Assurance case 是一份结构化的论证文档，用于证明系统需求或属性的主张，这些主张由证据支持。在 regul…

#research #paper #ai #machine-learning
6天前 · software · - · -

[Paper] DeepParse：混合日志解析与 LLM 合成的正则掩码

现代分布式系统产生海量、异构的日志，这些日志对可靠性、安全性和异常检测至关重要。将这些自由形式的消息 i...

#research #paper #software
1周前 · ai · - · -

[Paper] 侧向预测编码的响应时间及模块化结构的优势

侧向预测编码（LPC）是一个简单的理论框架，用于理解生物神经回路中的特征检测。最近的理论工作 [Huang ...

#research #paper #ai
1周前 · ai · - · -

[Paper] 使用 LLM 的早期产品线验证：关于半形式蓝图分析的研究

我们研究大型语言模型（LLMs）是否能够直接在半形式化的文本蓝图上执行特征模型分析操作（AOs），即简洁的 cons…

#research #paper #ai #machine-learning
1周前 · devops · - · -

[Paper] FASER：细粒度阶段管理用于动态 LLM 服务中的推测解码

Speculative decoding（SD）是一种广泛使用的方法，用于加速解码密集型的 LLM 推理工作负载。虽然在线推理工作负载高度动态，……

#research #paper #devops
1周前 · ai · - · -

[Paper] 在110万 BDD 步骤中查找重复：cukereuse，一种 Paraphrase‑Robust 静态检测器，适用于 Cucumber 与 Gherkin

行为驱动开发（BDD）套件会累积步骤文本重复，其维护成本已在先前的工作中得到确认。现有的检测技术 re...

#research #paper #ai #nlp
1周前 · software · - · -

[Paper] 关于安全提交信息的信息性：大规模复制研究

安全相关的 commit messages 的信息量对于 patch triage 至关重要：信息量高时，可实现 security fix 的快速分发和部署……

#research #paper #software
1周前 · devops · - · -

[Paper] 将契约验证扩展到 Fortran 的并行编程模型

高性能计算通常依赖于诸如 MPI 之类的并行编程模型来实现分布式内存系统。虽然功能强大，但这些模型容易出现 sub...

#research #paper #devops
1周前 · ai · - · -

[Paper] 无目标网络的分布式价值估计用于稳健的质量多样性

Quality-Diversity (QD) 算法擅长发现多样化的技能库，但受限于低样本效率，通常需要数千万的样本……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 规范协变神经场中的神经进化随机结构

我们通过将 architecture-level 参数提升为在 function space 中演化的慢速随机变量，扩展了我们的 gauge-covariant stochastic neural-field 框架。

#research #paper #ai
1周前 · devops · - · -

[Paper] e112: 基于上下文感知的移动紧急通信平台，利用智能手机感知和云服务

本文介绍了 e112，这是一款上下文感知的移动应急响应应用，旨在加强公民与当局在灾害期间的沟通。

#research #paper #devops
1周前 · ai · - · -

[Paper] 高容量核关联记忆中稀疏函数的稠密表示的量化鲁棒性

基于核逻辑回归 (KLR) 的高容量联想记忆以其卓越性能而闻名，但受到高计算 …

#research #paper #ai
1周前 · ai · - · -

[Paper] 可扩展多代理边缘计算的Delta感知编排框架

Synergistic Collapse 发生在规模超过 100 个 agents 时，导致超线性性能下降，而单独的优化无法防止。我们观察到...

#research #paper #ai #machine-learning
1周前 · devops · - · -

[论文] 在 Spark-on-AWS-Lambda 中使用 Open Table Formats 对静默数据丢失进行特征化与修复

AWS Lambda 在函数超过配置的超时时，会使用不可捕获的 SIGKILL 信号终止容器。当 Spark-on-AWS-Lambda (SoAL) 作业被 kil...

#research #paper #devops
1周前 · ai · - · -

[Paper] 区块链支持的云基础设施上的联邦学习

物联网设备的兴起和云计算的采用开启了一个以数据驱动的智能新时代。传统的集中式机器学习模型……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Tstars-Tryon 1.0：鲁棒且真实的 Virtual Try-On 用于多样化时尚单品

近期在 image generation 和 editing 方面的进展为 virtual try-on 打开了新的机会。然而，现有方法仍难以满足复杂的真实——

#research #paper #ai #computer-vision
1周前 · software · - · -

[Paper] PlayCoder：使 LLM 生成的 GUI 代码可运行

大型语言模型（LLMs）在代码生成方面取得了显著成果，但它们生成 GUI 应用程序，尤其是游戏的能力仍然不足……

#research #paper #software
1周前 · ai · - · -

[Paper] CityRAG：步入城市：空间式视频生成

我们解决生成 3D 一致、可导航且空间上有依据的环境的问题：对真实地点的模拟。现有的视频生成…

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 稳定性边缘的泛化

训练现代神经网络通常依赖于较大的学习率，在接近稳定性边缘的情况下进行，此时优化动态表现出振荡的……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 随机神经网络泛函波动中的相变

我们建立了关于在 d 维空间上无限宽随机神经网络的高斯输出的函数序列的中心极限定理和非中心极限定理。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 安全持续强化学习在非平稳环境中

强化学习（RL）提供了一种引人注目的数据驱动范式，用于在缺乏准确物理模型的情况下为复杂系统合成控制器。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 用于条件医学图像生成的 Generative Drifting

条件医学图像生成在许多临床相关的成像任务中发挥着重要作用。然而，现有方法仍然面临一个根本性的挑战……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] UniT：迈向统一的物理语言用于人类到类人机器人策略学习与世界建模

扩展 humanoid foundation models 受限于 robotic data 的稀缺。虽然 massive egocentric human data 提供了可扩展的替代方案，但弥合 …

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] FASTER：价值引导采样用于快速强化学习

当今一些性能最强的强化学习算法可能成本高得令人望而却步，因为它们使用测试时的 scaling 方法，例如采样 multip...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] FB-NLL：基于特征的方法来解决个性化联邦学习中的噪声标签

Personalized Federated Learning (PFL) 旨在学习多个任务特定模型，而不是在异构数据分布下学习单一全局模型。Exi...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] VLA Foundry：用于训练视觉-语言-动作模型的统一框架

我们提出 VLA Foundry，一个统一 LLM、VLM 和 VLA 训练于单一代码库的开源框架。大多数开源 VLA 工作专注于 ac...

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 视觉Transformer的对抗训练中的良性过拟合

尽管 Vision Transformers (ViTs) 在广泛的视觉任务中取得了显著成功，近期研究表明它们仍然容易受到 ad...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] ReImagine：重新思考通过图像优先合成实现可控高质量人类视频生成

由于在有限的多视角数据下，难以同时建模人体外观、动作和相机视角，Human video generation 仍然具有挑战性。

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 发现共享的逻辑子空间：通过对齐自然语言与符号视图来引导 LLM 逻辑推理

大型语言模型（LLMs）仍然在多步骤逻辑推理方面存在困难。现有方法要么仅在自然语言中纯粹优化推理链……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] SpanVLA：高效动作桥接与负恢复样本学习用于视觉-语言-动作模型

Vision-Language-Action (VLA) 模型提供了一种有前景的自动驾驶范式，用于利用世界知识和推理能力，尤其是在长期…

#research #paper #ai #computer-vision
1周前 · devops · - · -

[Paper] Node.js 在 Kubernetes 上的预测自动伸缩：降低延迟，恰当规模的容量

Kubernetes 为扩展 Node.js 工作负载提供了两条默认路径，但两者都有结构性限制。Horizontal Pod Autoscaler 基于 CPU 利用率进行扩展……

#research #paper #devops

Newer posts

Older posts