[Paper] “AI” 能成为医生吗?关于临床 LLM 的共情、可读性和对齐性的研究
大型语言模型(LLMs)在医疗保健中的部署日益增多,但它们与临床标准的沟通对齐仍然缺乏充分量化……
4576 posts from this source
大型语言模型(LLMs)在医疗保健中的部署日益增多,但它们与临床标准的沟通对齐仍然缺乏充分量化……
我们研究将类人工作记忆约束整合到Transformer架构中,并实现了几种受认知启发的注意力机制……
从稀疏多视角视频重建动态3D场景是高度不适定的,常导致几何崩塌、轨迹漂移和漂浮伪影……
内部冰层通过 radar 成像提供了关于 snow accumulation 和 ice dynamics 的关键证据,但 radar 派生的层界观测往往不完整……
AI coding agents 正在大规模采用,但我们缺乏关于人们实际如何使用它们以及它们的产出在实践中有多少是有用的实证证据。...
时空自相似(STSS),捕捉跨帧的视觉对应关系,为视频的时间动态提供了一种有效的表示方式……
可视分析(VA)系统的开发传统上是一项劳动密集型的过程,需要在设计方法论与复杂的软件工程之间取得平衡……
背景:Receiver Operating Characteristic (ROC) 曲线被广泛用于评估 Software Defect Prediction (SDP) 模型的性能,这些模型估计 …
我们推出了一个用于双语拉丁语和英语环境下的问答与翻译基准数据集,包含约 7,800 对问答。T...
货运经纪公司在动态定价条件下每日协商数千个承运人费率,模型经常在对话中途修改目标。Classica…
本文提出了一种用于CO₂封存问题的混合求解器。该求解器使用 IGA-ADS(IsoGeometric Analysis Alternating Directions solver)来...
本研究探讨了提示设计和评审选择在 LLM-as-a-Judge 对自由文本法律问答评估中的作用。我们考察了自动……
随着深度学习与量子计算的协同效应日益增强,Quantum Neural Networks (QNNs) 通过利用量子 … 已成为一种有前景的范式。
我们提出了一个在生物学上细致的扩展,基于经典的 Hopfield/Marr 自联想记忆模型用于 CA3,实现了十个群体(两个不对称……)。
随着变量数量的增加,优化问题变得根本性地具有挑战性。由于搜索空间的体积呈指数增长,经典……
许多现实世界的问题自然地被表述为高阶优化(HUBO)任务,这些任务涉及密集的多变量交互,具有挑战性……
我们建立了状态空间模型(state space models)与一种用于捕获数据中长程依赖的最先进架构之间的数学对应关系,并且一个…
Assurance case 是一份结构化的论证文档,用于证明系统需求或属性的主张,这些主张由证据支持。在 regul…
现代分布式系统产生海量、异构的日志,这些日志对可靠性、安全性和异常检测至关重要。将这些自由形式的消息 i...
侧向预测编码(LPC)是一个简单的理论框架,用于理解生物神经回路中的特征检测。最近的理论工作 [Huang ...
我们研究大型语言模型(LLMs)是否能够直接在半形式化的文本蓝图上执行特征模型分析操作(AOs),即简洁的 cons…
Speculative decoding(SD)是一种广泛使用的方法,用于加速解码密集型的 LLM 推理工作负载。虽然在线推理工作负载高度动态,……
行为驱动开发(BDD)套件会累积步骤文本重复,其维护成本已在先前的工作中得到确认。现有的检测技术 re...
安全相关的 commit messages 的信息量对于 patch triage 至关重要:信息量高时,可实现 security fix 的快速分发和部署……
高性能计算通常依赖于诸如 MPI 之类的并行编程模型来实现分布式内存系统。虽然功能强大,但这些模型容易出现 sub...
Quality-Diversity (QD) 算法擅长发现多样化的技能库,但受限于低样本效率,通常需要数千万的样本……
我们通过将 architecture-level 参数提升为在 function space 中演化的慢速随机变量,扩展了我们的 gauge-covariant stochastic neural-field 框架。
本文介绍了 e112,这是一款上下文感知的移动应急响应应用,旨在加强公民与当局在灾害期间的沟通。
基于核逻辑回归 (KLR) 的高容量联想记忆以其卓越性能而闻名,但受到高计算 …
Synergistic Collapse 发生在规模超过 100 个 agents 时,导致超线性性能下降,而单独的优化无法防止。我们观察到...
AWS Lambda 在函数超过配置的超时时,会使用不可捕获的 SIGKILL 信号终止容器。当 Spark-on-AWS-Lambda (SoAL) 作业被 kil...
物联网设备的兴起和云计算的采用开启了一个以数据驱动的智能新时代。传统的集中式机器学习模型……
近期在 image generation 和 editing 方面的进展为 virtual try-on 打开了新的机会。然而,现有方法仍难以满足复杂的真实——
大型语言模型(LLMs)在代码生成方面取得了显著成果,但它们生成 GUI 应用程序,尤其是游戏的能力仍然不足……
我们解决生成 3D 一致、可导航且空间上有依据的环境的问题:对真实地点的模拟。现有的视频生成…
训练现代神经网络通常依赖于较大的学习率,在接近稳定性边缘的情况下进行,此时优化动态表现出振荡的……
我们建立了关于在 d 维空间上无限宽随机神经网络的高斯输出的函数序列的中心极限定理和非中心极限定理。
强化学习(RL)提供了一种引人注目的数据驱动范式,用于在缺乏准确物理模型的情况下为复杂系统合成控制器。
条件医学图像生成在许多临床相关的成像任务中发挥着重要作用。然而,现有方法仍然面临一个根本性的挑战……
扩展 humanoid foundation models 受限于 robotic data 的稀缺。虽然 massive egocentric human data 提供了可扩展的替代方案,但弥合 …
当今一些性能最强的强化学习算法可能成本高得令人望而却步,因为它们使用测试时的 scaling 方法,例如采样 multip...
Personalized Federated Learning (PFL) 旨在学习多个任务特定模型,而不是在异构数据分布下学习单一全局模型。Exi...
我们提出 VLA Foundry,一个统一 LLM、VLM 和 VLA 训练于单一代码库的开源框架。大多数开源 VLA 工作专注于 ac...
尽管 Vision Transformers (ViTs) 在广泛的视觉任务中取得了显著成功,近期研究表明它们仍然容易受到 ad...
由于在有限的多视角数据下,难以同时建模人体外观、动作和相机视角,Human video generation 仍然具有挑战性。
大型语言模型(LLMs)仍然在多步骤逻辑推理方面存在困难。现有方法要么仅在自然语言中纯粹优化推理链……
Vision-Language-Action (VLA) 模型提供了一种有前景的自动驾驶范式,用于利用世界知识和推理能力,尤其是在长期…
Kubernetes 为扩展 Node.js 工作负载提供了两条默认路径,但两者都有结构性限制。Horizontal Pod Autoscaler 基于 CPU 利用率进行扩展……