[Paper] AnatomiX,一种解剖感知的基于真实的多模态大型语言模型用于胸部X光片解读
多模态医学大型语言模型在胸部X光解读方面表现出令人印象深刻的进展,但仍然面临空间推理和……
4750 posts from this source
多模态医学大型语言模型在胸部X光解读方面表现出令人印象深刻的进展,但仍然面临空间推理和……
Machine unlearning 旨在从 Large Language Models (LLMs) 中忘记敏感知识,同时保持一般实用性。然而,现有方法通常…
我们提出了对自回归生成去中心化的理论分析。我们通过表达……来定义 Decentralized Discrete Flow Matching 目标。
基础模型(FMs)被视为一种变革性的突破,已开始重塑人工智能(AI)的未来,跨越学术...
扩散模型在图像和视频生成方面取得了显著成功。然而,它们固有的多步推理过程会带来巨大的计算成本……
精确且可扩展的细胞核实例分割对于计算病理学至关重要,然而千兆像素全切片图像带来了巨大的计算挑战。
尽管在高保真图像合成方面取得了令人印象深刻的进展,生成模型在逻辑密集型指令遵循方面仍然存在困难,暴露出一个持续的……
表面肌电图(sEMG)提供了一种直接的神经接口,用于解码肌肉活动,并为免键盘文本输入提供了有前景的基础……
在当今的数字环境中,终端用户反馈在软件应用的演进中发挥着关键作用,尤其是在解决阻碍使用的问题方面……
安全漏洞报告需要及时识别,以最小化软件系统中的漏洞窗口。传统的机器学习(ML)技术用于……
在任何情境下,没有可信的第三方,实体之间的信任都非常困难,而信任正是区块链旨在带入数字世界的核心。
这是第一届国际低碳计算研讨会(LOCO 2024)的论文集....
大型语言模型(LLMs)通过交互式协作显著提升了开发者在代码库级别代码生成的生产力。然而,随着...
Microservice 系统已成为 cloud-native 企业应用的支柱,因为它们具备资源弹性、松耦合架构以及轻量…
随着当代微服务系统变得越来越流行且复杂——通常包含数百甚至数千个细粒度、相互依赖的子系统……
AI 辅助的开发者服务正日益嵌入现代 IDE 中,但企业必须确保这些工具在现有的身份和访问控制范围内运行。
Execution traces 是理解、调试和优化复杂软件系统的重要信息来源。然而,来自 OS kernels 或 …
人类认知在嵌套的时间尺度上整合信息。虽然大脑皮层表现出层次化的Temporal Receptive Windows (TRWs),但局部电路常常……
大语言模型微调受内存瓶颈限制:一个 7B 参数模型需要 84GB——14GB 用于权重,14GB 用于梯度,56GB 用于 FP32 优化……
我们研究量子软件工程(QSE)生态系统的现状,重点关注学术界和工业界的成就、活动和参与。
Oblivious 负载均衡在网络中涉及使用预定路径将流量从源路由到目的地,且该路径独立于流量,以便……
人工智能通过在海量数据集上使用数千个 GPU 或 TPU 训练的大型神经网络迅速发展。此类训练可能占用…
我们引入APoW,这是一种受Hashcash式nonce搜索启发的新型工作量证明(PoW)构造,它能够通过…审计其他矿工的工作。
预训练大型语言模型(LLMs)日益需要分布式计算,但带宽限制使得在资源充足的情况下进行扩展变得困难。
检测未知的 deepfake 操作仍然是 face forgery detection 中最具挑战性的问题之一。当前最先进的方法未能生成……
我们提出了 VINO,一个统一的视觉生成器,能够在单一框架内进行图像和视频的生成与编辑。它不依赖于特定任务的……
在音乐创作中,快速原型对于探索和完善想法至关重要,但现有的生成工具在用户需要同时具备结构……时往往力不从心。
我们介绍了 Talk2Move,这是一种基于强化学习(RL)的扩散框架,用于文本指令驱动的场景中对象的空间变换。Spatially m...
偏远地区的农民需要快速可靠的植物病害识别方法,但他们往往缺乏实验室或高性能计算的渠道。
本工作介绍了 Falcon-H1R,这是一款 7B 参数的推理优化模型,证明了在 s... 实现竞争性推理性能的可行性。
公司经常需要应对多版本系统,即同一软件的多个版本同时运行。问答 ...
最近的研究提出将 3DGS 与语义特征向量相结合,以实现语义分割和图像渲染的同步进行。然而,这些方法通常将……
有毒性检测本质上是主观的,受不同人口群体的多元视角和社会先验的影响。虽然“pluralistic”模型……
我们提出 BEDS(Bayesian Emergent Dissipative Structures),一个统一 non-equilibrium thermodynamics、Bayesian inference 等概念的理论框架。
本研究探讨基于 autoencoder 的机器学习技术在异常检测中的应用,以识别具有非传统特征的系外行星大气……
Out-of-distribution (OOD) 预测通常通过限制模型仅使用因果或不变协变量来实现,以避免非因果的虚假关联……
自回归语言模型通常在推理阶段使用温度参数来塑造概率分布,并控制文本生成的随机性。
无接触指纹识别提供了一种卫生且方便的替代方案,取代接触式系统,实现快速采集,无需潜在指纹,预…
经验评估是指导基础模型研究进展的主要指南。尽管已有大量工作专注于训练前沿视觉……
Geo-Foundation Models(GFMs)已在多种下游应用中证明有效,包括语义分割、分类和回归任务。H...
随着大型语言模型(LLM)代理越来越多地承担高风险的自主决策任务,它们推理过程的透明度已经成为…
编码理论在实现可靠的通信、存储和计算方面发挥着关键作用。传统方法假设最坏情况的对抗模型,并……
训练 large language models 需要在众多 accelerators 上分布计算,但实践者会选择并行策略(data parallelism、tensor parallelism、pipeline parallelism……)。
高频交易(HFT)环境的特征是大量的限价订单簿(LOB)数据,这些数据众所周知地噪声大且非线性。Alpha de...
单目全向视觉里程计(OVO)系统利用 360 度相机克服透视 VO 系统的视场限制。然而,ex...
我们提出了一种隐私保护的方法,通过共享其 transformer embeddings 的噪声版本来共享文本数据。已有研究表明,隐藏表示...
墨西哥是一个拥有大量土著语言的国家,其中使用最广泛的是 Nawatl,当前有超过两百万人在使用……
随着人口增长,废物产生量不断增加,这对有效管理和回收材料带来了挑战。人工废物分类是……