Source

arXiv

4750 posts from this source

排序:

3个月前 · ai · - · -

[Paper] AnatomiX，一种解剖感知的基于真实的多模态大型语言模型用于胸部X光片解读

多模态医学大型语言模型在胸部X光解读方面表现出令人印象深刻的进展，但仍然面临空间推理和……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 在关键位置最大化局部熵：前缀感知局部化 LLM Unlearning

Machine unlearning 旨在从 Large Language Models (LLMs) 中忘记敏感知识，同时保持一般实用性。然而，现有方法通常…

#research #paper #ai #nlp
3个月前 · ai · - · -

【论文】去中心化自回归生成

我们提出了对自回归生成去中心化的理论分析。我们通过表达……来定义 Decentralized Discrete Flow Matching 目标。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 多模态数据增强的基础模型在无线网络中的预测与控制：综述

基础模型（FMs）被视为一种变革性的突破，已开始重塑人工智能（AI）的未来，跨越学术...

#research #paper #ai #machine-learning #nlp #computer-vision
3个月前 · ai · - · -

[Paper] DiffBench 与 DiffAgent：端到端 LLM 驱动的 Diffusion 加速代码生成

扩散模型在图像和视频生成方面取得了显著成功。然而，它们固有的多步推理过程会带来巨大的计算成本……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] LSP-DETR: 高效且可扩展的全切片图像细胞核分割

精确且可扩展的细胞核实例分割对于计算病理学至关重要，然而千兆像素全切片图像带来了巨大的计算挑战。

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] Unified Thinker：通用推理模块化核心用于图像生成

尽管在高保真图像合成方面取得了令人印象深刻的进展，生成模型在逻辑密集型指令遵循方面仍然存在困难，暴露出一个持续的……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 从肌肉到文字：MyoText：sEMG 到文字通过指分类和基于 Transformer 的解码

表面肌电图（sEMG）提供了一种直接的神经接口，用于解码肌肉活动，并为免键盘文本输入提供了有前景的基础……

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] 来自 Amazon Appstore 的低评分应用数据集用于用户反馈分析

在当今的数字环境中，终端用户反馈在软件应用的演进中发挥着关键作用，尤其是在解决阻碍使用的问题方面……

#research #paper #software
3个月前 · software · - · -

[Paper] Few-shot学习用于安全漏洞报告识别

安全漏洞报告需要及时识别，以最小化软件系统中的漏洞窗口。传统的机器学习（ML）技术用于……

#research #paper #software
3个月前 · devops · - · -

[Paper] 探索区块链互操作性：框架、用例与未来挑战

在任何情境下，没有可信的第三方，实体之间的信任都非常困难，而信任正是区块链旨在带入数字世界的核心。

#research #paper #devops
3个月前 · devops · - · -

[Paper] 第1届低碳计算国际研讨会论文集 (LOCO 2024)

这是第一届国际低碳计算研讨会（LOCO 2024）的论文集....

#research #paper #devops
3个月前 · software · - · -

[Paper] CodeMEM：AST 引导的自适应记忆用于仓库级迭代代码生成

大型语言模型（LLMs）通过交互式协作显著提升了开发者在代码库级别代码生成的生产力。然而，随着...

#research #paper #software
3个月前 · ai · - · -

[Paper] 假设-然后验证：面向微服务的推测性根因分析与 Pathwise Parallelism

Microservice 系统已成为 cloud-native 企业应用的支柱，因为它们具备资源弹性、松耦合架构以及轻量…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 基于Agentic Memory增强的递归推理用于微服务中的根因定位

随着当代微服务系统变得越来越流行且复杂——通常包含数百甚至数千个细粒度、相互依赖的子系统……

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] 企业身份集成用于 AI 辅助开发者服务：架构、实现与案例研究

AI 辅助的开发者服务正日益嵌入现代 IDE 中，但企业必须确保这些工具在现有的身份和访问控制范围内运行。

#research #paper #software
3个月前 · ai · - · -

[论文] TAAF：协同知识图谱与LLMs的跟踪抽象与分析框架

Execution traces 是理解、调试和优化复杂软件系统的重要信息来源。然而，来自 OS kernels 或 …

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 层次时间感受窗口与零样本时间尺度泛化在生物约束的尺度不变深度网络中

人类认知在嵌套的时间尺度上整合信息。虽然大脑皮层表现出层次化的Temporal Receptive Windows (TRWs)，但局部电路常常……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] Chronicals：一种高性能框架，用于 LLM 微调，相比 Unsloth 提升 3.51 倍

大语言模型微调受内存瓶颈限制：一个 7B 参数模型需要 84GB——14GB 用于权重，14GB 用于梯度，56GB 用于 FP32 优化……

#research #paper #ai #machine-learning #nlp
3个月前 · software · - · -

[Paper] 量子软件工程生态系统的现状

我们研究量子软件工程（QSE）生态系统的现状，重点关注学术界和工业界的成就、活动和参与。

#research #paper #software
4个月前 · devops · - · -

[Paper] 大规模卫星网络中稀疏流量的最优 Oblivious Load-Balancing

Oblivious 负载均衡在网络中涉及使用预定路径将流量从源路由到目的地，且该路径独立于流量，以便……

#research #paper #devops
4个月前 · ai · - · -

[Paper] 首个可证明最优的异步 SGD 用于同质与异质数据

人工智能通过在海量数据集上使用数千个 GPU 或 TPU 训练的大型神经网络迅速发展。此类训练可能占用…

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] APoW：可审计的Proof-of-Work 对抗区块扣留攻击

我们引入APoW，这是一种受Hashcash式nonce搜索启发的新型工作量证明（PoW）构造，它能够通过…审计其他矿工的工作。

#research #paper #devops
4个月前 · ai · - · -

[Paper] 异构低带宽预训练 LLMs

预训练大型语言模型（LLMs）日益需要分布式计算，但带宽限制使得在资源充足的情况下进行扩展变得困难。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

【论文】ExposeAnyone：个性化 Audio-to-Expression 扩散模型是鲁棒的 Zero-Shot 人脸伪造检测器

检测未知的 deepfake 操作仍然是 face forgery detection 中最具挑战性的问题之一。当前最先进的方法未能生成……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] VINO：统一视觉生成器与交错全模态上下文

我们提出了 VINO，一个统一的视觉生成器，能够在单一框架内进行图像和视频的生成与编辑。它不依赖于特定任务的……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] DARC：鼓伴奏生成与细粒度节奏控制

在音乐创作中，快速原型对于探索和完善想法至关重要，但现有的生成工具在用户需要同时具备结构……时往往力不从心。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Talk2Move：强化学习用于文本指令的对象级几何变换（场景中）

我们介绍了 Talk2Move，这是一种基于强化学习（RL）的扩散框架，用于文本指令驱动的场景中对象的空间变换。Spatially m...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] Meta-Learning 引导的 Pruning 用于 Edge Devices 上的 Few-Shot 植物病理

偏远地区的农民需要快速可靠的植物病害识别方法，但他们往往缺乏实验室或高性能计算的渠道。

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] Falcon-H1R：通过混合模型推动推理前沿，实现高效的测试时扩展

本工作介绍了 Falcon-H1R，这是一款 7B 参数的推理优化模型，证明了在 s... 实现竞争性推理性能的可行性。

#research #paper #ai #machine-learning
4个月前 · software · - · -

[论文] 多发布系统的问答：Ciena 案例研究

公司经常需要应对多版本系统，即同一软件的多个版本同时运行。问答 ...

#research #paper #software
4个月前 · ai · - · -

[Paper] 3D Gaussian Modeling 中的联合语义与渲染增强，使用各向异性局部编码

最近的研究提出将 3DGS 与语义特征向量相结合，以实现语义分割和图像渲染的同步进行。然而，这些方法通常将……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 鲁棒的角色感知有害内容检测：提示优化与学习式集成

有毒性检测本质上是主观的，受不同人口群体的多元视角和社会先验的影响。虽然“pluralistic”模型……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] BEDS：贝叶斯新兴耗散结构

我们提出 BEDS（Bayesian Emergent Dissipative Structures），一个统一 non-equilibrium thermodynamics、Bayesian inference 等概念的理论框架。

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 用 Machine Learning 捕捉‘Oddballs’：使用 Deep-Learned 低维表示的 Transit Spectra 与 Autoencoders 检测异常系外行星

本研究探讨基于 autoencoder 的机器学习技术在异常检测中的应用，以识别具有非传统特征的系外行星大气……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 环境自适应协变量选择：学习何时使用虚假相关进行分布外预测

Out-of-distribution (OOD) 预测通常通过限制模型仅使用因果或不变协变量来实现，以避免非因果的虚假关联……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 文本温度估计

自回归语言模型通常在推理阶段使用温度参数来塑造概率分布，并控制文本生成的随机性。

#research #paper #ai #nlp
4个月前 · ai · - · -

[论文] Fusion2Print：深度闪光‑非闪光融合用于无接触指纹匹配

无接触指纹识别提供了一种卫生且方便的替代方案，取代接触式系统，实现快速采集，无需潜在指纹，预…

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] DatBench：判别式、可信且高效的 VLM 评估

经验评估是指导基础模型研究进展的主要指南。尽管已有大量工作专注于训练前沿视觉……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Prithvi-Complimentary Adaptive Fusion Encoder (CAFE)：解锁洪水淹没制图的全部潜力

Geo-Foundation Models（GFMs）已在多种下游应用中证明有效，包括语义分割、分类和回归任务。H...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 项目 Ariadne：用于审计 LLM 代理忠实性的结构因果框架

随着大型语言模型（LLM）代理越来越多地承担高风险的自主决策任务，它们推理过程的透明度已经成为…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 编码游戏：在理性对手存在下的编码理论，受去中心化机器学习的启发

编码理论在实现可靠的通信、存储和计算方面发挥着关键作用。传统方法假设最坏情况的对抗模型，并……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 分布式深度学习的放置语义：用于分析并行策略的系统化框架

训练 large language models 需要在众多 accelerators 上分布计算，但实践者会选择并行策略（data parallelism、tensor parallelism、pipeline parallelism……）。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 时序 Kolmogorov‑Arnold 网络 (T‑KAN) 用于高频限价订单簿预测：效率、可解释性与 Alpha 衰减

高频交易（HFT）环境的特征是大量的限价订单簿（LOB）数据，这些数据众所周知地噪声大且非线性。Alpha de...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 360DVO: 深度视觉里程计用于单目360度相机

单目全向视觉里程计（OVO）系统利用 360 度相机克服透视 VO 系统的视场限制。然而，ex...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 使用非参数变分信息瓶颈的文本 Transformer 嵌入的差分隐私

我们提出了一种隐私保护的方法，通过共享其 transformer embeddings 的噪声版本来共享文本数据。已有研究表明，隐藏表示...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[论文] 对几种方言的Nawatl变体进行分类

墨西哥是一个拥有大量土著语言的国家，其中使用最广泛的是 Nawatl，当前有超过两百万人在使用……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] SortWaste：工业废物分拣目标检测的密集标注数据集

随着人口增长，废物产生量不断增加，这对有效管理和回收材料带来了挑战。人工废物分类是……

#research #paper #ai #computer-vision

Newer posts

Older posts