[Paper] AdaFuse:自适应集成解码与测试时缩放用于LLMs
大型语言模型(LLMs)由于预训练数据、模型架构和解码行为的差异而展现出互补的优势。推理…
大型语言模型(LLMs)由于预训练数据、模型架构和解码行为的差异而展现出互补的优势。推理…
自动化的癫痫发作检测从脑电图(EEG)仍然困难,因为不同患者的发作动力学以及记录条件的差异很大,...
我们开发了一个实用框架,仅使用单个离散时间序列来区分 diffusive stochastic processes 与 deterministic signals。我们的…
大型语言模型(LLMs)往往无法从人类或非 Long CoT LLM 的模仿中学习到有效的长链式思考(Long CoT)推理。为了理解 t...
在安全关键领域,语言歧义可能导致严重后果;在外科手术环境中,像“Pass me the vial”这样的模糊指令可能导致灾难性后果。
将网络表示为图,并使用良性连接训练链接预测模型,是一种有效的基于异常的入侵检测方法。Exis...
Internet of Things (IoT) 设备的快速部署导致了大规模传感器网络,这些网络实时监测环境和城市现象。Com...
随着新兴应用对更高吞吐量和更低延迟的需求,运营商正日益在 x‑haul 传输中部署毫米波 (mmWave) 链路……
我们提出 DeePM(Deep Portfolio Manager),一种结构化的 deep‑learning 宏观投资组合管理器,端到端训练以最大化稳健的 risk‑adjusted utility。De...
近期视频生成的进展主要由 diffusion 和 flow-matching 模型主导,这些模型能够产生高质量的结果,但在计算上仍然…
受约束的组合多臂赌博机模型已被广泛用于解决无线网络及相关领域的问题,包括…
主动学习(Active learning,AL)在材料科学中发挥关键作用,使得诸如构建机器学习原子间势能等应用成为可能……