[论文] LLM 作为惯用反编译器:从 x86-64 汇编恢复 Dart 的高级代码
将机器码翻译成人类可读的高级语言是逆向工程中的一个开放研究问题。尽管最近在基于 LLM 的技术方面取得了进展……
4611 posts from this source
将机器码翻译成人类可读的高级语言是逆向工程中的一个开放研究问题。尽管最近在基于 LLM 的技术方面取得了进展……
监管文件编码了LLM‑based系统必须遵守的具有法律约束力的义务。然而,将密集、层次结构化的法律文本转换为……
生成模型用于晶体材料通常依赖于等变图神经网络,这些网络能够很好地捕捉几何结构,但训练成本高且 …
Agent skills,结构化的过程知识和可执行资源包,代理在推理时动态加载,已成为可靠的机制……
理解大型语言模型(LLMs)如何从提示中处理信息仍然是一个重大挑战。为了揭示这个“黑箱”,attention vi...
端到端语音 Named Entity Recognition (NER) 旨在直接从语音中提取实体。已有研究表明,端到端 (E2E) 方法可以超越……
3GPP Release 19 已启动对集成感知与通信(ISAC)的标准化工作,包括单站感知的信道模型、评估……
人才招聘是许多行业的关键但成本高昂的过程,招聘成本高且招聘周期长。现有的人才推荐系统...
检索增强语言模型(RALMs)已在知识密集型任务中展示出显著潜力;然而,它们仍然在性能方面易受…
我们研究 deterministic distributed algorithms 在 extremely weak models of distributed computing 中对 random input graphs 能计算什么:所有节点都是 anonymous……
大型语言模型(LLMs)最近在自动程序修复(APR)方面展现出强大的潜力,尤其是通过生成…的迭代细化。
云计算允许可扩展的资源供应,但动态工作负载的变化常常导致因过度供应而产生更高的成本。机器学习(ML)a...
安全团队面临一个挑战:新披露的 Common Vulnerabilities and Exposures (CVEs) 数量远远超过手动开发检测的能力……
云基础设施支持数据管道在成本、速度和资源利用等需求方面的高效运行。我们提出一个 integra...
模型上下文协议(MCP)标准化了 LLM 与外部工具和数据源的连接方式,实现更快的集成,但也带来了新的攻击向量……
深度强化学习(DRL)最近已成为动态算法配置(DAC)的有前景的工具,使进化算法能够适应 …
现代的 Transformer 系列神经网络要求实践者在训练开始之前决定使用多少个 attention heads,网络的深度是多少,……
范围最小值查询在字符串处理和数据库应用中被广泛使用,包括生物序列分析、文档检索和网络搜索等。
参数高效微调(PEFT)已成为在受限计算预算下适配大型语言模型(LLMs)的关键范式。然而...
深度聚类中一个持续存在的结构性弱点是特征学习与聚类分配之间的脱节。大多数架构调用外部 clu...
大语言模型(LLM)推理日益依赖多GPU执行,然而现有的推理并行化策略需要层级间的…
大规模分布式训练近年来已成为工业界和学术界机器学习系统研究的热点。然而,进行实验…
关联记忆系统实现对模式的内容可寻址存储和检索,这一能力是生物神经计算和人工……的核心。
本文开发了一种用于求解大规模线性方程的分布式 variational quantum algorithm。对于形式为 Ax = b 的线性系统,大规模的方阵……
虽然基于 large self-supervised learning (SSL) 模型的 deepfake speech detectors 能够实现高准确率,但采用标准的 ensemble fusion 来进一步增强……
测试时规模化的兴起显著提升了大型语言模型(LLMs)的推理和代理能力。然而,标准的Transformers仍然面临困难……
从空间和时间上稀疏的观测中重建完整的 spatio-temporal dynamics 仍然是复杂系统中的核心挑战,因为测量可能…
AI 天气预测发展迅速,但尚未有统一的数学框架解释什么决定了预报技能。现有理论针对特定的...
随着 LLM agents 处理日益复杂的任务,一个关键问题是它们能否在长期范围内保持 strategic coherence:在不确定性下进行 planning ……
我们提出了 TRACE,一个基于网格引导的 3DGS 编辑框架,实现了自动化、高保真度的场景转换。通过使用显式的 3…
我们提出了 RELISH(REgression with a Latent Iterative State Head),一种新颖的轻量级架构,专为使用大型语言模型进行文本回归设计。Ra...
基于基元的方法,如 3D Gaussian Splatting,最近已成为新视角合成及相关重建任务的最先进技术。Compa...
我们考虑这样一个问题:当一个大型语言推理模型做出选择时,它是先思考再决定,还是先决定再思考?在这篇…
从测量数据中学习量子态是量子信息与计算复杂性中的核心问题。在本工作中,我们研究学习……的问题。
搜索代理,将语言模型(LMs)与网络搜索相结合,正变得对回答复杂的用户查询至关重要。构建训练数据集……
大型语言模型(LLM)能否仅通过使用其自身的原始输出,在没有 verifier、teacher model 或 reinforcement learning 的情况下提升代码生成能力?We a...
本研究调查了多模态大型语言模型(LLMs)识别和解释误导性可视化的能力,并识别这些观…
标准 softmax 注意力的一个核心限制是它没有定义绝对的 query--key 相关性概念:注意力权重是通过重新分配……
准确的空气质量预测对于保护公众健康和指导环境政策至关重要,但由于非线性时空……仍然具有挑战性。
在安全关键系统中部署学习驱动的控制方法时,不确定性量化是必不可少的。通常通过构建不确定性……
虽然自监督的3D异常检测假设获取高精度点云在计算上成本高昂,但在实际制造场景中……
虽然测试时扩展使大型语言模型能够解决高度困难的任务,但最先进的结果伴随着高昂的计算成本。这些低效...
使用大约 48 个经执行验证的 HumanEval 训练解答,对每个循环层调优单个初始状态矩阵,且推理时零开销,超出……
随着用于代码的 Large Language Models(LLMs)日益使用庞大且常常是非宽松许可的数据集,评估通过 Membership… 的数据污染。
文件级缺陷预测模型传统上依赖于产品和过程指标。虽然过程指标能够有效补充产品指标,但它们往往 …
随着体育训练日益数据化,主要依赖经验和目视观察的传统飞镖教练已越来越无法满足高水平……
软件工程学生经常难以领会 empirical methods 和 hypothesis-driven inquiry,尤其是在以理论方式教授时。这 ex...
脉冲神经网络(SNN)因其事件驱动计算和稀疏活动映射自然适用于低功耗的机器智能。