machine-learning — Page 2

排序:

4天前 · ai · - · -

[Paper] 动量进一步约束了随机稳定性边缘的Sharpness

最近的研究表明，(stochastic) gradient descent 会自组织到接近不稳定边界的区域，从而塑造了优化过程以及所找到的解。Momentum...

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] UMI-3D：将 Universal Manipulation Interface 从 Vision-Limited 扩展到 3D Spatial Perception

我们提出 UMI-3D，这是一种多模态扩展的 Universal Manipulation Interface（UMI），用于在具身操作中实现稳健且可扩展的数据收集。虽然 …

#research #paper #ai #machine-learning
4天前 · ai · - · -

TIP：On-Policy蒸馏中的Token重要性

On-policy knowledge distillation (OPD) 在其自身的 rollouts 上，在来自 teacher 的 token‑level supervision 下训练 student。并非所有 token 位置的重要性相同……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 多阶段条件组合优化

我们引入 Multistage Conditional Compositional Optimization（MCCO）作为一种在不确定性下进行决策的新范式，它结合了多阶段……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 程序代码中引用解析的神经网络架构

在编程语言中，解析和重写引用是基础工作。受真实的反编译任务的启发，我们将引用重写抽象为 t...

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 先见后设：多利益相关者视角下的性能‑公平权衡最佳化

公平性在算法决策中通常在预测空间中定义，其中预测性能——用作决策者（DM）效用的代理……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 大型语言模型提升业务流程建模：过去、现在与未来趋势

生成式人工智能的最新进展，尤其是大型语言模型（LLMs），激发了人们对自动化或协助Bu...的日益兴趣。

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] Diffusion Language Models for 语音识别

Diffusion language models 最近作为标准语言模型的主要替代方案出现，原因是它们具备 bidirectional attention 和并行…

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] 软件工程的情感分析：zero-shot learning (ZSL) 能走多远？

软件工程中的情感分析侧重于理解软件制品中表达的情感。先前的研究指出了其局限性。

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 安全且隐私保护的垂直联邦学习

我们提出了一种新颖的 end-to-end 隐私保护框架，由三个高效的 protocols 实现，适用于不同的部署场景，覆盖了输入和…

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 关于在动态机会约束露天矿调度问题中使用进化优化

露天采矿调度是一个复杂的现实世界优化问题，涉及不确定的经济价值和动态变化的资源容量。Evol...

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 事件张量：用于编译动态 Megakernel 的统一抽象

现代 GPU 工作负载，尤其是大语言模型（LLM）推理，受到 kernel launch 开销和粗粒度同步的限制，这限制了 inter‑kernel 并行性。

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 视觉偏好优化与评分奖励

Direct Preference Optimization（DPO）的有效性取决于能够反映多模态任务中关键质量差异的偏好数据。存在……

#research #paper #ai #machine-learning #computer-vision
5天前 · ai · - · -

[Paper] CLAD：高效日志异常检测直接在压缩表示上

系统日志的爆炸性增长使得流式压缩变得必不可少，然而现有的日志异常检测（LAD）方法会产生严重的预处理开销……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[论文] 经典与量子加速：通过能量守恒下降实现非凸优化

Energy Conserving Descent (ECD) 算法最近由 De Luca 与 Silverstein（2022）提出，作为一种全局非凸优化方法。不同于梯度……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 表示几何形状决定视觉-语言建模在CT肠道造影中的任务性能

Computed tomography (CT) enterography 是评估炎症性肠病 (IBD) 的主要成像方式，但最佳的表征选择仍有待确定。

#research #paper #ai #machine-learning #computer-vision
5天前 · ai · - · -

[Paper] PAL：个人自适应学习者

AI驱动的教育平台在个性化方面取得了一定进展，但大多数仍受限于静态适应——预定义的测验、统一的进度、……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 重新思考大语言模型的 On-Policy 蒸馏：现象学、机制与配方

On-policy distillation (OPD) 已成为大语言模型后训练的核心技术，但其训练动态仍然了解不足。这……

#research #paper #ai #machine-learning #nlp
5天前 · ai · - · -

[Paper] Lightning OPD：针对大型推理模型的离线 On-Policy 蒸馏的高效后训练

On-policy distillation (OPD) 已经成为大语言模型的一种高效的后训练范式。然而，标准的 OPD 需要实时的教师推理……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 只差一个 Token 即崩溃：指令调优的帮助性脆弱性

Instruction-tuned 大型语言模型产生有帮助、结构化的响应，但当受到微不足道的约束时，这种帮助性有多稳健？我们展示了简…

#research #paper #ai #machine-learning #nlp
5天前 · ai · - · -

[Paper] LogicEval：用于评估真实世界软件中逻辑漏洞的自动修复技术的系统化框架

逻辑漏洞在软件中源于 program logic 的缺陷，而不是 memory safety，这可能导致关键的 security failures。虽然现有的 …

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 因果扩散模型用于纵向数据中的反事实结果分布

预测 longitudinal data 中的 counterfactual outcomes，尤其是当 sequential treatment decisions 严重依赖于不断演变的 patient states 时，既关键又极具挑战性。

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] ROSE：面向意图的 NL2SQL 评估指标

执行准确率（EX），一种广泛用于评估自然语言转SQL（NL2SQL）解决方案有效性的指标，正变得越来越不可靠……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] Parallax：为什么思考的 AI 代理绝不能行动

自主 AI 代理正迅速从实验工具转变为运营基础设施，预计 80% 的企业应用将……

#research #paper #ai #machine-learning
5天前 · ai · - · -

优化方法的演进：算法、场景与评估

在 deep learning 优化中，平衡收敛速度、泛化能力和计算效率仍然是一个核心挑战。First-order gradient…

#research #paper #ai #machine-learning #computer-vision
5天前 · ai · - · -

[Paper] 验证税：稀有错误情境下 AI 审计的基本限制

在深度学习中被引用最多的校准结果——在 CIFAR-100 上的 post-temperature-scaling ECE 为 0.012（Guo et al., 2017）——低于统计噪声的...

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] Parcae：稳定循环语言模型的尺度定律

传统的固定深度架构通过增加训练 FLOPs 来提升质量，通常通过增加参数化（parameterization），但代价是更高的内存……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] CoDe-R：使用 LLMs 通过 Rationale Guidance 与 Adaptive Inference 精炼 Decompiler 输出

二进制反编译是一项关键的逆向工程任务，旨在从已剥离的可执行文件中重建高级源代码。虽然 Large Language Model...

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 往返翻译揭示前沿多语言基准的盲点

多语言基准指导前沿模型的开发。然而，前沿模型报告的多语言评估结构类似于流行的...

#research #paper #ai #machine-learning #nlp
6天前 · ai · - · -

[Paper] 超越输出正确性：对大语言模型在编码任务中的推理进行基准测试与评估

大型语言模型（LLMs）越来越依赖显式推理来解决编码任务，但评估此类推理的质量仍然具有挑战性。Ex...

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] GeM-EA：生成式和元学习增强的进化算法用于流式数据驱动优化

流式数据驱动优化（SDDO）问题在许多应用中出现，这些应用中数据持续到达，且优化环境随时间演变……

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] Vibe Coding 是未来吗？对 LLM 生成代码在建筑安全中的实证评估

vibe coding 的出现，这是一种范式，非技术用户通过自然语言指示大型语言模型（LLMs）生成可执行代码，预…

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] Local-Splitter：七种降低云端 LLM Token 使用的策略在 Coding-Agent 工作负载中的测量研究

我们系统性地测量了七种策略，以在小型本地模型可以作为前置分流层的情况下，减少云端 LLM 的 token 使用量。

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] 去中心化学习通过带跳跃的随机游走

我们研究在网络上进行去中心化学习的情形，其中数据分布在各节点上，没有中心协调者。Random walk learning 是一种基于 token 的方法……

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] Socrates Loss: 通过利用未知统一置信度校准与分类

深度神经网络尽管具有很高的准确率，但往往表现出置信度校准不足，限制了它们在高风险应用中的可靠性。当前的…

#research #paper #ai #machine-learning #computer-vision
6天前 · ai · - · -

[Paper] EMBER：基于混合 LLM 架构的学习型 Spiking Neural Network 动力学实现自主认知行为

我们提出 (Experience‑Modulated Biologically‑inspired Emergent Reasoning)，一种混合认知架构，重新组织大型语言模型之间的关系……

#research #paper #ai #machine-learning
6天前 · ai · - · -

[论文] AI 能检测生命吗？来自人工生命的启示

现代机器学习方法已被提出用于检测外星样本中的生命，利用其区分生物性与非生物性样本的能力。

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] 基于物理的状态空间模型用于离网系统的可靠太阳辐照预测

自主离网光伏系统的稳定运行要求依赖遵循大气热力学的太阳能预测算法。Cont...

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] ClawGuard：针对间接提示注入的工具增强型 LLM 代理运行时安全框架

Tool-augmented Large Language Model (LLM) agents 已经展示了在自动化复杂、多步骤真实世界任务方面的惊人能力，但仍然存在脆弱性……

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] GenTac：生成建模与足球战术预测

对 open-play soccer tactics 的建模是一项艰巨的挑战，因为比赛具有 stochastic、multi-agent 的特性。现有的计算方法通常 p...

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] 高斯分布之间的 KL Divergence：变分自编码器目标的逐步推导

Kullback-Leibler (KL) divergence 是信息论中的一个基本概念，用于量化两个概率分布之间的差异。在 the co...

#research #paper #ai #machine-learning
6天前 · ai · - · -

[Paper] 随机矩阵和确定性矩阵上一阶方法的普适性

通用一阶方法（GFOM）是一类灵活的迭代算法，通过矩阵‑向量乘法和逐元素非线性操作来更新状态向量。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Record-Remix-Replay：使用进化搜索的层次化 GPU 内核优化

随着高性能计算和 AI 工作负载日益依赖 GPU，保持在快速演进的硬件代际中的高性能……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] NimbusGuard：一种使用Deep Q网络的主动Kubernetes自动伸缩新框架

云原生架构是关于构建和运行可扩展的微服务应用，以充分利用云环境。托管的 Kubernetes …

#research #paper #ai #machine-learning
1周前 · ai · - · -

构建一个从人工编辑中学习的 AI 聊天机器人（不仅仅是反馈）

问题：Intelligence ≠ Empathy 现代 AI 在海量数据集上进行训练，并通过诸如 reinforcement learning from human feedback 等技术进行精炼。Mo...

#chatbot #reinforcement learning #human feedback #AI training #natural language processing #machine learning
1周前 · ai · - · -

精准定价：AI 如何自动化您的handyman报价

厌倦了花费数小时手动测量照片、查找材料价格并计算报价吗？对于handyman业务来说，这类后台工作是一个主要的痛点……

#AI automation #price quoting #handyman services #computer vision #business logic #cost estimation #machine learning
1周前 · ai · - · -

理解 Transformers 第5部分：查询、键与相似度

在上一篇文章 https://dev.to/rijultp/understanding-transformers-part-4-introduction-to-self-attention-45bg 中，我们探讨了 self‑attention 概念用于 t...

#transformers #self-attention #queries-keys-values #similarity #deep learning #natural language processing #machine learning
1周前 · ai · - · -

图像分类详解——为什么 k-NN 会失效以及线性分类器的重要性

图像分类听起来很容易，直到你记得计算机从不直接看到“对象”。它只看到像素数组。本文解释了这为何使得 k‑NN 成为一种…

#image classification #k-NN #linear classifiers #computer vision #machine learning #deep learning

Newer posts

Older posts