machine-learning — Page 3

排序:

1周前 · ai · - · -

[Paper] Record-Remix-Replay：使用进化搜索的层次化 GPU 内核优化

随着高性能计算和 AI 工作负载日益依赖 GPU，保持在快速演进的硬件代际中的高性能……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] NimbusGuard：一种使用Deep Q网络的主动Kubernetes自动伸缩新框架

云原生架构是关于构建和运行可扩展的微服务应用，以充分利用云环境。托管的 Kubernetes …

#research #paper #ai #machine-learning
1周前 · ai · - · -

构建一个从人工编辑中学习的 AI 聊天机器人（不仅仅是反馈）

问题：Intelligence ≠ Empathy 现代 AI 在海量数据集上进行训练，并通过诸如 reinforcement learning from human feedback 等技术进行精炼。Mo...

#chatbot #reinforcement learning #human feedback #AI training #natural language processing #machine learning
1周前 · ai · - · -

精准定价：AI 如何自动化您的handyman报价

厌倦了花费数小时手动测量照片、查找材料价格并计算报价吗？对于handyman业务来说，这类后台工作是一个主要的痛点……

#AI automation #price quoting #handyman services #computer vision #business logic #cost estimation #machine learning
1周前 · ai · - · -

理解 Transformers 第5部分：查询、键与相似度

在上一篇文章 https://dev.to/rijultp/understanding-transformers-part-4-introduction-to-self-attention-45bg 中，我们探讨了 self‑attention 概念用于 t...

#transformers #self-attention #queries-keys-values #similarity #deep learning #natural language processing #machine learning
1周前 · ai · - · -

图像分类详解——为什么 k-NN 会失效以及线性分类器的重要性

图像分类听起来很容易，直到你记得计算机从不直接看到“对象”。它只看到像素数组。本文解释了这为何使得 k‑NN 成为一种…

#image classification #k-NN #linear classifiers #computer vision #machine learning #deep learning
1周前 · ai · - · -

多层感知器（MLP）：理解神经网络的实用方法

MLP = 一个函数而不是层大多数人认为神经网络是层的堆叠，但他们错了。一个 MLP 是：y = f(x); θ 👉 一个可学习的函数。从简单开始……

#multilayer perceptron #MLP #neural networks #deep learning #machine learning #activation function #nonlinearity
1周前 · ai · - · -

优化与正则化——模型如何学习（以及训练为何失败）

真正的问题：低 training loss ≠ 好 model。真正的目标：generalization。Optimization = Learning。Optimization 通过更新 parameters 来降低 loss。没有…

#optimization #regularization #machine learning #gradient descent #model training #debugging #generalization
1周前 · software · - · -

为什么你的 pip install 输出不属于 Claude 的上下文

问题：在机器学习项目中运行 `pip install -r requirements.txt` 时，控制台会输出数百行内容：下载进度条，w...

#pip #python #package-installation #AI-debugging #Claude #machine-learning #output-parsing
1周前 · ai · - · -

[Paper] 眼见为实：在标签噪声下的鲁棒视觉引导跨模态提示学习

Prompt learning 是一种参数高效的视觉语言模型方法，但其在标签噪声下的鲁棒性研究较少。视觉内容包含……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] VisionFoundry：使用合成图像教授 VLMs 视觉感知

视觉语言模型（VLMs）仍然在视觉感知任务（如空间理解和视点识别）上表现困难。一个可能的促成因素是...

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] VL-Calibration：大型视觉‑语言模型推理的解耦置信度校准

大型视觉语言模型（LVLMs）在多模态推理方面表现出色，但常常出现幻觉并以高度确定性给出错误答案，……

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] RecaLLM：通过显式上下文检索解决思维丢失现象

我们提出了 RecaLLM，这是一套经过后训练的推理语言模型，旨在有效利用长上下文信息。In‑context retrieval（上下文检索），用于识别……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] XFED：非协作式模型投毒攻击针对拜占庭鲁棒的联邦分类器

模型投毒攻击对联邦学习（FL）构成了显著的安全威胁。大多数现有的模型投毒攻击依赖于合谋，需要对手...

#research #paper #ai #machine-learning
1周前 · ai · - · -

【论文】NOMAD：为大规模分布式图生成嵌入

成功的 machine learning 在 graphs 或 networks 上需要 embeddings，这些 embeddings 不仅将 nodes 和 edges 表示为 low-dimensional vectors，还要保留 …

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] King Wen 序列的统计特性：一种不提升神经网络训练的抗习惯化结构

《易经》King Wen序列（约公元前1000年）将64卦——六维二进制空间的状态——按一种模式排列，这一模式长期困扰着学者……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 快速通道假说：Von Economo 神经元实现生物学的速度‑准确性权衡

Von Economo neurons (VENs) 是大型双极投射神经元，仅在具有复杂...的物种的前扣带皮层 (ACC) 和额叶岛叶中发现。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] MATCHA：在多加速器异构边缘SoC上高效部署深度神经网络

在具有多个异构加速引擎的系统级芯片（SoC）上部署深度神经网络（DNN）具有挑战性，而且大多数部署框架无法完全 …

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] TensorHub：可扩展且弹性的权重转移用于 LLM 强化学习训练

现代 LLM 强化学习（RL）工作负载需要一个高效的 weight transfer system，以在异构计算资源上扩展训练……

#research #paper #ai #machine-learning
1周前 · ai · - · -

训练示例李括号

训练样本是向量场。如果我们正在训练一个参数为 θ，θ ∈ Θ = ℝ^{num params} 的神经网络，那么我们可以把每个 t…

#machine learning #gradient descent #neural networks #Lie bracket #vector fields #training dynamics #convnet
1周前 · ai · - · -

[Paper] 明智行动：在代理式多模态模型中培养元认知工具使用

代理式多模态模型的出现使系统能够主动与外部环境交互。然而，当前的代理在…

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] SIM1：Physics-Aligned Simulator 作为可变形世界中的 Zero-Shot 数据缩放器

机器人操作可变形物体代表了具身学习中数据密集的范式，其中形状、接触和拓扑以相互共演的方式……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 眼见却不思考：多模态 Mixture-of-Experts 中的路由干扰

多模态混合专家（MoE）模型在视觉语言任务上取得了显著的性能。然而，我们发现了一种令人困惑的现象，称为 Seei…

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] AVGen-Bench：面向任务的多粒度文本到音频视频生成评估基准

Text-to-Audio-Video (T2AV) 生成正迅速成为媒体创作的核心接口，但其评估仍然碎片化。现有基准在很大程度上…

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] OpenVLThinkerV2：用于多领域视觉任务的通用多模态推理模型

Group Relative Policy Optimization (GRPO) 已成为推动最近在多模态大型语言模型领域进展的事实上的强化学习 (RL) 目标。

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] Meta-learning In-Context 实现 Training-Free Cross Subject 脑解码

Visual decoding from brain signals 是计算机视觉和神经科学交叉领域的关键挑战，需要能够桥接神经表征……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] RewardFlow：通过优化奖励生成图像

我们引入 RewardFlow，这是一种无反演框架，在推理时通过多奖励 Langevin 动力学引导预训练的 diffusion 和 flow‑matching 模型。

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] PSI：共享状态作为个人 AI 代理中连贯 AI 生成工具的缺失层

个人 AI 工具现在可以通过自然语言请求生成，但它们在创建后往往仍然是孤立的。我们提出了 PSI，一种共享状态的架构……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 揭开 OPD 的面纱：长度膨胀与大语言模型的稳定化策略

On-policy distillation (OPD) 在学生模型自身产生的分布下进行训练，同时利用更强教师的监督。我们识别出一个失败…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] AI 聊天机器人中的广告？大型语言模型如何应对利益冲突的分析

当今的大型语言模型（LLMs）通过强化学习等方法进行训练，以对齐用户偏好。然而，模型正开始被 d...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[论文] 什么驱动 Representation Steering？关于 Steering Refusal 的机制性案例研究

将 steering vectors 应用于大型语言模型（LLMs）是一种高效且有效的模型对齐技术，但我们缺乏可解释的说明。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] ClawBench：AI代理能完成日常在线任务吗？

AI agents 可能能够自动处理你的 inbox，但它们能否自动化你生活中的其他常规方面？日常在线任务提供了一个现实且尚未解决的测试…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 差分隐私语言生成与极限识别

我们在不同性约束下，开启对语言生成极限模型的研究，该模型由 Kleinberg 和 Mullinathan [KM24] 最近提出。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] PIArena：Prompt Injection 评估平台

Prompt injection attacks 在广泛的实际应用中构成严重的安全风险。尽管受到越来越多的关注，社区仍面临……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 维度对节点嵌入稳定性的影响

先前的研究已经表明，基于神经网络的节点嵌入在相同数据集上使用相同参数进行训练时会产生不同的结果，ju...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] SUPERNOVA：在 LLM 中通过对自然指令的强化学习引发通用推理

可验证奖励强化学习（RLVR）显著提升了大语言模型（LLM）在数学等形式化领域的推理能力……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 量化对航空航天预测性维护中联邦学习的准确性与通信效率权衡的影响

联邦学习（FL）实现了跨分布式航空机队的隐私保护预测性维护，但梯度通信开销限制了……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 持久性增强神经网络

拓扑数据分析（TDA）提供了描述数据形状的工具，但将拓扑特征整合到深度学习流水线中仍然具有挑战性……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] TTVS：通过测试时变分合成提升自探索强化学习

尽管在由可验证奖励强化学习（RLVR）驱动的大规模推理模型（LRMs）方面取得了显著进展，但这种范式在根本上是…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 多模态学习遇上遗传编程：潜在空间优化中的对齐分析

符号回归（Symbolic regression，SR）旨在从数据中发现数学表达式，这一任务传统上通过组合式的遗传编程（Genetic Programming，GP）来实现……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 引入 Echo Networks 用于计算神经进化

对于极端边缘的应用，仅有几十个人工神经元的极小网络用于离散时间信号中的事件检测和分类……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] LegoDiffusion：微服务文本到图像扩散工作流

文本到图像生成执行一个以 base diffusion model 为核心的 diffusion workflow，涉及多个模型。现有的 serving 系统将每个 workflow…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] LogAct：通过共享日志实现代理可靠性

Agents 是由 LLM 驱动的组件，能够以强大且任意的方式改变环境。提取在生产环境中执行 Agents 的保证……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] Kuramoto振荡相位编码：受神经启发的同步以提升学习效率

Spatiotemporal neural dynamics 和 oscillatory synchronization 被广泛认为在 biological information processing 中起重要作用，并被假设支持……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] PyVRP$^+$：LLM驱动的元认知启发式进化用于车辆路径问题的混合遗传搜索

为 NP 难组合优化问题（如车辆路径问题（VRP））设计高性能的元启发式算法仍然是一个重大挑战。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 自动配置网络用于多尺度多输出时间序列预测

工业预测通常涉及多源异步信号和多输出目标，而部署则需要在预测…之间进行明确的权衡。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 快速空间记忆与弹性测试时训练

Large Chunk Test-Time Training (LaCT) 已在长上下文 3D 重建中展示了强大的性能，但其完全可塑的推理时更新仍然脆弱……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 朝向可解性前沿的精确相关性认证

Exact relevance certification 询问在坐标结构化决策问题中，哪些坐标是确定最优行动所必需的。可处理的 fa...

#research #paper #ai #machine-learning

Newer posts

Older posts