当我尝试用 AI 做所有事情时,适得其反
打破预期 我们往往假设最大化工具使用等同于最大化优势:使用 AI 越多,价值越大。但这种假设会因为……
打破预期 我们往往假设最大化工具使用等同于最大化优势:使用 AI 越多,价值越大。但这种假设会因为……
引言 多年来,人工智能的进展与规模定律密切相关,随着模型规模、数据集规模和计算能力的提升,导致……
!AI Bug Slayer 🐞https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploa...
自信的错误——或者说谎——是 a c...
大多数人把学习音乐当作播放列表的问题。他们打开一个 lo‑fi 混音,跳过几首曲目,期待氛围合适。对于开发者、作家、学生,以及…
2026年4月14日
Bloomberg Terminal的日益复杂 由于其著名的难以驾驭,Bloomberg Terminal长期以来激发了人们的奉献精神,几乎达到痴迷的程度。在交易员中……
更新 2026年4月28日 – 18:33 UTC 我们正在继续努力解决阻止用户访问 Claude.ai 的问题,以及导致身份验证提升的情况。
递归或循环语言模型最近作为一种新的扩展轴出现,通过在潜在状态上迭代细化相同的模型计算来加深 …
现实世界的数据可视化(DV)需要本土环境的落地、跨平台的演进以及主动的意图对齐。然而,现有的基准 o...
在仅有输出级监督的后训练阶段,将推理模型适配到新任务时,会在可验证奖励的强化学习(RLVR)下停滞。
身份教师强制(ITF)能够实现对混沌动力系统的确定性递归代理模型的稳定训练,并且在动力学方面表现出极高的有效性。
分布式和神经方法在自然语言语义学中几乎完全建立在传统线性代数之上:vectors, matrices, tensors……
持续离线强化学习(CORL)旨在从随时间收集的数据集中学习一系列任务,同时保持对先前任务的性能……
接触变异性、感知不确定性和外部扰动使抓取执行具有随机性。期望质量目标忽略尾部结果,且常常 …
基于偏好的对齐方法,最突出的是人类反馈强化学习(Reinforcement Learning with Human Feedback,RLHF),利用人类标注者的判断来塑造大型语言模型……
对语言模型进行微调可能导致出现性错位(EM)[Betley et al., 2025b]。在狭窄的 misaligned behavior genera 分布上训练的模型……
当前的 deepfake 检测模型在干净的学术数据集上实现了 state-of-the-art 性能,但在真实世界中会出现严重的 spatial attention drift。
当前的人行横道信号采用固定时序,未根据行人行为进行调整,这可能会使易受伤害的道路使用者(VRUs)如……
图神经网络(如 ParticleNet)和基于点云的 transformer 网络(如 ParticleTransformer)在 jet 上实现了最先进的性能。
量子计算校准依赖于对实验数据的解释,而校准图提供了最通用的人类可读表示……
通过 reinforcement learning 训练语言模型通常依赖于不完美的 proxy rewards,因为能够精确定义预期行为的 ground truth rewards 并不存在……
大型语言模型(LLMs)正越来越多地用于情感敏感的人机交互应用,但对于情感识别在内部是如何实现的知之甚少。
现有的 REST API 测试工具通常使用 code coverage 和 crash-based fault metrics 进行评估。然而,最近基于 LLM 的方法越来越多地生成…
机器生成文本(MGT)检测需要在不同生成模型之间识别结构上不变的信号,而不是依赖于特定模型的指纹……
多模态大语言模型(MLLMs)在视觉语言任务上取得了越来越强的性能。即使传统的视觉问答基准……
传统的损失函数,包括 cross-entropy、contrastive、triplet 和 supervised contrastive 损失,用于微调预训练语言模型……
Patient simulators 正在 mental health training 中获得关注,因为它们提供了对复杂且敏感的 patient interactions 的可扩展曝光。Simulating depre…
在本工作中,我们提出了 Mutual Forcing,一种用于快速自回归音视频生成并实现长时域音视频同步的框架。我们的做法……
Magnification shift 是实现稳健的 histopathology 分类的主要障碍,因为在一种成像尺度上训练的模型往往在另一种尺度上泛化能力差……
视觉语言模型(VLMs)在指令遵循和开放式视觉语言推理方面表现出色,但它们经常生成流畅的 ...
Knowledge distillation (KD) 是一种广为人知的技术,能够在几乎不牺牲性能的情况下,将大型网络(teacher)有效压缩为更小的网络(student)……
知识蒸馏(KD)是将复杂教师网络的专业知识转移到高效学生模型中的关键机制。然而,在去中心化…
Google 翻译新增发音练习。Google 正在庆祝 Translate 20 周年,通过推出发音练习,公司称这是一项…
关节建模旨在推断3D对象的可移动部件及其运动参数,从而实现交互式动画、仿真和形状编辑。在……
指令式代码编辑是大型语言模型(LLMs)的一个重大挑战。在 EditBench 基准测试中,40 个评估模型中有 39 个实现了任务成功……
源代码及其伴随的注释是互补且自然对齐的模态——代码编码结构逻辑,而注释捕捉开发者意图……
时间序列分类是跨多个领域的重要分析任务。然而,由于标签的稀缺,它的实际应用常常受到阻碍。
TL;DR - Google 正在开发…
TL;DR - Android Authority 拆解。
引言 这是我的第一篇帖子,所以直接说重点:x402 代理经济正蓬勃发展,但其中大多数服务都是垃圾。我知道这听起来……
nvidia/NV-Raw2Insights-US 已更新3天前...
扩展的合作伙伴概览 今天,OpenAI 与 AWS 正在扩大我们的战略合作伙伴关系,以帮助企业在其 AWS 环境中使用 OpenAI 能力进行构建……
在 Spark 中,自定义 policy-learning 流水线因两个耦合系统的原因而失败:逐行 Python 执行使推断变得不切实际,以及 driver-side 候选 …
研究概述:研究人员使用来自 Internet Archive 的数据发现,自2022年以来创建的三分之一网站是 AI‑generated,依据……
April 16, 2026 在快速演变的大型语言模型 LLMs 领域,预训练仅是第一步。要将基础模型转变为专用模型……
万物互联 (IoE) 代表了物联网 (IoT) 的演进,通过将人、数据、流程和事物整合到一个统一的智能体系中……