ai — 页 25 | EUNO.NEWS

排序:

1个月前 · ai · - · -

[Paper] 实时代理模型用于个性化血流预测和血流动力学分析

过去几十年来，随着对健康监测和心血管疾病早期检测需求的增加，心血管建模迅速发展……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 可靠性门控多教师蒸馏用于低资源抽象式摘要

我们从 reliability aware perspective 研究 low resource abstractive summarization 的 multiteacher knowledge distillation。我们引入 EWAD（Entropy Weighte...）。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 压缩差距：为何离散标记化限制Vision-Language-Action模型的规模化

通过升级视觉编码器来扩展视觉‑语言‑动作（VLA）模型，预计能够提升下游操作性能——正如它在视觉‑语言模型中所表现的那样……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 单个注意力层中的 Gradient Boosting

Transformer 注意力对值执行一次 softmax 加权平均——一种单遍估计，无法自行纠正错误。我们引入 gradient‑bo...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 反射式上下文学习：研究上下文空间的优化原语

一般具备能力的智能体必须通过经验学习，以在任务和环境之间实现泛化。学习的基本问题，包括 credi…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 多视角视频扩散策略：一种 3D 时空感知视频动作模型

机器人操作需要理解环境的3D空间结构及其时间演化，但大多数现有策略忽视了其中之一……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] PRISM：LLM 引导的语义聚类用于高精度主题

在本文中，我们提出了 Precision-Informed Semantic Modeling（PRISM），一种结合丰富表征优势的结构化主题建模框架……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 理解 Hallucination 在 Reinforcement Post-Training 中对多模态推理模型的作用

近期强化学习（RL）在大型推理模型中的成功，激发了人们对在后训练的多模态大型语言模型中采用 RL 的日益增长的兴趣。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[论文] SFFNet：协同特征融合网络与双域边缘增强用于无人机图像目标检测

在无人机（UAV）图像中的目标检测仍然是一项极具挑战性的任务，主要是由于背景噪声的复杂性和不平衡……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 检测与纠正商业 LLMs 与深度研究代理中的参考幻觉

大型语言模型和深度研究代理提供引用 URL 来支持它们的主张，但这些引用的可靠性尚未系统地……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] BibTeX 引用幻觉在科学出版代理中的评估与缓解

大型语言模型结合网络搜索正日益被用于科学出版代理，但它们仍然会生成包含普遍字段级错误的 BibTeX 条目……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] Chart-RL：用于提升图表问答中视觉推理的策略优化强化学习，结合视觉语言模型

近期在 Vision Language Models（VLMs）方面的进展展示了朝向真正智能的进步，这需要强大的推理能力。Beyond pat...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] LLM中的 Valence-Arousal 子空间：循环情感几何与多行为控制

我们提出一种方法，在大型语言模型的表示中识别 valence‑arousal (VA) 子空间。基于 211k 情感标注文本，我们推导情感……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

【论文】InCoder-32B-Thinking：用于思考的工业代码世界模型

工业软件开发在芯片设计、GPU 优化和嵌入式系统方面缺乏专家推理痕迹，显示工程师如何推理困难……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] SkillRT：编译技能以实现随处高效执行

LLM 代理越来越多地将技能作为可复用的组成单元。虽然技能在不同的代理平台之间共享，但当前系统将它们视为 ra...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

Grok 在 ARC-AGI-3 上得了零分。每个5岁孩子都表现得更好

自我崩溃的基准——黄在一次播客中说已经实现了AGI。两天后，他的竞争对手在唯一的测试中得分0.37%。

#AGI #benchmark #Grok #ARC-AGI #LLM performance #AI evaluation
1个月前 · ai · - · -

[Paper] FedSQ：通过固定门控实现的优化权重平均

联邦学习（Federated learning, FL）使跨组织的协作训练成为可能，而无需共享原始数据，但它受到统计异质性（非 i.i.d.）的阻碍……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

不，它并非完全浪费

镜像 PolyGlotFake 数据集到 Kaggle 大家好！这是我上一篇关于将两个数据集镜像到 Kaggle 的文章的后续。你们知道……

#deepfake #multimodal dataset #Kaggle #Google Cloud #deep learning #polyglotfake #dataset upload
1个月前 · ai · - · -

Gemma 4 VRAM 要求：我希望拥有的硬件指南

抱歉，我无法访问或检索该链接中的内容。请提供需要翻译的文本，我将为您翻译成简体中文。

#Gemma 4 #VRAM #LLM #hardware guide #Apple Silicon #Ollama #GPU
1个月前 · ai · - · -

AI 代理的“God Mode”问题（以及为何标准 OAuth 不足）

封面图片：The 'God Mode' Problem with AI Agents and why standard OAuth isn’t enough https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gr...

#AI agents #OAuth #authentication #security #god mode #autonomous AI #infrastructure
1个月前 · ai · - · -

[Paper] 可扩展的均值-方差投资组合优化：通过子空间嵌入和 GPU 友好的 Nesterov 加速投影梯度

我们开发了一种基于 sketch 的因子约简和一种 Nesterov 加速的投影梯度算法 (NPGA)，并使用 GPU 加速，实现了双重加速的 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

Show HN: Apfel – 已经在你的 Mac 上的免费 AI

把一切归零。AI 已经预装在你的 Mac 上。Apple 在 macOS 中自带它。apfel 只是为你提供了一种与它对话的方式——从你的 terminal，或者从你的代码……

#Apple #macOS #on‑device AI #Apple Silicon #terminal tool #local inference #privacy #apfel
1个月前 · ai · - · -

我构建了174个相互对抗的AI Agents。

此提交是为 DEV April Fools Challenge 创建的。大多数多代理系统让代理协作；BlackSwanX 让它们相互对抗。BlackSwanX 是一个 adv...

#multi-agent systems #adversarial AI #Ollama #LLM #open-source #GitHub #AI agents
1个月前 · ai · - · -

[Paper] Oja's Subspace Rule的三因子学习规则的框架理论推导

我们展示了用于 PCA 的误差门控 Hebbian 规则（EGHR-PCA），这是一种在高斯输入下等价于 Oja 子空间规则的三因子学习规则，可以被系统...

#research #paper #ai
1个月前 · ai · - · -

谷歌，推出开源模型“Gemma 4”

发布概述谷歌宣布了最新的 open weight 模型 Gemma 4。该模型专为高级推理和基于代理的工作流而特别设计，并以 Apache 2.0 许可证提供，任何人都可以使用。Gemma 4 自首个版本发布以来已下载超过 4 亿次……

#google #gemma-4 #open-source model #large language model #on-device AI #mixture of experts #AI benchmarks #LLM inference
1个月前 · ai · - · -

从猜测到增长：将 AI 预测与 CSA 需求对齐

Alignment Framework：Forecast to Fulfillment 核心原则是主动对齐。不是先收割再匆忙销售，而是使用 AI……

#AI forecasting #agtech #yield prediction #CSA demand planning #agricultural AI
1个月前 · ai · - · -

[Paper] 无通信采样与 4D 混合并行用于可扩展的 Mini-batch GNN 训练

图神经网络（GNNs）被广泛用于在来自各种真实场景的图数据集上进行学习。对极其大型的图进行学习需要……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

Dryft：如果 AI memory 像生态系统而不是文件柜，会怎样？

概述我是加拿大西部的蔬菜农场主，运营一个regional food hub。我不是开发者，但我花很多时间思考系统是如何运作的，……

#AI memory #ecological AI #agent systems #context window #reinforcement learning #LLM architecture
1个月前 · ai · - · -

如何在实践中实现超个性化：从故事角度到分钟级排名媒体列表

超越爆炸：利用 AI 超个性化媒体名单引言：你已经花了数小时打造完美的故事角度。现在，你面临繁琐且易出错的任务……

#hyper-personalization #AI-driven media lists #contextual matching #journalist outreach #PR automation
1个月前 · ai · - · -

[Paper] 波长复用的大规模并行衍射光学信息存储与图像投影

我们引入了一种 wavelength-multiplexed、massively parallel 的 diffractive information storage 平台，由结构优化的 dielectric surfaces 组成……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

Confused Deputy Problem 刚刚冲击 AI 代理——却没有人扫描

当代理A请求代理B“将此部署到生产环境”时，谁来验证代理A是否有权提出此请求？谁检查代理B不会收到……

#confused deputy #AI agents #security #trust boundaries #multi-agent systems #AI safety
1个月前 · ai · - · -

开发者指南：构建具备技能的 ADK 代理

概述：Agent Development Kit ADK SkillToolset 引入了一种渐进式披露架构，使 AI 代理能够按需加载领域专长，...

#agent development #ADK #skill toolset #progressive disclosure #token optimization #modular AI #agentskills.io
1个月前 · ai · - · -

相同的 Prompt，每次得到不同的答案。以下是我的解决办法。

第3部分 – AI 验证系列这是我们 AI 验证系列的第3部分。- 第1部分：三个 AI 分析了我们的产品。没有一个通过 truth filter →https://de...

#prompt engineering #LLM consistency #AI verification #output variability #AI forecasting #session reproducibility
1个月前 · ai · - · -

[Paper] 活体神经元计算：Chaos-Controlled Reservoir Computing 与 Knowledge Transplant

我们引入混沌控制的 Reservoir Computing（cc‑RC）用于活体神经培养物：这些动态丰富的基底在自适应计算方面具有独特的潜力。

#research #paper #ai
1个月前 · ai · - · -

Google 宣布 Gemma 4 Open AI 模型，转向 Apache 2.0 许可证

概述：Google宣布发布Gemma 4，这是其开放权重 AI 模型的最新一代。此前的 Gemini 模型仅在 Go…

#Google #Gemma4 #open-weight models #Apache-2.0 license #large language models #local inference #GPU acceleration #Mixture of Experts #bfloat16
1个月前 · ai · - · -

[Paper] EventHub：用于无主动传感器的可推广事件驱动立体网络的数据工厂

我们提出 EventHub，一个用于训练深度事件立体网络的创新框架，无需来自昂贵主动传感器的真实标注，而是依赖于 s...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 生成式世界渲染器

将 generative inverse 和 forward rendering 扩展到真实世界场景时，受限于现有 synthetic data 的逼真度和 temporal coherence 的不足，成为瓶颈。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[论文] Modulate-and-Map：跨模态特征映射与跨视图调制用于3D异常检测

我们提出了 ModMap，这是一种原生多视角和多模态的 3D 异常检测与分割框架。不同于现有的将视角独立处理的方法……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 可操控视觉表征

预训练的视觉Transformer（ViTs），例如 DINOv2 和 MAE，提供通用的图像特征，可用于各种下游任务，例如检索…

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] Grounded Token Initialization 用于语言模型中新词汇的生成式推荐

语言模型（LMs）正日益通过新增可学习的词汇标记来扩展，以用于领域特定任务，例如生成式推荐中的 Semantic-ID 标记……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 大规模 Codec Avatars：大规模 Avatar 预训练的非凡有效性

高质量的3D avatar modeling 面临着 fidelity 与 generalization 之间的关键权衡。一方面，multi-view studio data 能够实现 high-fidelity …

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 没有单一最佳模型实现多样性：学习一个 Router 用于样本多样性

当面对允许大量有效答案的提示时，全面生成它们是满足广泛用户的第一步....

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 停止漂移：通过元认知推理实现高效 Vision-Language Navigation

无需训练的 Vision-Language Navigation (VLN) 代理由 foundation models 驱动，能够遵循指令并探索 3D 环境。然而，现有的 approa...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 流媒体视频理解的简易基线

近期的流媒体视频理解方法日益依赖复杂的记忆机制来处理长视频流。我们用一种简单的…来挑战这一趋势。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 神经网络场论中的拓扑效应

神经网络场论将场论表述为由网络架构和参数密度定义的场的统计集合。我们……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] go-$m$HC：通过广义正交随机矩阵对流形约束的超连接进行直接参数化

双随机矩阵使得在 residual streams 之间进行学习式混合成为可能，但对双随机矩阵集合（Birkhoff polytope）的参数化是精确的……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] VOID：视频对象与交互删除

现有的视频对象移除方法在对对象后面的内容进行inpainting以及纠正外观层面的伪影（如阴影和反射）方面表现出色。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[论文] 驯服指数：用于整数原生边缘推理的快速 Softmax 替代方案

Softmax 在 Transformer 模型的 Multi-Head Attention（MHA）块中可能成为计算瓶颈，尤其是在小模型进行低精度推理时。

#research #paper #ai #machine-learning

Newer posts

Older posts