ai — 页 17 | EUNO.NEWS

排序:

2周前 · ai · - · -

[Paper] 大型语言模型提升业务流程建模：过去、现在与未来趋势

生成式人工智能的最新进展，尤其是大型语言模型（LLMs），激发了人们对自动化或协助Bu...的日益兴趣。

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] Diffusion Language Models for 语音识别

Diffusion language models 最近作为标准语言模型的主要替代方案出现，原因是它们具备 bidirectional attention 和并行…

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

我们如何测量自主AI的情感（以及我们的发现）

问题如果你让一个 AI 系统全天候运行 14 个月——检查电子邮件、维持情绪状态、创作作品——它会不会发展出某种类似于…

#affective computing #autonomous AI #emotion measurement #Anthropic Claude #AI monitoring #Soma system
2周前 · ai · - · -

[论文] CollabCoder：通过协作式决策实现计划-代码协同演化，实现高效代码生成

自动代码生成仍然是软件工程中的一个持久挑战，因为传统的 multi-agent 框架常常受到 static planning 的限制……

#research #paper #ai #nlp
2周前 · ai · - · -

5个实用技巧，将批处理数据管道转变为实时：即将举办的网络研讨会

本文为您提供五个实用技巧，帮助您充分利用现代化工作。欢迎参加我们即将举办的网络研讨会，了解更多信息 https://streamyard.co...

#ai #data-science #tutorial
2周前 · ai · - · -

Reid Hoffman 对“tokenmaxxing”辩论发表看法

背景：在Meta因AI leaderboard泄露给媒体的新闻而关闭其内部的“tokenmaxxing”仪表板几天后，LinkedIn联合创始人兼v...

#tokenmaxxing #AI tokens #AI usage metrics #Reid Hoffman #Meta AI dashboard #AI adoption tracking
2周前 · ai · - · -

[Paper] 软件工程的情感分析：zero-shot learning (ZSL) 能走多远？

软件工程中的情感分析侧重于理解软件制品中表达的情感。先前的研究指出了其局限性。

#research #paper #ai #machine-learning
2周前 · ai · - · -

研究：回归基础方法在语言分析中可匹配或超越 AI

!GettyImages-1458045238https://content.presspage.com/uploads/1369/3c19652c-e1d6-4b8d-b8cf-f792bbba3da0/1920_gettyimages-1458045238.jpg > “有一种日益增长的假设……”

#language analysis #AI vs baseline methods #natural language processing #study #text-to-speech
2周前 · ai · - · -

Inside VAKRA：推理、工具使用与代理的失效模式

ibm-research/VAKRA Viewer • 更新于15天前 • 1.33k • 1.35k • 41...

#VAKRA #AI agents #reasoning #tool use #failure modes #large language models #Hugging Face
2周前 · ai · - · -

[Paper] 自维持神经元群体的建模（无外部刺激）

在缺乏持续外部输入的情况下，自我维持的神经活动是神经系统动力学的基本特征，然而其出现的条件……

#research #paper #ai
2周前 · ai · - · -

Agents SDK 的下一次演进

介绍我们正在为 Agents SDK（https://developers.openai.com/api/docs/guides/agents）引入新功能，为开发者提供标准化的基础设施……

#OpenAI #Agents SDK #AI agents #model-native infrastructure #sandbox execution #developer tools #agent tooling
2周前 · ai · - · -

Gemini 可能很快会更像同事，而不是聊天机器人

TL;DR - Google 正在 Gemini Enterprise 中测试 “Agent” 选项卡。- 新的设置让您能够为不同的工作流创建、管理和部署多个 AI 代理。

#Google Gemini #AI agents #enterprise AI #workflow automation #multi‑step AI #AI product launch #Claude Cowork #AI tools
2周前 · ai · - · -

认识 HoloTab by HCompany。您的 AI 浏览器伴侣。

我们构建了全球最强大的计算机使用 AI 之一，并让它可以直接在浏览器中访问。3 月 31 日，我们发布了 Holo3https://huggin...

#AI browser companion #HoloTab #HCompany #Hugging Face #LLM-powered assistant #product launch
2周前 · ai · - · -

[Paper] 脉冲神经网络内部噪声的一般方面

本研究考察了加性噪声和乘性噪声对单个泄漏积分‑发放（LIF）神经元以及训练后的脉冲神经网络的影响……

#research #paper #ai
2周前 · ai · - · -

Claude 在某些情况下可能需要身份验证

对强大技术负责任的第一步是了解使用它的人是谁。身份验证帮助我们防止滥用，执行我们的使用政策，并且……

#Claude #Anthropic #identity verification #AI safety #user authentication #platform compliance
2周前 · ai · - · -

Google Gemma 4 在 iPhone 上原生运行，支持完整离线 AI 推理

概述：设备端 AI 多年来一直是热门话题，但谷歌的最新举措让人更难忽视。Gemma 4，谷歌的开源模型系列，现在……

#Gemma 4 #on-device AI #offline inference #iPhone #edge AI #Google
2周前 · ai · - · -

[Paper] 安全且隐私保护的垂直联邦学习

我们提出了一种新颖的 end-to-end 隐私保护框架，由三个高效的 protocols 实现，适用于不同的部署场景，覆盖了输入和…

#research #paper #ai #machine-learning
2周前 · ai · - · -

[论文] 旅行中装箱的贪婪方法：确定性和随机约束

旅行窃贼问题（TTP）是一种著名的多组件优化问题，捕捉了两个组件之间的相互依赖：旅行路线跨越……

#research #paper #ai
2周前 · ai · - · -

提升训练有效吞吐量：连续检查点如何在 Orbax 和 MaxText 中优化可靠性

在 Orbax 和 MaxText 中新引入的 continuous checkpointing 功能旨在优化模型在可靠性和性能之间的平衡……

#continuous checkpointing #Orbax #MaxText #model training #reliability #I/O optimization #large‑scale training
2周前 · ai · - · -

通过 agent skills 弥合知识差距

大型语言模型（LLMs）拥有固定的知识，它们在特定时间点进行训练。软件工程实践节奏快且经常变化，……

#large language models #agent skills #knowledge gap #Google DeepMind #AI tools
2周前 · ai · - · -

开发者指南：构建具备技能的 ADK 代理

概述：Agent Development Kit（ADK）SkillToolset 引入了“progressive disclosure”架构，使 AI 代理能够按需加载领域专长……

#agent development #ADK #skill toolset #progressive disclosure #token optimization #modular AI #agentskills.io
2周前 · ai · - · -

[Paper] 关于在动态机会约束露天矿调度问题中使用进化优化

露天采矿调度是一个复杂的现实世界优化问题，涉及不确定的经济价值和动态变化的资源容量。Evol...

#research #paper #ai #machine-learning
2周前 · ai · - · -

多智能体系统中的令牌效率——我们如何削减60%的令牌浪费

介绍我们同时运行 13 个 AI 代理。每消耗一个 token 都是花钱。在观察 token 数量攀升了一周后，我们审计了所有内容并且 disc...

#token efficiency #multi-agent systems #LLM cost optimization #prompt engineering #structured communication #AI agents
3周前 · ai · - · -

[Paper] 事件张量：用于编译动态 Megakernel 的统一抽象

现代 GPU 工作负载，尤其是大语言模型（LLM）推理，受到 kernel launch 开销和粗粒度同步的限制，这限制了 inter‑kernel 并行性。

#research #paper #ai #machine-learning
3周前 · ai · - · -

使用免费 LLM API 构建自主 AI 代理：实用指南

LLM API简介 LLM API 是基于云端的服务，提供对预训练语言模型的访问，允许开发者集成 AI 能力……

#autonomous agents #LLM APIs #free LLM services #Hugging Face Transformers #AI automation #practical guide
3周前 · ai · - · -

【论文】Lyra 2.0：可探索的生成式3D世界

最近在视频生成方面的进展使得3D场景创建出现了新范式：生成受摄像机控制的视频，以模拟场景漫游，然后提升……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] SceneCritic：用于 3D 室内场景合成的符号评估器

大型语言模型（LLMs）和视觉语言模型（VLMs）越来越多地通过布局和场景图等中间结构生成室内场景。

#research #paper #ai #nlp #computer-vision
3周前 · ai · - · -

[Paper] 生成式细化网络用于视觉合成

虽然扩散模型在视觉生成领域占据主导地位，但它们在计算上效率低下，对所有扩散过程都采用统一的计算努力。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 视觉偏好优化与评分奖励

Direct Preference Optimization（DPO）的有效性取决于能够反映多模态任务中关键质量差异的偏好数据。存在……

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] 融合逆向建模生成多样且诱导温度变化的城市植被模式

城市地区因快速城市化和气候变化而日益容易受到热极端的影响。传统上，热极端的监测……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] CLAD：高效日志异常检测直接在压缩表示上

系统日志的爆炸性增长使得流式压缩变得必不可少，然而现有的日志异常检测（LAD）方法会产生严重的预处理开销……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[论文] 经典与量子加速：通过能量守恒下降实现非凸优化

Energy Conserving Descent (ECD) 算法最近由 De Luca 与 Silverstein（2022）提出，作为一种全局非凸优化方法。不同于梯度……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 表示几何形状决定视觉-语言建模在CT肠道造影中的任务性能

Computed tomography (CT) enterography 是评估炎症性肠病 (IBD) 的主要成像方式，但最佳的表征选择仍有待确定。

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] 看、指、细化：基于视觉反馈的 GUI 定位多轮方法

计算机使用代理（Computer Use Agents，CUAs）根本上依赖图形用户界面（graphical user interface，GUI）基础，将语言指令转换为可执行的屏幕操作，但……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 迈向自主长时程工程用于ML研究

自主 AI 研究发展迅速，但长期视野的 ML 研究工程仍然困难：代理必须在任务理解上保持连贯的进展……

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] PAL：个人自适应学习者

AI驱动的教育平台在个性化方面取得了一定进展，但大多数仍受限于静态适应——预定义的测验、统一的进度、……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 重新思考大语言模型的 On-Policy 蒸馏：现象学、机制与配方

On-policy distillation (OPD) 已成为大语言模型后训练的核心技术，但其训练动态仍然了解不足。这……

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] Lightning OPD：针对大型推理模型的离线 On-Policy 蒸馏的高效后训练

On-policy distillation (OPD) 已经成为大语言模型的一种高效的后训练范式。然而，标准的 OPD 需要实时的教师推理……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 只差一个 Token 即崩溃：指令调优的帮助性脆弱性

Instruction-tuned 大型语言模型产生有帮助、结构化的响应，但当受到微不足道的约束时，这种帮助性有多稳健？我们展示了简…

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] PolicyLLM：面向大型语言模型的公共政策卓越理解

大型语言模型（LLMs）正日益被整合到现实世界的决策中，包括公共政策领域。然而，它们的能力去理解…

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] LogicEval：用于评估真实世界软件中逻辑漏洞的自动修复技术的系统化框架

逻辑漏洞在软件中源于 program logic 的缺陷，而不是 memory safety，这可能导致关键的 security failures。虽然现有的 …

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 因果扩散模型用于纵向数据中的反事实结果分布

预测 longitudinal data 中的 counterfactual outcomes，尤其是当 sequential treatment decisions 严重依赖于不断演变的 patient states 时，既关键又极具挑战性。

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] ROSE：面向意图的 NL2SQL 评估指标

执行准确率（EX），一种广泛用于评估自然语言转SQL（NL2SQL）解决方案有效性的指标，正变得越来越不可靠……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] Parallax：为什么思考的 AI 代理绝不能行动

自主 AI 代理正迅速从实验工具转变为运营基础设施，预计 80% 的企业应用将……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] GlotOCR Bench：OCR 模型仍在少数 Unicode 脚本之外挣扎

光学字符识别（OCR）随着视觉语言模型的兴起而迅速发展，但评估仍然集中在少数几个……

#research #paper #ai #nlp #computer-vision
3周前 · ai · - · -

[论文] 概率特征插补与不确定性感知多模态联邦聚合

多模态联邦学习实现了在医疗机构之间进行隐私保护的协作模型训练。然而，一个根本性的挑战出现了……

#research #paper #ai #computer-vision
3周前 · ai · - · -

优化方法的演进：算法、场景与评估

在 deep learning 优化中，平衡收敛速度、泛化能力和计算效率仍然是一个核心挑战。First-order gradient…

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] 验证税：稀有错误情境下 AI 审计的基本限制

在深度学习中被引用最多的校准结果——在 CIFAR-100 上的 post-temperature-scaling ECE 为 0.012（Guo et al., 2017）——低于统计噪声的...

#research #paper #ai #machine-learning

Newer posts

Older posts