ai — 页 40 | EUNO.NEWS

排序:

1个月前 · ai · - · -

[Paper] RedSage：网络安全通用型 LLM

网络安全运营需要能够支持多样化工作流且不泄露敏感数据的助手 LLM。现有解决方案要么依赖于专有 API……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 使用 Pixel Mean Flows 的一步 Latent-free 图像生成

现代的 diffusion/flow-based 模型用于图像生成通常具有两个核心特征：(i) 使用多步采样，(ii) 在 latent …

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 在模型仓库中发现隐藏的宝石

公共仓库托管着数百万个微调模型，但社区的使用仍然过度集中在少数基础检查点上……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] Hybrid Linear Attention 正确实现：高效蒸馏与有效架构用于超长上下文

混合Transformer架构结合了softmax注意力块和循环神经网络（RNN），已展示出理想的性能‑吞吐量权衡……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 探索用于智能体的推理奖励模型

Agentic Reinforcement Learning（Agentic RL）在使智能体进行复杂推理和工具使用方面取得了显著成功。然而，大多数方法仍然…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] UEval：统一多模态生成基准

我们推出了 UEval，这是一套用于评估统一模型的基准测试，即能够同时生成图像和文本的模型。UEval 包含 1,000 条专家策划的问题……

#research #paper #ai #nlp #computer-vision
1个月前 · ai · - · -

[Paper] DynamicVLA：用于动态对象操作的视觉-语言-动作模型

操纵动态对象仍然是视觉-语言-动作（Vision-Language-Action，VLA）模型的一个未解决的挑战，尽管这些模型在静态操纵方面表现出强大的泛化能力，却仍然...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[论文] 最新突破性成果：将神经网络转换为Logic Flows用于边缘计算

神经网络已成功应用于各种资源受限的边缘设备，在这些设备中通常使用中央处理单元（CPU）而不是图形处理单元（GPU）……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] VLM是感知还是回忆？使用经典视觉错觉探究视觉感知与记忆

大型视觉语言模型（VLMs）常常在原始图像上对经典视觉错觉给出“正确”的答案，但在错觉事实出现时仍坚持相同的回应……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] DynaWeb：基于模型的强化学习 Web 代理

自主网页代理的开发，由 Large Language Models (LLMs) 和 reinforcement learning (RL) 驱动，代表了朝向通用…的重大一步。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[论文] FineInstructions：将合成指令扩展到预训练规模

由于监督训练数据有限，大型语言模型（LLMs）通常在庞大的文本语料上通过自监督的“预测下一个词”目标进行预训练。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] JUST-DUB-IT：通过 Joint Audio-Visual Diffusion 实现视频配音

Audio-Visual Foundation Models，作为预训练模型，能够联合生成声音和视觉内容，最近展现出前所未有的建模多模态的能力……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 路由彩票：用于异构数据的自适应子网络

在剪枝中，Lottery Ticket Hypothesis 假设大型网络包含稀疏子网络（即 winning tickets），这些子网络可以单独训练，以匹配 …

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 边提问边推理：将推理大型语言模型从被动求解器转变为主动询问者

面向推理的 Large Language Models (LLMs) 已经通过 Chain-of-Thought (CoT) 提示取得了显著进展，但它们在根本上仍然受到限制……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] PRISM：分布无关的自适应矩阵函数计算以加速神经网络训练

矩阵函数，如 square root、inverse roots 和 orthogonalization，在用于神经网络训练的 preconditioned gradient methods 中发挥核心作用。T...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] StepShield：何时介入 Rogue Agents，而非是否介入

现有的智能体安全基准报告二元准确率，将早期干预与事后分析混为一谈。一个在第8步标记违规的检测器……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] PI-Light：Physics-Inspired Diffusion 用于全图重新照明

Full-image relighting 仍然是一个具有挑战性的问题，因为收集 large-scale structured paired data 的难度，以及保持物理…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 基于CT的胰腺癌早期及诊前检测

胰腺导管腺癌（PDAC）是最致命的实体恶性肿瘤之一，常在晚期且不可手术的阶段被发现。对既往的…进行回顾性审查。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[论文] 为提示付费，而非答案：LLM Shepherding 用于成本高效推理

大型语言模型（LLMs）在复杂推理任务上提供最先进的性能，但其推理成本限制了大规模部署。Small Languag...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SMOG：可扩展的元学习用于多目标贝叶斯优化

多目标优化旨在解决具有竞争目标的问题，通常只能以黑箱方式访问问题，并且测量预算有限……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] 工作流世界：将 World Models 引入企业系统的基准

前沿的大型语言模型（LLMs）在许多领域作为自主代理表现出色，但它们在隐藏工作流的复杂企业系统中仍未经过测试……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SWE-Replay：面向软件工程代理的高效测试时扩展

测试时缩放已被广泛采用，以增强大型语言模型（LLM）代理在软件工程（SWE）任务中的能力。然而，the sta...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] EditYourself：Audio-Driven 生成与操控 Talking Head 视频，使用 Diffusion Transformers

当前的生成式视频模型在根据文本和图像提示生成新内容方面表现出色，但在编辑已有的预录制视频方面仍存在关键缺口，……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 使用 Diffusion Model 的创意图像生成

创意图像生成已成为一个引人注目的研究领域，驱动力在于需要产生新颖且高质量的图像，以拓展边界。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 医学中大语言模型训练的联邦与参数高效框架

大型语言模型（LLMs）在医学基准测试中表现出色，包括问答和诊断。为了使它们在临床...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] ECO: 量化训练无需全精度主权重

量化显著提升了大型语言模型（LLM）训练的计算和内存效率。然而，现有方法仍然依赖于…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 焦耳去哪儿了？诊断推理能耗

能源现在已成为关键的ML计算资源。虽然测量能源消耗并观察趋势是一个有价值的第一步，但准确理解和 d...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] Lens-descriptor 引导的进化算法用于含玻璃选择的复杂光学系统优化

设计高性能光学透镜需要在一个高维、受严格约束的空间中探索表面曲率、玻璃选择、元件厚度……

#research #paper #ai
1个月前 · ai · - · -

梅赛德斯-奔驰推出基于 NVIDIA DRIVE AV 的全新 S 级，具备 L4 级别就绪架构

梅赛德斯‑奔驰 S‑级 – AI‑Ready 豪华 140 年创新梅赛德斯‑奔驰庆祝 140 年的汽车创新，推出专为 AI 设计的新款 S‑级。

#ai #gpu #nvidia
1个月前 · ai · - · -

[Paper] 当“更好”的 Prompt 伤害时：评估驱动的迭代用于 LLM 应用

评估大语言模型（LLM）应用与传统软件测试不同，因为其输出具有随机性、高维性，并且对……敏感。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 异构计算：驱动 AI Agent 推理未来的关键

AI 代理推理正在推动一个以推理为主的数据中心未来，并暴露出超出计算的瓶颈——尤其是内存容量、内存带宽以及高…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Liquid Interfaces：用于自主系统互操作性的动态本体

当代软件架构在支持推理具有适应性、概率性和上下文依赖性的自主代理时面临困难，同时系统集成……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

进入Omniverse：Physical AI 开放模型和框架推动机器人和自主系统

编辑注：本文是《Into the Omniverse》系列的一部分 https://www.nvidia.com/en-us/omniverse/news/，该系列聚焦于开发者、3D 从业者以及…

#ai #gpu #nvidia
1个月前 · ai · - · -

扩展企业AI：来自IBM的治理与运营模型经验教训

成功实施和扩展企业 AI 项目根本上是人员和运营模式的挑战，而不仅仅是技术问题……

#enterprise AI #AI governance #operating model #scaling AI #IBM
1个月前 · ai · - · -

[Paper] 学习去中心化 LLM 协作的多智能体 Actor Critic

最近的研究探索了通过多智能体强化学习（MARL）来优化大型语言模型（LLM）的协作。然而，大多数 MARL 微调方法依赖于预先…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 领域模型设计对经典规划的能量影响

AI 研究传统上优先考虑算法性能，例如在 machine learning 中优化准确率或在 automated planning 中优化运行时间。新兴的...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

优化向量搜索：为何应扁平化结构化数据

对扁平化结构化数据如何将精确率和召回率提升最高20%的分析。文章《优化向量搜索：为什么你应该扁平化结构化数据》。

#vector search #data flattening #structured data #precision #recall #embeddings #similarity search
1个月前 · ai · - · -

[Paper] Equilibrium Propagation 训练成功对网络架构的依赖

人工智能的快速崛起导致能源消耗的不可持续增长。这激发了类脑计算和ph...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

AI agents 可以相互交流——它们仍然无法一起思考

AI 代理现在可以相互交流——但它们无法理解对方想要做什么。这正是 Cisco 的 Outshift 正在尝试解决的问题……

#AI agents #multi‑agent communication #Cisco Outshift #Internet of Cognition #MCP protocol #A2A protocol #AI architecture
1个月前 · ai · - · -

[Paper] 自适应 Surrogate-Based 策略用于加速求解昂贵的无约束多目标优化问题的收敛速度

多目标进化算法（MOEAs）已被证明在解决多目标优化问题（MOOPs）方面有效。然而，它们的性能可能会……

#research #paper #ai
1个月前 · ai · - · -

[Paper] 基准的演进：通过大语言模型的黑盒优化基准设计

Benchmark Design 在 Black-Box Optimization (BBO) 中是一个基础且仍未结束的话题。早期的 BBO 基准主要是人工制作的，引入了专家……

#research #paper #ai
1个月前 · ai · - · -

[Paper] READY：奖励发现用于元黑箱优化

Meta-Black-Box Optimization（MetaBBO）是优化社区中新兴的研究方向，在该方向中，算法设计策略可以通过强化学习进行元学习……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 架起预测准确性与库存KPIs之间的桥梁：基于仿真的软件框架

在汽车后市场中，高效的备件库存管理至关重要，因为需求高度间歇且不确定性导致巨大的成本……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] DASH：确定性注意力调度用于高吞吐可复现的 LLM 训练

确定性对于大语言模型（LLM）训练中的可重复性是必不可少的，但它往往会带来巨大的性能代价。在广泛使用的注意力 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 通用自预测增强用于脉冲神经元

脉冲神经网络（SNNs）由于事件驱动的稀疏计算而具有极高的能效，但其训练受到脉冲不可微分性的挑战。

#research #paper #ai
1个月前 · ai · - · -

你在使用 AI 学习吗？我们想了解！

我们正在进行一项调查，以了解人们如何使用 AI 学习，以及这是否在帮助、伤害或取代工具……

#AI #learning #survey #educational technology #AI tools
1个月前 · ai · - · -

RoPE，清晰解释

超越数学，培养直觉题为《RoPE，Clearly Explained》的文章首次发表于 Towards Data Science....

#RoPE #rotary positional embedding #transformers #positional encoding #LLM #deep learning
1个月前 · ai · - · -

[Paper] 评估大型语言模型的业务流程建模能力

创建业务流程模型与标记（BPMN）模型是一项复杂且耗时的任务，需要领域知识和建模熟练度……

#research #paper #ai #machine-learning

Newer posts

Older posts