[Paper] RedSage:网络安全通用型 LLM
网络安全运营需要能够支持多样化工作流且不泄露敏感数据的助手 LLM。现有解决方案要么依赖于专有 API……
网络安全运营需要能够支持多样化工作流且不泄露敏感数据的助手 LLM。现有解决方案要么依赖于专有 API……
现代的 diffusion/flow-based 模型用于图像生成通常具有两个核心特征:(i) 使用多步采样,(ii) 在 latent …
公共仓库托管着数百万个微调模型,但社区的使用仍然过度集中在少数基础检查点上……
混合Transformer架构结合了softmax注意力块和循环神经网络(RNN),已展示出理想的性能‑吞吐量权衡……
Agentic Reinforcement Learning(Agentic RL)在使智能体进行复杂推理和工具使用方面取得了显著成功。然而,大多数方法仍然…
我们推出了 UEval,这是一套用于评估统一模型的基准测试,即能够同时生成图像和文本的模型。UEval 包含 1,000 条专家策划的问题……
操纵动态对象仍然是视觉-语言-动作(Vision-Language-Action,VLA)模型的一个未解决的挑战,尽管这些模型在静态操纵方面表现出强大的泛化能力,却仍然...
神经网络已成功应用于各种资源受限的边缘设备,在这些设备中通常使用中央处理单元(CPU)而不是图形处理单元(GPU)……
大型视觉语言模型(VLMs)常常在原始图像上对经典视觉错觉给出“正确”的答案,但在错觉事实出现时仍坚持相同的回应……
自主网页代理的开发,由 Large Language Models (LLMs) 和 reinforcement learning (RL) 驱动,代表了朝向通用…的重大一步。
由于监督训练数据有限,大型语言模型(LLMs)通常在庞大的文本语料上通过自监督的“预测下一个词”目标进行预训练。
Audio-Visual Foundation Models,作为预训练模型,能够联合生成声音和视觉内容,最近展现出前所未有的建模多模态的能力……
在剪枝中,Lottery Ticket Hypothesis 假设大型网络包含稀疏子网络(即 winning tickets),这些子网络可以单独训练,以匹配 …
面向推理的 Large Language Models (LLMs) 已经通过 Chain-of-Thought (CoT) 提示取得了显著进展,但它们在根本上仍然受到限制……
矩阵函数,如 square root、inverse roots 和 orthogonalization,在用于神经网络训练的 preconditioned gradient methods 中发挥核心作用。T...
现有的智能体安全基准报告二元准确率,将早期干预与事后分析混为一谈。一个在第8步标记违规的检测器……
Full-image relighting 仍然是一个具有挑战性的问题,因为收集 large-scale structured paired data 的难度,以及保持物理…
胰腺导管腺癌(PDAC)是最致命的实体恶性肿瘤之一,常在晚期且不可手术的阶段被发现。对既往的…进行回顾性审查。
大型语言模型(LLMs)在复杂推理任务上提供最先进的性能,但其推理成本限制了大规模部署。Small Languag...
多目标优化旨在解决具有竞争目标的问题,通常只能以黑箱方式访问问题,并且测量预算有限……
前沿的大型语言模型(LLMs)在许多领域作为自主代理表现出色,但它们在隐藏工作流的复杂企业系统中仍未经过测试……
测试时缩放已被广泛采用,以增强大型语言模型(LLM)代理在软件工程(SWE)任务中的能力。然而,the sta...
当前的生成式视频模型在根据文本和图像提示生成新内容方面表现出色,但在编辑已有的预录制视频方面仍存在关键缺口,……
创意图像生成已成为一个引人注目的研究领域,驱动力在于需要产生新颖且高质量的图像,以拓展边界。
大型语言模型(LLMs)在医学基准测试中表现出色,包括问答和诊断。为了使它们在临床...
量化显著提升了大型语言模型(LLM)训练的计算和内存效率。然而,现有方法仍然依赖于…
能源现在已成为关键的ML计算资源。虽然测量能源消耗并观察趋势是一个有价值的第一步,但准确理解和 d...
设计高性能光学透镜需要在一个高维、受严格约束的空间中探索表面曲率、玻璃选择、元件厚度……
梅赛德斯‑奔驰 S‑级 – AI‑Ready 豪华 140 年创新 梅赛德斯‑奔驰庆祝 140 年的汽车创新,推出专为 AI 设计的新款 S‑级。
评估大语言模型(LLM)应用与传统软件测试不同,因为其输出具有随机性、高维性,并且对……敏感。
AI 代理推理正在推动一个以推理为主的数据中心未来,并暴露出超出计算的瓶颈——尤其是内存容量、内存带宽以及高…
当代软件架构在支持推理具有适应性、概率性和上下文依赖性的自主代理时面临困难,同时系统集成……
编辑注:本文是《Into the Omniverse》系列的一部分 https://www.nvidia.com/en-us/omniverse/news/,该系列聚焦于开发者、3D 从业者以及…
成功实施和扩展企业 AI 项目根本上是人员和运营模式的挑战,而不仅仅是技术问题……
最近的研究探索了通过多智能体强化学习(MARL)来优化大型语言模型(LLM)的协作。然而,大多数 MARL 微调方法依赖于预先…
AI 研究传统上优先考虑算法性能,例如在 machine learning 中优化准确率或在 automated planning 中优化运行时间。新兴的...
对扁平化结构化数据如何将精确率和召回率提升最高20%的分析。文章《优化向量搜索:为什么你应该扁平化结构化数据》。
人工智能的快速崛起导致能源消耗的不可持续增长。这激发了类脑计算和ph...
AI 代理现在可以相互交流——但它们无法理解对方想要做什么。这正是 Cisco 的 Outshift 正在尝试解决的问题……
多目标进化算法(MOEAs)已被证明在解决多目标优化问题(MOOPs)方面有效。然而,它们的性能可能会……
Benchmark Design 在 Black-Box Optimization (BBO) 中是一个基础且仍未结束的话题。早期的 BBO 基准主要是人工制作的,引入了专家……
Meta-Black-Box Optimization(MetaBBO)是优化社区中新兴的研究方向,在该方向中,算法设计策略可以通过强化学习进行元学习……
在汽车后市场中,高效的备件库存管理至关重要,因为需求高度间歇且不确定性导致巨大的成本……
确定性对于大语言模型(LLM)训练中的可重复性是必不可少的,但它往往会带来巨大的性能代价。在广泛使用的注意力 …
脉冲神经网络(SNNs)由于事件驱动的稀疏计算而具有极高的能效,但其训练受到脉冲不可微分性的挑战。
我们正在进行一项调查,以了解人们如何使用 AI 学习,以及这是否在帮助、伤害或取代工具……
创建业务流程模型与标记(BPMN)模型是一项复杂且耗时的任务,需要领域知识和建模熟练度……