[Paper] Vendi Novelty Scores 用于分布外检测
Out-of-distribution (OOD) 检测对于机器学习系统的安全部署至关重要。现有的后置检测器通常依赖于模型置信度……
Out-of-distribution (OOD) 检测对于机器学习系统的安全部署至关重要。现有的后置检测器通常依赖于模型置信度……
挑战声明:设计一种时序图神经网络(T‑GNN)架构,能够高效处理包含数百万实体的大规模知识图谱……
大型语言模型(LLMs)经常生成不必要冗长的Chain-of-Thought(CoT)推理,这会增加计算成本和延迟,却没有相应的收益……
高效探索仍然是强化学习(RL)的核心挑战,尤其是在稀疏奖励环境中。我们引入 Optimistic World Mode……
RAG TREC Instrument for Multilingual Evaluation (RAGTIME) 赛道在 TREC 的主要目标是研究从多语言源文档生成报告……
验证主张的真实性通常需要对文本和视觉证据进行联合多模态推理,例如分析文本标题……
大型语言模型(LLMs)正日益用于在高风险、特定领域的环境中支持问答和决策,例如 natural ha...
欺诈防护是一场与规模的赛跑。例如,Mastercard 的网络每年大约处理 1600 亿笔交易,并出现 70,000 笔的激增……
越南语采用音位正字法,每个 grapheme 最多对应一个 phoneme,反之亦然。利用这种高度的 grapheme‑phoneme 透明性……
儿童如何在有限的输入下获得母语水平的句法?根据刺激贫乏假设(PoSH),儿童接收到的语言输入……
组织正在研究生成式 AI 如何支持其运营工作和决策过程。本研究调查了能源…
在 spiking neural networks (SNNs) 中训练传输延迟已被证明能够显著提升其在复杂时序任务上的性能。在本工作中...
脉冲神经网络(SNN)正日益被研究作为卷积神经网络(CNN)的节能替代方案,尤其适用于边缘智能。
如果你在过去几天里在 Instagram、Facebook、X 或其他任何社交媒体应用上花过一点时间,你几乎可以肯定看到人们发布 caricature……
TL;DR - Google 上个月为 Gemini 引入了 Personal Intelligence。
请提供您希望翻译的完整摘录或摘要文本,我才能为您进行简体中文翻译。
Rashomon 集合捕捉了那些实现几乎相同经验性能,但在决策边界上可能有显著差异的模型集合。...
markdown !https://www.venturesquare.net/wp-content/themes/venturesquare-net/images/flags/kr.pngnew-header !https://www.venturesquare.net/wp-content/themes/ventu...
2026年2月10日,Ryan 与普林斯顿大学 AI Lab 负责人 Tom Griffiths 教授一起,深入探讨他的新书《The Laws of Thought》中的发现……
TL;DR RAG Retrieval‑Augmented Generation 将语言模型与实时数据检索相结合,以提供准确、最新的响应。关键好处:降低……
2026年1月29日
像往年一样:全球各地的烟花。人们以新的决心和新目标迎接新年。某个地方的某个人一定会说:“2026 is going...”
概述:在美国,使用ChatGPT免费和Go计划的用户现在可能会开始看到广告,因为OpenAI开始在聊天机器人中测试这些广告。公司宣布……
本工作提出了 WorldCompass,这是一种新颖的强化学习(RL)后训练框架,针对长期、交互式基于视频的世界模型,能够……
在自动驾驶中,分布外(OOD)鲁棒性常常被简化为一个单一数字,掩盖了导致策略失效的因素。我们沿着五…
从栅格化的平面图像中重建结构化的矢量图形表示通常是计算任务的一个重要前提条件,涉及……
GUI-enabled agents的快速演进已经使传统的CAPTCHA变得过时。虽然之前的基准测试如OpenCaptchaWorld为…
时间序列数据支持许多领域(例如金融和气候科学),但其快速增长给存储和计算带来压力。Dataset condensation 可以缓解……
我们通过神经复形的紧支撑 Moore 复形来研究 ample groupoids 的同调。设 (A) 为一个拓扑阿贝尔群。对于 (n ge 0),设 (C_n(mathcal G;A)) ……
隐私是一项维系患者-提供者信任的人权。临床记录捕捉患者的私人脆弱性和个体性,这些被用于...
Computer-use agents (CUAs) 在过去一年取得了巨大的进展,但它们仍然经常产生偏离用户原始意图的误对齐行为。
我们提出了下一概念预测(Next Concept Prediction,NCP),一种建立在下一标记预测(Next Token Prediction,NTP)之上的生成式预训练范式。NCP 预测离散概念,...
Transformer 架构已经在时间序列预测中建立了强基准,但它们通常依赖于假设均匀、ind…的位置信息编码。
虽然世界模型已经成为具身智能的基石,通过使代理能够基于动作条件的预测来推理环境动力学……
回归神经网络(NNs)通常通过最小化 mean squared prediction error 来进行训练,而该误差对异常值和数据污染高度敏感,……
像 MIT、Apache-2.0 和 BSD-3-Clause 这样的宽松许可证主导了开源 AI,表明模型、数据集和代码等制品可以自由使用,……
基于LLM的工具正以快速的速度自动化更多的软件开发任务,但目前没有严格的方法来评估不同架构选择——...
markdown !VSSFlow 演示图片 https://9to5mac.com/wp-content/uploads/sites/6/2026/02/vssflow-fi.jpg?quality=82&strip=all&w=1600 VSSFlow – 一个统一的音频生成…
本文研究了将多模态 Genetic Algorithm 与 Graph Neural Network 相结合对课程表优化的影响。Graph Neural Net……
张量是当今人工智能(AI)系统中最基础且最关键的数据结构。张量的自然属性,尤其是 memory-c...
今天,我们开始在美国对 ChatGPT 进行广告测试。此测试面向已登录的成年用户,适用于 Free 和 Go 订阅层级。Pro、Business、Enter……
Federated learning(FL)是一种去中心化学习范式,已在资源受限的Internet of Things(IoT)环境中得到广泛采用。这些设备,典型……
TL;DR - Google 可能会在 NotebookLM 中加入 Personal Intelligence。- 基于……
今天的 LLM(预)训练和研究工作流通常会将大量计算资源分配给大规模消融研究。尽管有相当的 c...
피처링在其AI influencer marketing solution中添加了内容跟踪功能,使得可以实时监控SNS内容的表现。营销负责人可以直观地查看 influencer 账号的浏览量、评论、分享等绩效指标,并通过提醒接收。来源:벤처스퀘어
概述:一家希望使用大型语言模型(LLM)来总结销售报告或分流客户询问的公司,可以在数百种独特的 LLM 中进行选择。
AI Agent Coordination, Context, and Collaboration “如何让代理真正一起思考,具备所有的上下文理解、协商和…”