认识 Noscroll,一个为你完成 doomscrolling 的 AI 机器人
Noscroll:外包你的doom‑scrolling 如果你可以外包你的doom‑scrolling会怎样?这就是新创公司 Noscroll 的前提 https://noscroll.c...
Noscroll:外包你的doom‑scrolling 如果你可以外包你的doom‑scrolling会怎样?这就是新创公司 Noscroll 的前提 https://noscroll.c...
概述:OpenAI 宣布 ChatGPT 正在接收一个…
AI agents 已经彻底改变了 developer workflows,它们的下一个前沿是 knowledge work:处理信息、解决复杂问题、生成新的 i...
OpenAI 于周四发布了 GPT‑5.5 https://openai.com/index/introducing-gpt-5-5/,这是其最新的 AI 模型,公司称其为“最智能、最直观的……”。
发布概览 OpenAI 于星期四发布了 GPT‑5.5 https://openai.com/index/introducing-gpt-5-5/,其最新的 AI 模型,公司称其为“最智能的 a…”。
!https://9to5mac.com/wp-content/uploads/sites/6/2026/02/chatgpt-app-icon-light.jpg?quality=82&strip=all&w=1600 OpenAI 正在为忙碌的一周的公告画上句号……
多任务优化是一种强大的方法,可并行求解大量任务。然而,现有算法面临着明显的局限性:Populati...
引言 代理式 AI 的崛起:定义、框架与挑战综述 2025 探讨了 AI 如何从被动助理转变为自主……
概述 OpenAI 宣布了其新 GPT‑5.5 模型,描述它是“迄今为止最聪明、最直观易用的模型”,并且是迈向一种新方式的下一步……
我们如何判断一个视频是被加速还是减速的?我们如何生成不同速度的视频?虽然视频已经成为现代通信的核心……
Streaming Continual Learning(CL)通常通过时间划分将连续流转换为离散任务序列。我们认为这种…
自动语音识别(ASR)传统上使用词错误率(WER)进行评估,这一指标对意义不敏感。基于嵌入的语义度量…
持续学习(Continual Learning,CL)研究模型如何按顺序获取任务,同时保留先前学到的知识。尽管在基准测试方面取得了显著进展……
理解人类活动及其周围环境通常依赖视觉感知,但摄像头在隐私、安全方面仍然带来持续的挑战,...
我们研究批量设置中 multicalibration 的 minimax 样本复杂度。学习者观察到来自未知分布的 n 个 i.i.d. 样本,并且必须输出……
我们提出 Omni,一个统一的多模态模型,原生训练于多种模态,包括文本、图像、视频、3D 几何和隐藏表示。我们 ...
随着前沿语言模型在静态数学基准上取得接近天花板的表现,现有评估手段日益难以区分模型之间的差异。
我们提出了 Vista4D,一个稳健且灵活的视频再拍摄框架,将输入视频和目标摄像机定位在 4D 点云中。具体而言,给定一个…
尽管大型视觉语言模型(LVLMs)的能力取得了令人印象深刻的进展,这些系统仍然容易出现幻觉,即输出是 n...
科学工作流系统自动化执行——调度、容错、资源管理——但不包括其前置的语义转换。Scienti...
人类和现代视觉模型可以达到相似的分类准确率,但它们系统性地犯不同类型的错误——区别不在于错误出现的频率……
Low-rank adaptation (LoRA) 已成为基础模型参数高效微调 (PEFT) 的事实标准,使得对 bill...
近年来,图像生成和生成图像检测都取得了显著进展。尽管它们发展迅速,却在很大程度上仍相互独立。
深度学习视频超分辨率发展迅速,但气候应用通常只在空间或时间上进行超分辨率(提升分辨率),而且……
随着模型规模的持续增长,参数高效微调已成为全微调的强大替代方案。虽然 LoRA 在 …
对立法行为的分析常常依赖投票记录,忽视了政治演讲中丰富的语义和修辞内容。在本文中,我们提出…
本文提出了一种用于 AI 游戏编程的新范式,利用大型语言模型(LLMs)来扩展并实现 Claude Shannon 的分类法……
地理背景通常被认为与 motor insurance 风险相关,但公共 actuarial 数据集提供的地点标识有限,限制了对此的……
保持电力供需的瞬时平衡对于可靠性和电网不稳定性至关重要。系统运营商通过……实现此目标。
事件抽取从文本中识别事件的核心要素。它支持事件理解和分析,这对于诸如知情决策等任务至关重要。
实时检测和缓解技术异常对于大规模云原生服务至关重要,因为即使几分钟的停机也可能导致 massi...
Event extraction 对于事件理解和分析至关重要。它支持诸如 document summarization 和 emergency scenarios 中的 decision‑making 等任务……
了解大型语言模型(LLMs)记忆的事实知识类型对于评估其可靠性和局限性至关重要。Entity-based ...
生成式人工智能(GenAI)方法能够逼真地修改相机图像,这提升了人们对在线共享图像真实性的关注。Inte...
Physical video understanding 需要的不仅是正确命名事件。模型可以根据文本规则回答关于 pouring、sliding 或 collision 的问题……
人类的道德判断是情境依赖的,并受到人际关系的调节。随着大型语言模型(LLMs)日益在决策支持中发挥作用……
STEM 教育研究者通常希望识别学生机械推理的时刻以进行更深入的分析,但他们在搜索方面的能力有限……
深度强化学习(RL)用于量子电路优化面临三个根本瓶颈:重放缓冲区忽视时序差分的可靠性……
参数驱动振荡器为神经形态计算提供了自然平台,其中非线性模耦合和内在动力学实现了 both memo...
Capsule endoscopy (CE) 实现了非侵入性的胃肠筛查,但当前的 CE 研究仍主要局限于帧级别的分类和检测……
数据是现代企业的核心资源,数据验证对于确保下游应用的可靠性至关重要。然而,现有的...
AI 辅助编码的能力正以惊人的速度发展。基于聊天的 vibe 编码已经发展成为完整的 AI 辅助、具备代理性的软件开发。
先前的工作主要通过简单的条件语句来评估 code generation bias,这仅代表了现实编程的狭窄切片并且 rev...
激活函数的选择在深度神经网络的优化和性能中起着关键作用。虽然修正线性单元(ReLU)仍然...
GeForce NOW 正在加倍关注最重要的:玩家。本周的升级带来了更智能的库,让玩家比以往任何时候都更容易将 PC …
我们比较轻量级的基于自动机的模型(n-gram)与神经网络架构(LSTM、Transformer)在流式事件日志中的下一个活动预测。实验…
Reservoir computing(RC)是一种新兴的递归神经网络架构,因其低训练成本和适度的硬件需求而受到日益关注……