SkyDiscover:面向 LLM 驱动的算法发现的开放框架
我们正在开源 SkyDiscover,这是一套用于 AI 驱动算法发现的模块化框架。框架概述:SkyDiscover 将发现循环拆分为四个阶段……
我们正在开源 SkyDiscover,这是一套用于 AI 驱动算法发现的模块化框架。框架概述:SkyDiscover 将发现循环拆分为四个阶段……
我们梦想着一个未来,所有领域的 point clouds 能够汇聚在一起,塑造一个惠及所有领域的单一模型。为实现这一目标,我们提出了 Utonia,...
具身对话代理(Embodied Conversational Agents,ECAs)旨在通过语音、手势和面部表情来模拟人类面对面的互动。当前的大型语言模型……
许多关键的操作任务——例如食品准备、外科手术和工艺制作——对自主机器人仍然难以解决。这些任务的特征是…
实现自主且多功能的 whole-body loco-manipulation 仍然是使 humanoids 实际有用的核心障碍。然而,现有的方法仍然不足……
进行交互并从经验中学习的能力是机器人学的核心挑战,提供了一种可扩展的替代方案,以取代劳动密集型的人类 de...
人类移动轨迹在公共卫生和社会科学中被广泛研究,不同人口统计群体表现出显著不同的移动……
Feedforward geometric foundation models 在短窗口重建方面表现强劲,但将其扩展到分钟级视频时受到 quadratic attention 的瓶颈限制。
对 convection-dominated 瞬态传输现象的数值模拟,由于出现 sharp gradients 和 propagating ……,面临显著的计算挑战。
语言模型(LMs)作为代理在长上下文任务中的部署日益加速,这促使我们必须深入了解目标漂移:代理的…
针对不完全信息游戏的 AI 算法通常使用单个游戏的性能指标进行比较,这使得评估其鲁棒性变得困难……
自回归解码受其顺序特性限制。投机解码已经成为通过使用快速草稿模型来加速推理的标准方法。
生成式人工智能(AI)提供了可扩展的形成性反馈支持,但大多数 AI 生成的反馈依赖于任务特定的评分标准……
统一的多模态模型最近展示了强大的生成能力,但生成何时以及是否提升了理解仍不清楚。Exi...
我们研究在编码器‑解码器降阶模型中对学习到的潜在表示进行几何正则化的策略。在固定的实验设置中……
在无监督学习中,选择聚类数仍然是一个根本性的挑战。现有的标准通常针对单一的“optimal”划分,……
电动汽车路径问题(带时间窗,EVRPTW)在经典的 VRPTW 基础上加入了电池容量约束和充电站决策……
OpenAI 已发布了对 ChatGPT 的更新,称它…
Physics-Informed Neural Networks (PINNs) 已被视为一种无网格的替代方法,用于求解包含物理信息的偏微分方程……
实时主动的代理系统,能够建模人类心理状态,使用 foundation EXG 模型和文本嵌入模型,完全离线运行于 …
Contrastive steering 已被证明是一种简单且有效的方法,可在 inference time 调整 LLMs 的生成行为。它使用 prompt 示例……
Agentic language models 在安全机制上与 chat models 完全不同:它们必须进行计划、调用工具,并执行 long-horizon actions …
CDD(Contamination Detection via output Distribution),通过测量模型采样输出的峰度来识别数据污染。我们研究了……
Omni-modal 大语言模型(omni LLMs)最近在视听理解任务上取得了强劲的表现,但它们仍然高度易受…
自动化工业优化建模需要将自然语言需求可靠地转换为 solver‑executable code。然而,large language models ...
Prompt engineering 的菌丝网络是一种看不见的、地下的专有技术流动,跨公司通过员工流动、共享工具……
LLM 基准中的诚实差距 在对通用人工智能的不懈竞争中,行业已经对一种危险的代理——用于…
企业工程组织从 version control systems、CI/CD pipelines、issue trackers 和 observability 平台产生高容量、异构的 telemetry。
大型语言模型在软件工程领域迅速获得关注,但它们日益增长的碳足迹引发了迫切的可持续性问题。虽然 tr...
今天,我们发布了对 ChatGPT 最常用模型的更新,使日常对话更加始终如一地有帮助且流畅。GPT‑5.3 Instant 提供了更多…
介绍 GPT‑5.3 Instant 是 GPT‑5 系列的最新成员。正如我们在博客 https://openai.com/index/gpt-5-3-instant/ 中所描述的,GPT‑5.3 Instant res...
TL;DR:VibeFarm Studio 帮助您编写、组织并导出干净的提示到任何 AI 工具 https://zdcs.link/a0734w?pageview_type=Standard&template=article&modu...
概述:Anthropic 目前提供五种 Claude 模型。选择合适的模型会显著影响成本和输出质量。Model Summaries…
Claude Code 实际能做什么以及它不能为你做什么 - 🎧 音频版:想听吗?查看此深度解析的扩展 AI 播客版本……
文章图片 https://dev-to-uploads.s3.amazonaws.com/uploads/articles/yj53nociqps4kvxqdftd.png 您的“私密”提示正被烘焙进训练模型中……
封面图片:使用 Neural Network 预测布法罗市的交通 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=aut...
markdown 2026年1月29日 Ajeet Mirwani https://developers.googleblog.com/search/?author=Ajeet+Mirwani – 美洲项目负责人,Google Developer Experts
概述:调用 Claude API 很简单:在 messages.create 中放入提示并获取答案。但仅此并不能构成产品。要构建真正的应用程序,你……
文章 https://unbound.video 讨论 - 积分:4 - 评论:1 - 评论链接:https://news.ycombinator.com/item?id=47226865...
从顺序计算向并行计算的转变对于现代高性能应用至关重要,但受到并发编程陡峭学习曲线的阻碍……
德国电信(Deutsche Telekom),这家持有 T‑Mobile 多数股权的德国移动运营商,正与 ElevenLabs 合作,在其所有网络上启用 AI 助手……
markdown 二月随想 有时是二十九天。那就是二月:一个短的月份。大约四个标准周。大约二十个工作日。宏观来看,…
Human-product images(展示人类与产品融合的图像)在广告、电子商务和数字营销中发挥着至关重要的作用。关键是……
在可验证的符号数据上进行训练是扩展语言模型推理能力边界的有前景的方法,超越标准预训练语料库所能提供的范围。Y...
当我们能够识别与测试样本可交换的校准样本时,选择性共形预测可以产生显著更紧的不确定性集合。
Test-time reinforcement learning (TTRL) 已成为自我进化的大型推理模型 (LRMs) 的一种有前景的范式,使其能够在未标记的数据上进行在线适应。
像 Sudoku 和 ARC-AGI 这样的推理问题对神经网络仍然具有挑战性。结构化问题求解架构家族 Recurrent Reasoning …
我们提出了 Sketch2Colab,它将 storyboard 风格的 2D 草图转换为连贯、具备对象感知的 3D 多人物动作,并对 agents、关节等实现细粒度控制。