[Paper] 基于轨迹的最优实验设计的概率方法
我们提出了一种新颖的 probabilistic approach 用于 optimal path experimental design。在该方法中,discrete path optimization problem 被定义在 static navigation 上……
我们提出了一种新颖的 probabilistic approach 用于 optimal path experimental design。在该方法中,discrete path optimization problem 被定义在 static navigation 上……
Transformer 预训练正日益受到内存和计算需求的限制,键值(KV)缓存已成为训练期间的主要瓶颈。
Predictive Process Monitoring 是 process mining 的一个分支,旨在预测正在进行的过程的结果。最近,它利用机器学习和深度学习……
随着视觉语言模型(VLMs)处理日益复杂和多模态的任务,键值(KV)缓存的快速增长对内存和计算资源提出了显著的压力……
从人类示范中学习结构化任务表征对于理解长时程操作行为,尤其是双手协作的情况,至关重要。
信息过载和错误信息在从大型新闻集合中提取有意义的叙事时带来了重大挑战。本文定义了na...
大型畜牧业对人类健康和环境构成重大风险,同时也易受到诸如传染病等威胁。
Diffusion models 现在能够生成高质量、多样化的样本,且对更强大模型的关注日益增加。虽然 ensembling 是一种众所周知的提升方法……
检索增强生成(Retrieval‑Augmented Generation,RAG)已成为一种强大的方法,通过整合……提升大型语言模型的问答能力。
我们提出了 Map2Thought,一个能够为 3D VLM 提供显式且可解释的空间推理的框架。该框架基于两个关键组件:Metr...
大型语言模型(LLMs)在各个领域表现出卓越的性能,但它们面临着关键的安全问题。模型编辑已经成为一种有效的…
我们报告了大型语言模型(LLMs)在理解“Jabberwocky”语言方面的惊人能力,在这种语言中,大多数或全部内容词已被随机……
PubMed-OCR 是一个以 OCR 为中心的科学文章语料库,来源于 PubMed Central Open Access PDFs。每页图像都使用 Google Cloud Vision 进行标注……
为什么你的最终 LLM 层会 OOM,以及如何使用自定义 Triton kernel 来解决。文章《Cutting LLM Memory by 84%: A Deep Dive into Fused Kernels》已出现 fi...
三维装箱问题(3D-BPP)是运筹学和物流领域长期存在的挑战。经典启发式算法和构造方法……
我只使用 AI 为博客文章创建封面图,所以没有太高的期望。我起初认为 Google 比 OpenAI 更好,但我已经…
OP在此。《Birth of a Mind》记录了我在2026年某一天进行的“recursive self-modeling”实验。我尝试实现一个“Hofstadterian Strange Loop”……
一种多层次的分割、颜色校正和特定领域增强方法。文章《从RGB到Lab:解决AI图像合成中的颜色伪影》
如果你不认识Steve Yegge,简单介绍一下: - 在Google工作了10多年资深工程师 - 以“Stevey’s Blog Rants”闻名的开发者博主 - 参与了Grok的开发 - 最近与Gene Kim一起合作《Wiring the Winning Organiza…》
脉冲神经网络(SNN)采用受神经可塑性启发的无监督学习方法,有望成为人工智能的新框架。
收购、风险投资以及日益激烈的竞争格局都指向市场上限。文章《The Great Data Closure:为什么 Databricks 和 Snowflake 正在……》。
埃隆·马斯克最近的法院文件中被遗漏的真相……
欢迎来到我们新系列《AI at Scale》的第一期。🚀 我们在过去的一周里构建了一个“Resiliency Fortress”——保护我们的数据库免受 Thu...
请提供您需要翻译的具体摘录或摘要内容,我才能为您进行简体中文翻译。
1️⃣ 什么是回归?回归的含义是:使用过去的信息来预测未来的数值。示例 | 问题 | 类型 |
大型语言模型(LLMs)向自主代理的演进已经将 AI 编码的范围从局部代码生成扩展到复杂的、仓库级…
ChatGPT Projects 是什么?使用 OpenAI 在 ChatGPT 中推出的新 Projects 功能来组织您的聊天、文件和工作流。ChatGPT Projects 是一项帮助您……
高维投资组合优化在复杂约束下面临显著的计算挑战,传统优化方法难以应对 t...
大多数 AI 聊天机器人表现良好——直到你问它们一些具体的问题。大型语言模型无法访问你的私人文档或内部知识。当……
这家初创公司声称其 AI 平台可以帮助优化编辑流程和研究……
ChatGPT Go 现已在全球推出,提供对 GPT-5.2 Instant 的扩展访问、更高的使用上限和更长的记忆——让先进的 AI 更加实惠。
OpenAI 计划在美国测试针对 ChatGPT 免费版和 Go 版的广告,以在全球范围内扩大负担得起的 AI 访问,同时保护隐私、信任和……
如果你正在构建将用户输入传递给 LLM 的应用程序,你可能至少遇到过一次 prompt injection。用户可能会输入类似 “ignore all...” 的内容。
“最近AI人工智能生成游戏是个问题”,一位开发公司负责人在新年问候并想聊点别的时,通话却偏离了方向。他表示,使用生成AI制作的“slop·低质量游戏”越来越多,感到担忧。独立游戏从业者和开发公司们把“retouching”作为判断是否为slop游戏的标准……
faf-cli v3.4.7 实现了 Claude 与 Gemini 生态系统之间的双向互操作性。如果你曾希望你的 Claude 上下文文件能够在 Gemini 中使用,或者……
Naver向政府表明不参加“独立 AI Foundation Model”项目的复活赛的立场。Naver Cloud于15日表示:“尊重科学技术信息通信部对第一阶段评估的判断”,并称“将继续多方面努力提升未来 AI 技术竞争力”。Naver Cloud...
Copilot memory 现已在公开预览中向所有付费的 GitHub Copilot 计划开放。Copilot memory 使 Copilot 能够学习并保留关于你的有用细节……
AI 正在以史无前例的速度编写代码 人们到处在说: > “初级开发者已经完蛋了。” > “AI 将取代入门级程序员。” > “公司不会……”
事实证明,深度网络的 Hessian 的逆很容易作用于向量。若采用朴素方法,这在层数 s 上的运算量是立方级别的……
美国推出针对在美国开发的 AI 和 HPC 加速器的新出口规则,允许向中国实体出口 AMD 的 MI325X 和 Nvidia 的 H200 GPU。
Anthropic 的开源标准 Model Context Protocol(MCP),于 2024 年底发布,允许用户将 AI 模型及其上层的代理连接到外部……
X 对 Grok 生成明确 AI 图像的能力施加了更多限制,但测试显示这些更新导致了一系列零散的限制,未能……
X 已对 Grok 生成明确 AI 图像的能力施加了更多限制,但测试显示,这些更新导致了一系列零散的限制,导致 …
Higgsfield 表示其年收入跑道为 $200 million。于是,它重新开启了之前的 Series A 融资,并再次出售了 $80 million 的股份……
我们提出了 WildRayZer,一个用于新视角合成(NVS)的自监督框架,适用于相机和物体同时移动的动态环境。动态内容…
我们提出了一种新颖的可微分网格表示,用于高效求解微分方程(DEs)。广泛使用的神经求解器架构,……