类人‘Lightning’机器人打破半程马拉松纪录
Lightning机器人打破半程马拉松纪录——这台名为Lightning的自主猩红机器人在周日以仅50分26秒完成了在北京的13英里赛跑。
Lightning机器人打破半程马拉松纪录——这台名为Lightning的自主猩红机器人在周日以仅50分26秒完成了在北京的13英里赛跑。
Molecular biology 具有众多蛋白质复合体,它们以相互交错的方式协同工作,以实现不同的功能。Adaptive evolution 解释了……
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
最近,面向代码的大型语言模型(LLMs)在将自然语言翻译为可执行代码方面展示了强大的能力。Text-to-SQL 是……
大型语言模型正快速演变为能够进行端到端网页编码的交互式编码代理,然而现有的基准仅评估狭窄的切片……
AI 代理正在改变各行业的工作方式,加速从内容创作到决策制定的所有环节。NVIDIA 的扩展战略……
在黑箱优化中,一个核心问题是针对给定的、之前未见过的问题应该使用哪种算法。然而,选择单一算法却…
排行榜的幻觉 模型排名提供了一种清晰感。模型名称旁的数字显得决定性,几乎具有权威性,团队常常依赖于……
为什么通用评估不足?在 AI reliability 讨论中,常常会遇到一个难题:你知道质量很重要,但你还不知道哪些会失败……
我们研究 magnitude 作为一种新的单值且严格帕累托兼容的质量指标,用于评估多目标优化中有限近似集合对帕累托前沿的逼近。
设置 - 在5个类别中共50个事实性问题 - 3个模型:llama3.2、mistral、phi3 - 使用 Ollama 完全本地运行 100%,无需 API 密钥 排行榜...
请提供您需要翻译的摘录或摘要,我将为您翻译成简体中文。
介绍 如果你曾经想知道在 ChatGPT 中输入提示时会发生什么,这篇文章以最简单的方式为你拆解。提示是如何…
封面图片:在 Product Hunt 上由 TwelveLabs 推出的 Pegasus 1.5 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto
进化算法的可扩展性是指评估其性能随着问题规模的增加而如何变化。在多目标优化领域,...
现有的大语言模型(LLM)分解工作主要关注提升下游任务的性能,但它们忽视了并行推理的不足……
Claude Token Counter,现在支持模型比较。我升级了 https://github.com/simonw/tools/pull/269 我的 Claude Token Counter 工具,添加了运行的能力……
关键要点 - Hyatt 已部署 ChatGPT Enterprise。 - 使用 ChatGPT Enterprise,Hyatt 员工可以访问前沿 AI 能力,如 GPT 5.4、Codex、……
为什么推理优化正在接管
引言:创意与执行之间的差距正在缩小。创意和产品开发过程一直存在令人沮丧的差距。你可能……
请提供您希望翻译的文章摘录或摘要文本,我才能为您进行翻译。
符号回归(SR)与遗传编程(GP)旨在直接从数据中发现可解释的数学表达式。尽管它在经验上表现强劲……
文档使用者的转变 我作为 senior technical writer 已经工作了超过六年,我可以自信地说,文档的使用者……
单调布尔函数是结构上重要的一类布尔函数,但它们受限的形式对可实现的非线性…
大型音频语言模型(Large Audio-Language Models,LALMs)正日益融入日常应用,但它们的生成偏差仍未得到充分研究。现有的语音公平…
尽管进展迅速,用于序列决策的 LLM(即 LLM 代理)仍然难以产生多样化的输出。这导致了探索不足……
一个稳健的用于地球观测的多模态大语言模型(MLLM)应在真实的输入变化下保持一致的解释和推理。...
个性化图像美学评估(PIAA)旨在预测单个用户对图像的主观评分,这需要对用户特定的美学……
未回收的 e-waste 代表了巨大的经济损失。硬盘驱动器(HDD)构成了有价值的 e-waste 流,需要机器人拆解。Automa...
我们提出了一种用于从表格数据文档中进行声明验证的新方法。近期基于 LLM 的方法要么采用复杂的预训练/微调,要么…
乳腺癌诊断需要快速且精确的工具,但传统的组织病理学方法在术中常常不足。Deep Ultraviole...
视觉语言模型(VLMs)实现了强大的跨模态性能,但最新证据表明,它们过度依赖文本描述,而对...利用不足。
基于纯贪婪更新的迭代对齐方法在实践中表现出惊人的有效性,然而现有的 (O(log T)) KL 正则化 的理论保证仍然有限。
近期在摘要评估方面的进展是基于 model-based metrics 来评估质量维度,例如 completeness、conciseness 和 faithfulness。然而...
Ising machines —— 用于启发式求解 Ising 优化问题的专用硬件 —— 基于概率位(p-bits)已经建立了……
Spiking neural operators 对于 neuromorphic edge computing 具有吸引力,因为 event-driven substrates 原则上可以将稀疏活动转化为更低的 l…
我们介绍 LaviGen,一个将 3D 生成模型重新用于 3D 布局生成的框架。不同于之前从文本推断对象布局的方法……
UAV 视觉语言导航(VLN)要求代理从自我中心视角在复杂的 3D 环境中导航,同时遵循模糊的多步骤 i...
大气雾霾显著降低了野生动物影像的质量,阻碍了对保护至关重要的计算机视觉应用,如动物检测、跟踪、……
具有慢或亚稳行为的随机动力系统在长时间尺度上,在高维环境空间中的未知低维流形上演化。
以透明且用户友好的方式解释机器学习(ML)结果仍然是可解释人工智能(XAI)的一个挑战性任务。In t...
大型语言模型(LLMs)有潜力加速小分子药物设计,因为它们能够对来自多种来源的信息进行推理……
虽然大多数 automated theorem‑proving 方法依赖于 formal proof systems,informal theorem proving 可以更好地与 large language models 的 …
本文探讨了大型语言模型(LLMs)对不同礼貌程度和不礼貌程度的用户提示的响应。礼貌理论由...
随着 AI-assisted video creation 越来越实用,instruction-guided video editing 已成为细化生成或捕获的 footage 的关键。
越南法律文本的复杂性对公众获取司法构成了显著障碍。虽然Large Language Models提供了一种有前景的解决方案……
水下图像常因光在水中的吸收和散射而出现严重的退化,如颜色失真、对比度低以及细节模糊。
现有的 multi-hazard susceptibility mapping (MHSM) 研究通常依赖空间上均匀的模型,独立处理各类灾害,并且提供的表征有限……