ai — 页 13 | EUNO.NEWS

排序:

2周前 · ai · - · -

类人‘Lightning’机器人打破半程马拉松纪录

Lightning机器人打破半程马拉松纪录——这台名为Lightning的自主猩红机器人在周日以仅50分26秒完成了在北京的13英里赛跑。

#humanoid robot #Lightning robot #autonomous robotics #half-marathon record #Honor #AI #robotics #running technology
2周前 · ai · - · -

[Paper] 中性演化的相互交织复杂性在困境之巢

Molecular biology 具有众多蛋白质复合体，它们以相互交错的方式协同工作，以实现不同的功能。Adaptive evolution 解释了……

#research #paper #ai
2周前 · ai · - · -

Qwen3.6-Max-Preview：更智能、更锐利，仍在进化

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#Qwen3.6 #large language model #LLM #AI research #deep learning #NLP #model preview
2周前 · ai · - · -

[Paper] LeGo-Code：模块化课程学习能推动复杂代码生成吗？来自 Text-to‑SQL 的洞见

最近，面向代码的大型语言模型（LLMs）在将自然语言翻译为可执行代码方面展示了强大的能力。Text-to-SQL 是……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] WebCompass：面向代码语言模型的多模态 Web 编码评估

大型语言模型正快速演变为能够进行端到端网页编码的交互式编码代理，然而现有的基准仅评估狭窄的切片……

#research #paper #ai #machine-learning
2周前 · ai · - · -

大规模自主 AI：Adobe Agents 与 NVIDIA、WPP 解锁突破性创意智能

AI 代理正在改变各行业的工作方式，加速从内容创作到决策制定的所有环节。NVIDIA 的扩展战略……

#AI agents #Adobe #NVIDIA #WPP #generative AI #creative intelligence #enterprise marketing #content creation #personalized experiences #agentic AI
2周前 · ai · - · -

[Paper] 基于相似性的投资组合构建用于黑盒优化

在黑箱优化中，一个核心问题是针对给定的、之前未见过的问题应该使用哪种算法。然而，选择单一算法却…

#research #paper #ai
2周前 · ai · - · -

重新思考 LLM 基准：为何仅凭分数无法完整说明问题

排行榜的幻觉模型排名提供了一种清晰感。模型名称旁的数字显得决定性，几乎具有权威性，团队常常依赖于……

#LLM #benchmarking #evaluation #model rankings #leaderboards #AI research #performance metrics
2周前 · ai · - · -

从 Generic Evals 到 Specific Monitors：Annotation Queue Bridge

为什么通用评估不足？在 AI reliability 讨论中，常常会遇到一个难题：你知道质量很重要，但你还不知道哪些会失败……

#AI reliability #evaluation metrics #annotation queues #model monitoring #LLM evaluation #failure modes
2周前 · ai · - · -

[Paper] 支配集合的量度：基于度量几何的Pareto兼容指标

我们研究 magnitude 作为一种新的单值且严格帕累托兼容的质量指标，用于评估多目标优化中有限近似集合对帕累托前沿的逼近。

#research #paper #ai
2周前 · ai · - · -

我对3个本地LLM在50个事实性问题上进行基准测试——以下是失败的情况

设置 - 在5个类别中共50个事实性问题 - 3个模型：llama3.2、mistral、phi3 - 使用 Ollama 完全本地运行 100%，无需 API 密钥排行榜...

#LLM #benchmark #local models #Ollama #hallucination #llama3.2 #mistral #phi3 #accuracy #latency
2周前 · ai · - · -

NSA 正在使用 Anthropic 的 Mythos，尽管被列入 blacklist

请提供您需要翻译的摘录或摘要，我将为您翻译成简体中文。

#NSA #Anthropic #Mythos #AI model #government AI use #AI policy #security
2周前 · ai · - · -

ChatGPT是如何工作的（面向初学者的简明解释）

介绍如果你曾经想知道在 ChatGPT 中输入提示时会发生什么，这篇文章以最简单的方式为你拆解。提示是如何…

#ChatGPT #large language model #LLM #tokenization #prompt processing #AI basics #machine learning
2周前 · ai · - · -

在 Product Hunt 上发布 TwelveLabs 的 Pegasus 1.5

封面图片：在 Product Hunt 上由 TwelveLabs 推出的 Pegasus 1.5 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto

#Pegasus 1.5 #TwelveLabs #generative video AI #video-to-data #Product Hunt launch
2周前 · ai · - · -

[Paper] 多目标进化算法在组合优化问题上的可扩展性

进化算法的可扩展性是指评估其性能随着问题规模的增加而如何变化。在多目标优化领域，...

#research #paper #ai
2周前 · ai · - · -

[Paper] DeInfer：用于分解式大型语言模型的高效并行推理

现有的大语言模型（LLM）分解工作主要关注提升下游任务的性能，但它们忽视了并行推理的不足……

#research #paper #ai #nlp
2周前 · ai · - · -

Claude Token Counter，现已加入模型比较

Claude Token Counter，现在支持模型比较。我升级了 https://github.com/simonw/tools/pull/269 我的 Claude Token Counter 工具，添加了运行的能力……

#Claude #tokenizer #token counting #Anthropic #Opus 4.7 #model comparison #LLM tools
2周前 · ai · - · -

OpenAI帮助Hyatt在同事之间推进AI

关键要点 - Hyatt 已部署 ChatGPT Enterprise。 - 使用 ChatGPT Enterprise，Hyatt 员工可以访问前沿 AI 能力，如 GPT 5.4、Codex、……

#OpenAI #ChatGPT Enterprise #Hyatt #enterprise AI #AI adoption #hospitality technology
2周前 · ai · - · -

推理优化的崛起：塑造2026年的真实 LLM 基础设施趋势

为什么推理优化正在接管

#LLM #inference optimization #model serving #AI infrastructure #cost efficiency #scalable AI
2周前 · ai · - · -

Claude Design 已上线 — AI 正进入视觉创作时代

引言：创意与执行之间的差距正在缩小。创意和产品开发过程一直存在令人沮丧的差距。你可能……

#Anthropic #Claude Design #generative AI #visual creation #AI prototyping #natural language design
2周前 · ai · - · -

Uber的AI推进遇阻——CTO称预算困难，尽管已投入34亿美元

请提供您希望翻译的文章摘录或摘要文本，我才能为您进行翻译。

#Uber #AI #Anthropic #budget #tech spending #AI investment
2周前 · ai · - · -

[Paper] 关于遗传编程中符号回归的泛化界限

符号回归（SR）与遗传编程（GP）旨在直接从数据中发现可解释的数学表达式。尽管它在经验上表现强劲……

#research #paper #ai #machine-learning
2周前 · ai · - · -

AI 在文档中：文档的动态转变，大多数人似乎忽视

文档使用者的转变我作为 senior technical writer 已经工作了超过六年，我可以自信地说，文档的使用者……

#AI agents #technical writing #documentation automation #developer tools #AI-driven workflows
2周前 · ai · - · -

[Paper] 单调却激动人心：关于演化高非线性单调布尔函数的研究

单调布尔函数是结构上重要的一类布尔函数，但它们受限的形式对可实现的非线性…

#research #paper #ai
2周前 · ai · - · -

[Paper] VIBE：语音诱导的开放式偏见评估用于大规模音频语言模型的真实世界语音

大型音频语言模型（Large Audio-Language Models，LALMs）正日益融入日常应用，但它们的生成偏差仍未得到充分研究。现有的语音公平…

#research #paper #ai #nlp
2周前 · ai · - · -

[论文] DORA Explorer：在无需训练的情况下提升 LLM 的探索能力

尽管进展迅速，用于序列决策的 LLM（即 LLM 代理）仍然难以产生多样化的输出。这导致了探索不足……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] RemoteShield：实现稳健的多模态大语言模型用于地球观测

一个稳健的用于地球观测的多模态大语言模型（MLLM）应在真实的输入变化下保持一致的解释和推理。...

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] 利用画像感知的多模态 LLM 提升零样本个性化图像美学评估

个性化图像美学评估（PIAA）旨在预测单个用户对图像的主观评分，这需要对用户特定的美学……

#research #paper #ai #machine-learning #computer-vision
2周前 · ai · - · -

[Paper] 基于条纹投影的视觉流水线用于自动硬盘拆解

未回收的 e-waste 代表了巨大的经济损失。硬盘驱动器（HDD）构成了有价值的 e-waste 流，需要机器人拆解。Automa...

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] 一种多代理方法用于从表格数据文档进行声明验证

我们提出了一种用于从表格数据文档中进行声明验证的新方法。近期基于 LLM 的方法要么采用复杂的预训练/微调，要么…

#research #paper #ai #nlp
2周前 · ai · - · -

[论文] 区域亲和注意力用于深紫外成像下的全切片乳腺癌分类

乳腺癌诊断需要快速且精确的工具，但传统的组织病理学方法在术中常常不足。Deep Ultraviole...

#research #paper #ai #machine-learning #computer-vision
2周前 · ai · - · -

[Paper] Vision-Language模型中的跨模态注意力分析与优化：关于视觉可靠性的研究

视觉语言模型（VLMs）实现了强大的跨模态性能，但最新证据表明，它们过度依赖文本描述，而对...利用不足。

#research #paper #ai #machine-learning #computer-vision
2周前 · ai · - · -

[Paper] 揭开在线对齐方法非理性高效性的谜团

基于纯贪婪更新的迭代对齐方法在实践中表现出惊人的有效性，然而现有的 (O(log T)) KL 正则化的理论保证仍然有限。

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] 为摘要校准模型驱动评估指标

近期在摘要评估方面的进展是基于 model-based metrics 来评估质量维度，例如 completeness、conciseness 和 faithfulness。然而...

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] 完全并行密集连接的概率 Ising 机器带惯性用于实时应用

Ising machines —— 用于启发式求解 Ising 优化问题的专用硬件 —— 基于概率位（p-bits）已经建立了……

#research #paper #ai
2周前 · ai · - · -

[论文] 当 Spike Sparsity 未能转化为部署成本时：VS‑WNO 在 Jetson Orin Nano 上

Spiking neural operators 对于 neuromorphic edge computing 具有吸引力，因为 event-driven substrates 原则上可以将稀疏活动转化为更低的 l…

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 重新利用 3D 生成模型进行自回归布局生成

我们介绍 LaviGen，一个将 3D 生成模型重新用于 3D 布局生成的框架。不同于之前从文本推断对象布局的方法……

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] FineCog-Nav：整合细粒度认知模块用于零样本多模态无人机导航

UAV 视觉语言导航（VLN）要求代理从自我中心视角在复杂的 3D 环境中导航，同时遵循模糊的多步骤 i...

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] 增强雾霾野生动物图像：AnimalHaze3k 与 IncepDehazeGan

大气雾霾显著降低了野生动物影像的质量，阻碍了对保护至关重要的计算机视觉应用，如动物检测、跟踪、……

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] 通过观测到的随机动力学对自编码器进行几何正则化

具有慢或亚稳行为的随机动力系统在长时间尺度上，在高维环境空间中的未知低维流形上演化。

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 使用大型语言模型和知识图谱提升制造业机器学习模型的可解释性

以透明且用户友好的方式解释机器学习（ML）结果仍然是可解释人工智能（XAI）的一个挑战性任务。In t...

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 评估大型语言模型在小分子药物设计中的能力进展

大型语言模型（LLMs）有潜力加速小分子药物设计，因为它们能够对来自多种来源的信息进行推理……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 学习具备洞察的推理用于非形式定理证明

虽然大多数 automated theorem‑proving 方法依赖于 formal proof systems，informal theorem proving 可以更好地与 large language models 的 …

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] 没有普遍礼貌：跨语言、多模型研究礼貌对 LLMs 的影响（使用 PLUM Corpus）

本文探讨了大型语言模型（LLMs）对不同礼貌程度和不礼貌程度的用户提示的响应。礼貌理论由...

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] VEFX-Bench：全方位基准用于通用视频编辑与视觉特效

随着 AI-assisted video creation 越来越实用，instruction-guided video editing 已成为细化生成或捕获的 footage 的关键。

#research #paper #ai #machine-learning #nlp #computer-vision
2周前 · ai · - · -

[Paper] 从基准测试到推理：对越南法律文本的双维度大规模 LLM 评估

越南法律文本的复杂性对公众获取司法构成了显著障碍。虽然Large Language Models提供了一种有前景的解决方案……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[论文] Hero-Mamba：基于 Mamba 的双域学习用于水下图像增强

水下图像常因光在水中的吸收和散射而出现严重的退化，如颜色失真、对比度低以及细节模糊。

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] FL-MHSM：空间自适应融合与集成学习用于洪水‑滑坡多灾害易损性映射（区域尺度）

现有的 multi-hazard susceptibility mapping (MHSM) 研究通常依赖空间上均匀的模型，独立处理各类灾害，并且提供的表征有限……

#research #paper #ai #machine-learning

Newer posts

Older posts