ai — 页 27 | EUNO.NEWS

排序:

1个月前 · ai · - · -

[论文] 通用 YOCO 用于高效深度缩放

测试时规模化的兴起显著提升了大型语言模型（LLMs）的推理和代理能力。然而，标准的Transformers仍然面临困难……

#research #paper #ai #nlp
1个月前 · ai · - · -

AI营销BS指数

引言您可能已经了解约翰·贝兹（John Baez）的“Crackpot Index”，它提供了一种简单的带有讽刺意味的评分系统，用于评估研究是否……

#large language models #AI marketing #buzzwords #humor #critique #AI hype
1个月前 · ai · - · -

[Paper] 使用浅层循环解码器从短时间序列进行潜在相位推断 (LAPIS-SHRED)

从空间和时间上稀疏的观测中重建完整的 spatio-temporal dynamics 仍然是复杂系统中的核心挑战，因为测量可能…

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 配方比厨房更重要：AI 天气预测流水线的数学基础

AI 天气预测发展迅速，但尚未有统一的数学框架解释什么决定了预报技能。现有理论针对特定的...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] $texttt{YC-Bench}$：基准测试 AI 代理的长期规划和一致执行

随着 LLM agents 处理日益复杂的任务，一个关键问题是它们能否在长期范围内保持 strategic coherence：在不确定性下进行 planning ……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] TRACE：通过可触知重建和几何对齐的上下文视频掩码实现高保真 3D 场景编辑

我们提出了 TRACE，一个基于网格引导的 3DGS 编辑框架，实现了自动化、高保真度的场景转换。通过使用显式的 3…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] LLM 回归与潜在迭代状态头

我们提出了 RELISH（REgression with a Latent Iterative State Head），一种新颖的轻量级架构，专为使用大型语言模型进行文本回归设计。Ra...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 神经谐波纹理用于高质量基元式神经重建

基于基元的方法，如 3D Gaussian Splatting，最近已成为新视角合成及相关重建任务的最先进技术。Compa...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 因此我在。我思考

我们考虑这样一个问题：当一个大型语言推理模型做出选择时，它是先思考再决定，还是先决定再思考？在这篇…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 学习与生成由浅层通道电路制备的混合态

从测量数据中学习量子态是量子信息与计算复杂性中的核心问题。在本工作中，我们研究学习……的问题。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] ORBIT：可扩展且可验证的数据生成，用于预算紧张的搜索代理

搜索代理，将语言模型（LMs）与网络搜索相结合，正变得对回答复杂的用户查询至关重要。构建训练数据集……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 极其简单的自蒸馏提升代码生成

大型语言模型（LLM）能否仅通过使用其自身的原始输出，在没有 verifier、teacher model 或 reinforcement learning 的情况下提升代码生成能力？We a...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] True (VIS) Lies：分析生成式 AI 如何识别可视化谎言中的意图性、修辞与误导性

本研究调查了多模态大型语言模型（LLMs）识别和解释误导性可视化的能力，并识别这些观…

#research #paper #ai #nlp #computer-vision
1个月前 · ai · - · -

[Paper] 筛查足够

标准 softmax 注意力的一个核心限制是它没有定义绝对的 query--key 相关性概念：注意力权重是通过重新分配……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] NeuroDDAF：神经动态扩散-对流场与证据融合用于空气质量预测

准确的空气质量预测对于保护公众健康和指导环境政策至关重要，但由于非线性时空……仍然具有挑战性。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] 基于函数的不确定性量化的安全学习控制

在安全关键系统中部署学习驱动的控制方法时，不确定性量化是必不可少的。通常通过构建不确定性……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Open-Set 监督式 3D 异常检测：工业数据集与面向未知缺陷的通用框架

虽然自监督的3D异常检测假设获取高精度点云在计算上成本高昂，但在实际制造场景中……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 在线推理校准：测试时训练实现可泛化的共形 LLM 推理

虽然测试时扩展使大型语言模型能够解决高度困难的任务，但最先进的结果伴随着高昂的计算成本。这些低效...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] S0 调优：混合递归注意力模型的零开销适配

使用大约 48 个经执行验证的 HumanEval 训练解答，对每个循环层调优单个初始状态矩阵，且推理时零开销，超出……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 面向个性化飞镖训练：基于骨架的生物力学分析与运动建模的数据驱动框架

随着体育训练日益数据化，主要依赖经验和目视观察的传统飞镖教练已越来越无法满足高水平……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

Holo3：突破计算机使用前沿

我们自豪地推出 Holo3——我们对 Autonomous Enterprise 愿景的最新演进。凭借在 OSWorld‑Verified benchmark 上获得的 78.85% 成绩，Holo3……

#Holo3 #autonomous agents #synthetic environments #OSWorld benchmark #large language models #Hugging Face #AI research #agentic learning
1个月前 · ai · - · -

[Paper] 整数状态动力学的量化脉冲神经网络用于高效硬件加速

脉冲神经网络（SNN）因其事件驱动计算和稀疏活动映射自然适用于低功耗的机器智能。

#research #paper #ai
1个月前 · ai · - · -

[论文] 修订还是重新求解？分解多LLM流水线中二次传递收益

多模型（Multi-LLM）修订流水线，其中第二个模型审阅并改进第一个模型生成的草稿，普遍认为其收益来源于真正的 er...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

AI Doc的导演被AI吓得魂不附体，于是他拍了一部电影

概述：如果你对 AI 以及它对人类未来的意义感到焦虑，应该观看《The AI Doc：Or, How I Became an Apocaloptimist》。正如我……

#AI documentary #AI ethics #AI anxiety #technology and society #film about AI
1个月前 · ai · - · -

动手打造你的四月愚人节埃菲尔铁塔

电梯惊喜：在电梯里放置一个小摄像头，当有人进来时，拍一张照片并写上“Welcome to Space Station！”或者制作一个微型模型……

#ai #ai-fun #experiments
1个月前 · ai · - · -

奖励：更多来自 Eiffel Tower Llama 的愚人节恶作剧

你来到了一个额外的帖子！在额外的帖子中，我会加入一些额外内容，以感谢 AI Weirdness 的支持者。正是你们的经济支持帮助我支付……

#ai #ai-fun #experiments
1个月前 · ai · - · -

[Paper] OkanNet：轻量级深度学习架构用于基于MRI图像的脑肿瘤分类

医学成像技术，尤其是磁共振成像（MRI），被公认为神经系统疾病诊断和治疗计划的金标准……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

何时才能真正信任机器学习模型？

对机器学习模型的信任构建机器学习模型在今天相对直接：你训练它，最终会得到一个模型，它…

#machine learning #model trust #reliability #data drift #edge cases #high‑stakes AI #model interpretability
1个月前 · ai · - · -

[Paper] 使用算法配置技术寻找低星差的三维 Kronecker 点集

L∞星差距是衡量点集在给定空间中分布均匀程度的指标。低星差距的点集被用于设计……

#research #paper #ai
1个月前 · ai · - · -

[Paper] 可扩展的预训练大型 Mixture of Experts 语言模型在 Aurora 超级计算机上

从头预训练大型语言模型（LLMs）需要巨量的计算资源。Aurora 超级计算机是一台 ExaScale 机器，拥有 127,488 个 Intel PVC（P…）。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

如何每天避免超出 Claude 代码限制

《Como Evitar Exceder os Limites do Código Claude Diariamente》的封面图片

#Claude #token limits #usage quotas #prompt engineering #Anthropic #AI budgeting
1个月前 · ai · - · -

[Paper] G-ICSO-NAS：在梯度与群体之间切换档位，实现鲁棒的神经架构搜索

Neural Architecture Search (NAS) 已成为自动机器学习中的关键技术。基于进化算法 (EA) 的方法展示了卓越的……

#research #paper #ai
1个月前 · ai · - · -

我问ChatGPT WIRED的评论员推荐什么——它的答案全都错了

想知道我们的评测员实际测试并挑选出的最佳电视、耳机和笔记本电脑吗？问问ChatGPT，它会给你错误的答案……

#ChatGPT #AI accuracy #product recommendations #WIRED reviews #AI limitations
1个月前 · ai · - · -

Falcon 感知

仓库 !Falcon Perception https://cdn-avatars.huggingface.co/v1/production/uploads/61a8d1aac664736898ffc84f/AT6cAB5ZNwCcqFMal71WD.jpeg tiiuae/Falcon-OCR 图像…

#ai #ai-models #opensource
1个月前 · ai · - · -

预览工具帮助创客可视化 3D 打印对象

VisiPrint：AI 驱动的 3D 打印对象美学预览设计师、制造者以及其他创作者经常使用 3D 打印来快速原型化各种…

#3D printing #preview tool #VisiPrint #AI rendering #computer vision #MIT research #additive manufacturing
1个月前 · ai · - · -

Meta 的新结构化提示技术显著提升 LLM 在代码审查中的表现——在某些情况下将准确率提升至 93%

部署 AI 代理用于仓库规模的任务如 bug detection、patch verification 和 code review，需要……

#Meta #structured prompting #semi-formal reasoning #LLM #code review #AI agents #execution-free reasoning #software engineering
1个月前 · ai · - · -

Gradient Labs 为每位银行客户提供 AI 账户经理

在银行业，解决客户问题很少是简单的。像 fraud 或 blocked payments 这样的案例需要严格遵守跨多个部门的复杂程序……

#AI agents #banking #customer service automation #GPT-5.4 #Gradient Labs #fintech #voice AI #OpenAI models
1个月前 · ai · - · -

提升训练有效吞吐：持续检查点如何在 Orbax 和 MaxText 中优化可靠性

Orbax 和 MaxText 新引入的 continuous checkpointing 功能旨在优化模型训练期间可靠性与性能之间的平衡……

#continuous checkpointing #Orbax #MaxText #model training reliability #I/O optimization #large‑scale training #MTBF #checkpoint performance
1个月前 · ai · - · -

使用 LlamaParse 和 Gemini 3.1 构建智能金融助理

这篇博客文章介绍了一种工作流，通过将 LlamaParse 与 Gemini 3.1 模型相结合，从复杂的非结构化文档中提取高质量数据。它…

#LlamaParse #Gemini 3.1 #financial assistant #LLM #agentic parsing #unstructured data extraction #AI workflow
1个月前 · ai · - · -

通过智能体技能弥合知识差距

2026年3月25日大型语言模型（LLMs）拥有固定的知识，它们在特定时间点进行训练。软件工程实践节奏快且变化迅速……

#large language models #LLM knowledge gap #agent skills #AI tools #software engineering practices #Google DeepMind #Gemini API #SDK updates
1个月前 · ai · - · -

【论文】基于集合的价值函数表征与神经近似输入受限离散时间系统的稳定域

分析具有可稳定受控不变集（CISs）的非线性系统，需要准确估计它们的稳定域（DOS）以及…

#research #paper #ai
1个月前 · ai · - · -

Show HN: 1-Bit Bonsai，首个商业可行的 1-Bit LLM

1-bit Bonsai 8B !https://cdn.prod.website-files.com/697a3312d33c2cc715ec3899/69c94de785b70322d35e5374_chevron.svg 首个商业可行的 1 位模型

#1-bit LLM #model quantization #edge AI #robotics #energy efficiency #Bonsai #large language models
1个月前 · ai · - · -

[Paper] MAC-Attention：一种匹配‑修正‑完成方案，用于快速且精确的注意力计算

Long-context decoding 在 LLM 中是 IO‑bound：每个 token 会重新读取不断增长的 KV cache。之前的加速通过 compression 来削减字节，但这会降低 fidelity，o...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 基于特征分析和图卷积神经网络（GCN）的不同频段癫痫发作检测（来自脑电图（EEG）信号）

癫痫发作是一种神经系统疾病，其特征是大脑中异常且过度的电活动，导致复发性的发作事件。E...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] OmniRoam：通过长时程全景视频生成实现世界漫游

使用视频生成模型对场景进行建模近年来已引起日益增长的研究兴趣。然而，大多数现有方法依赖于透视视频……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 视频模型提前推理：利用计划承诺进行迷宫求解

视频扩散模型展现出诸如解迷宫和拼图等新兴推理能力，但人们对它们在生成过程中的推理方式知之甚少……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 使用基于Transformer的源代码表示自动识别可并行循环

自动并行化仍然是软件工程中的一个挑战性问题，尤其是在识别可以安全执行循环的代码区域时……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 3D几何计算机视觉中博士级编码的基准测试

AI辅助编码已迅速重塑软件实践和研究工作流，但当今的模型仍然难以为复杂的三维地质力学代码生成正确的结果。

#research #paper #ai #computer-vision

Newer posts

Older posts