ai — 页 8 | EUNO.NEWS

排序:

1周前 · ai · - · -

Hacker News 上的 LLM 研究正在枯竭

我觉得最近在 Hacker News（HN）首页上看到的 arXiv 论文变少了，我想确认这是否属实。所以我让 Claude …

#LLM #arXiv #deep learning #Hacker News #trend analysis #Claude #BigQuery
1周前 · ai · - · -

将会有深度学习的科学理论

作者：Jamie Simon https://arxiv.org/search/stat?searchtype=author&query=Simon,+J, Daniel Kunin https://arxiv.org/search/stat?searchtype=author&query=Kunin,+D,…

#deep learning #theory #neural networks #machine learning research #arXiv
1周前 · ai · - · -

[Paper] 少花钱，拟合更好：通过主动实验选择实现预算高效的 Scaling Law 拟合

Scaling laws 被用于规划 multi-million-dollar training runs，但拟合这些定律本身也可能花费数百万。在现代大规模工作流中，组装一个…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 针对全球多数民族的LLM生成叙事中的表征伤害

大型语言模型（LLMs）正日益用于从日常使用到高风险企业和政府应用的文本生成任务，包括……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] Agentic World Modeling：基础、能力、定律及其之外

随着 AI 系统从生成文本转向通过持续交互实现目标，建模环境动态的能力成为一个核心瓶颈……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 基于松弛感知的神经网络代理模型训练

经过训练的 ReLU 神经网络作为代理模型可以精确嵌入混合整数线性规划（MILP）中，从而实现对所学习模型的全局优化。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 对计划存在性问题的不可判定性证明

计划存在性问题询问，给定一个以模态逻辑公式形式表示的目标、一个初始认知状态（一个指向的 Kripke 模型），以及一组认知…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 基于神经网络的从现代数据恢复班图语历史词汇结构

我们调查仅在现代形态数据上训练的神经模型是否能够恢复与历史重建一致的跨语言词汇结构。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

Spotify 不是唯一现在已与 Anthropic 的 Claude 集成的服务

本周，Spotify 推出了新的 AI 功能。

#Anthropic #Claude #AI assistants #service integrations #Spotify #Instacart #Uber #connector ecosystem
1周前 · ai · - · -

[Paper] 零样本形态学发现于低资源班图语的跨语言迁移与无监督聚类

我们提出了一种方法，通过将跨语言迁移学习与无监督聚类相结合，来发现低资源班图语言的形态特征。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

Project Maven 教会军方爱上 AI

在对伊朗的首次进攻的前24小时内，美国军方打击了超过1000个目标，规模几乎是对伊拉克“shock and awe”攻击的两倍……

#Project Maven #military AI #computer vision #drone surveillance #AI ethics #Google #defense technology
1周前 · ai · - · -

MIT 科学家构建全球最大的奥赛级数学题库，并向所有人开放

概述每年，参加 International Mathematical Olympiad (IMO) 的各国都会带来一本汇集其最佳、最具原创性的题目小册子。这些...

#ai #ai-research #academia
1周前 · ai · - · -

[Paper] 长尾互联网照片重建

Internet 照片集合呈现出极度长尾分布：少数著名地标被大量拍摄，且易于在 3D 中重建，而 …

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 无文字思考：使用抽象 Chain-of-Thought 的高效潜在推理

虽然冗长的、明确的思维链（chains-of-thought，CoT）已被证明在复杂推理任务上有效，但在推理时生成它们成本很高。非语言推理……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 呼吸气流的时间局部化参数分解用于子呼吸分析

呼吸气流信号提供了对呼吸力学的关键洞察，但传统分析方法在表征方面仍然受限……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] CRAFT：用于训练数据自适应过滤的聚类回归

在大型语料库中选择一个小而高质量的子集用于微调变得越来越重要，因为语料库规模已增长到数千万个数据点，使得 …

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

Google向Anthropic投资最高400亿美元，后者是Claude背后的公司

谷歌正准备对 Anthropic（Claude 背后的公司）进行大规模投资，尽管其自家的 Gemini 模型正与该 AI 公司竞争。彭博社报道……

#google #anthropic #claude #investment #large language model #AI funding #partnership
1周前 · ai · - · -

[Paper] SS3D：端到端自监督 3D 来自网络视频

我们提出了 SS3D，一个基于 SfM 的大规模网络自监督预训练流水线，用于从单目视频进行前馈 3D 估计。我们的模型联合预测深度……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 供应链依赖如何使 AI 招聘应用中的偏差测量和责任归属变得复杂

在招聘中日益采用 AI 系统引发了对算法偏见和问责制的担忧，促使监管响应，包括欧盟 AI 法案……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 通过白盒信号子空间探针对图数据集的操作特征指纹

图神经网络在节点分类准确率方面表现出色，但它们学习到的信息传递将 ego attributes、neighborhood smoothing、high-pass 等纠缠在一起。

#research #paper #ai #machine-learning
1周前 · ai · - · -

如何构建不会遗忘的 Agent Memory

问题每个 AI 开发者都会遇到这个壁垒：你的 agent 在第一天表现很好，但随后会悄然退化。它开始做出更糟的决策，使用的工具也更少，……

#agent memory #autonomous agents #LLM #prompt engineering #memory architecture #observability #AI development
1周前 · ai · - · -

[Paper] 重新思考 XAI 评估：在高风险场景中对 Shapley 基准的以人为本审计

Shapley values 是可解释 AI 的基石，但它们在各种竞争性表述中的激增导致了一个碎片化的局面，几乎没有共识……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] PASR：姿态感知 3D 形状检索从遮挡的单视图

单视图 3D 形状检索是一个基础且具有挑战性的任务，随着可用 3D 数据的增长，其重要性日益提升。现有方法...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 基于结构引导的扩散模型用于EEG视觉认知重建

目标：从脑电图（EEG）解码视觉信息是神经科学和脑机接口（BCI）研究中的重要问题。Ex...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 质量驱动的深度学习选择性变异

Mutants 在测试和调试中支持两种角色：(i) 作为测试目标，(ii) 作为真实错误的替代品。难以杀死的 Mutants 能提供更好的指导……

#research #paper #ai #machine-learning
1周前 · ai · - · -

为22种语言构建：印度Health AI的隐形障碍 - GoDavaii 第5天

介绍：今天是 GoDavaii 冲刺的第 5 天，我们已有 379 名用户，目标是覆盖印度及全球的 100,000 个家庭。每天都带来新的 ch...

#health AI #multilingual NLP #Indian languages #medical AI #language understanding #localization #GoDavaii
1周前 · ai · - · -

利用 bug，而不是模型 bug

用于 Harness bugs 而非 model bugs 的封面图片

#Anthropic #Claude #LLM #AI bugs #postmortem #model harness #AI code reliability #software engineering
1周前 · ai · - · -

不同语言模型学习相似的数字表示

摘要：在自然文本上训练的语言模型学习使用周期特征来表示数字，其主导周期为 T = 2、5、10。本文中，我们……

#language models #transformers #periodic features #Fourier analysis #number representation #modular classification #embeddings
1周前 · ai · - · -

[Paper] 重新思考数学推理评估：一种超越符号刚性的稳健 LLM-as-a-Judge 框架

近期在大型语言模型方面的进展显著提升了各类任务的表现，包括用于评估的数学推理。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 有用的非鲁棒特征在生物医学图像中无处不在

我们研究深度网络在医学影像中是否学习到有用的 nonrobust features —— 这些是不可被人类解释且高度易感的 predictive input patterns……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[论文] QuantClaw：在关键位置的精度用于 OpenClaw

自主代理系统（如 OpenClaw）由于长上下文输入和多轮推理，引入了显著的效率挑战。这导致了 prohi...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

Claude Code、定价差距与自建 AI 的崛起

背景：2026年4月21日，Anthropic悄悄地将Claude Code从其$20 Pro计划中移除——没有邮件、没有公告、没有更新日志。定价页面随之更改……

#Anthropic #Claude Code #AI pricing #LLM #AI tools #subscription model #GitHub Copilot #AI product strategy
1周前 · ai · - · -

机器学习揭示历史图像中的未知瞬态现象

摘要：在斯普特尼克发射之前的天文图像中描述了出现并在短时间尺度内消失的瞬态、星状点源。我们 ha...

#machine learning #astronomy #transient detection #image analysis #historical photographic plates #AUC #nuclear testing correlation
1周前 · ai · - · -

[Paper] 学习证据高亮用于 Frozen LLMs

大型语言模型（LLMs）能够进行良好的推理，但在长且噪声较多的上下文中，关键证据往往被埋藏，从而被忽略。我们提出了 HiLight，一种 Evidence Emph…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

DeepSeek 预览新 AI 模型，‘弥合’与前沿模型的差距

概述：中国人工智能实验室 DeepSeek 已推出其最新大型语言模型 DeepSeek V4 的两个预览版 https://huggingface.co/collections/deepseek-a...

#DeepSeek #large language model #Mixture-of-Experts #V4 Flash #V4 Pro #open-weight model #1 million token context #AI model preview
1周前 · ai · - · -

[论文] HubRouter：一种可插拔的次二次路由原语，用于混合序列模型

我们引入 HubRouter，一个可插拔模块，用于将 O(n^2) 注意力层替换为 O(nM) 的 hub‑mediated 路由，其中 M << n 是一个很小的学习数量……

#research #paper #ai #machine-learning
1周前 · ai · - · -

中国 DeepSeek 在震撼美国竞争对手一年后预览新 AI 模型

中国AI公司DeepSeek于周五发布了备受期待的下一代AI模型V4的预览，并表示该开源模型可以与……

#DeepSeek #V4 #large language model #open-source AI #AI coding assistants #Huawei compatibility #China AI competition #LLM benchmarks
1周前 · ai · - · -

这些 AI “Thirst Trap” 创作者称他们被误解

一次病毒式的红毯瞬间让一群健美的 Instagram 网红曝光——以及那些欲火焚身、根本不在乎他们不是真实人物的粉丝……

#AI-generated content #deepfake #virtual influencers #Instagram #synthetic media
1周前 · ai · - · -

为什么你的 LLM 可能存在 PII 问题（以及如何解决）

大多数构建 LLM 应用的团队都会考虑提示注入。很少有团队会考虑用户向模型发送敏感个人数据时会发生什么。这是……

#LLM #PII #privacy #data security #compliance #prompt injection #regex filtering #AI applications
1周前 · ai · - · -

韩国警方逮捕男子，因AI图像误导当局的逃跑狼

韩国警方逮捕因发布逃跑狼的 AI 照片的男子！狼的背面在交叉口附近的道路上行走的画面 https://ichef.bbci.co.uk/news/4...

#AI-generated image #deepfake #misinformation #South Korea #police arrest #wolf escape
1周前 · ai · - · -

开发者在“切换模型”时忽视的三层（以及为何代理路由 Claude 代码会把它们全部弄坏）

开发者喜欢捷径。但有些捷径不仅仅是缩短构建时间——它们还会削弱信任边界。一个新的 proxy 工具正在流传，它可以让你 poi...

#LLM #Claude Code #model proxy #inference substrate #agentic runtime #prompt engineering #AI safety
1周前 · ai · - · -

DeepSeek-V4：迈向高效的百万标记上下文智能

文章 URL: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro 评论 URL: https://news.ycombinator.com/item?id=47885014 得分: 134 评论数: 11

#DeepSeek-V4 #large language model #million-token context #efficient inference #huggingface
1周前 · ai · - · -

白宫备忘录称中国企业大规模AI盗窃

!EPA Michael Kratsios，白宫技术事务主任兼顾问，站在讲台上对着麦克风讲话，身穿黑色西装外套，白色衬衫……

#AI #industrial espionage #China #White House #technology policy #AI theft
1周前 · ai · - · -

DeepSeek-V4：代理实际可用的百万 token 上下文

文本生成 • 158B • 约5小时前更新 • 23 • 536 /deepseek-ai/DeepSeek-V4-Flash...

#DeepSeek-V4 #million-token context #large language model #AI agents #text generation #Hugging Face
1周前 · ai · - · -

谜团已解：Anthropic 揭示对 Claude 的 harnesses 和操作说明的更改可能导致性能下降

在过去的几周里，开发者和 AI 高级用户报告称，Anthropic 的旗舰模型正在失去优势。在 GitHub、X 和 Reddit 上，社区……

#Anthropic #Claude #LLM #model degradation #AI shrinkflation #hallucinations #token efficiency #post‑mortem
1周前 · ai · - · -

OpenAI 称其新 GPT-5.5 模型更高效且更擅长编码

概述：OpenAI 今日发布了其全新的 GPT‑5.5 模型，称其为“迄今为止最智能、最直观易用的模型，也是迈向全新方式的下一步”。

#OpenAI #GPT-5.5 #large language model #AI coding assistance #model efficiency #AI safety #Codex
1周前 · ai · - · -

[Paper] 切分梯度，扩展模型：通过梯度分区实现无服务器联邦聚合

联邦学习（FL）在无服务器平台上的聚合面临硬性的可扩展性上限：现有架构（lambda-FL、LIFL）将客户端划分到 …

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] LTBs-KAN: 线性时间 B样条 Kolmogorov‑Arnold 网络

Kolmogorov-Arnold Networks（KANs）是一种近期的神经网络架构，提供了相较于多层感知器（MLPs）更好的可解释性替代方案……

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts