Hacker News 上的 LLM 研究正在枯竭
我觉得最近在 Hacker News(HN)首页上看到的 arXiv 论文变少了,我想确认这是否属实。所以我让 Claude …
我觉得最近在 Hacker News(HN)首页上看到的 arXiv 论文变少了,我想确认这是否属实。所以我让 Claude …
作者:Jamie Simon https://arxiv.org/search/stat?searchtype=author&query=Simon,+J, Daniel Kunin https://arxiv.org/search/stat?searchtype=author&query=Kunin,+D,…
Scaling laws 被用于规划 multi-million-dollar training runs,但拟合这些定律本身也可能花费数百万。在现代大规模工作流中,组装一个…
大型语言模型(LLMs)正日益用于从日常使用到高风险企业和政府应用的文本生成任务,包括……
随着 AI 系统从生成文本转向通过持续交互实现目标,建模环境动态的能力成为一个核心瓶颈……
经过训练的 ReLU 神经网络作为代理模型可以精确嵌入混合整数线性规划(MILP)中,从而实现对所学习模型的全局优化。
计划存在性问题询问,给定一个以模态逻辑公式形式表示的目标、一个初始认知状态(一个指向的 Kripke 模型),以及一组认知…
我们调查仅在现代形态数据上训练的神经模型是否能够恢复与历史重建一致的跨语言词汇结构。
本周,Spotify 推出了新的 AI 功能。
我们提出了一种方法,通过将跨语言迁移学习与无监督聚类相结合,来发现低资源班图语言的形态特征。
在对伊朗的首次进攻的前24小时内,美国军方打击了超过1000个目标,规模几乎是对伊拉克“shock and awe”攻击的两倍……
概述 每年,参加 International Mathematical Olympiad (IMO) 的各国都会带来一本汇集其最佳、最具原创性的题目小册子。这些...
Internet 照片集合呈现出极度长尾分布:少数著名地标被大量拍摄,且易于在 3D 中重建,而 …
虽然冗长的、明确的思维链(chains-of-thought,CoT)已被证明在复杂推理任务上有效,但在推理时生成它们成本很高。非语言推理……
呼吸气流信号提供了对呼吸力学的关键洞察,但传统分析方法在表征方面仍然受限……
在大型语料库中选择一个小而高质量的子集用于微调变得越来越重要,因为语料库规模已增长到数千万个数据点,使得 …
谷歌正准备对 Anthropic(Claude 背后的公司)进行大规模投资,尽管其自家的 Gemini 模型正与该 AI 公司竞争。彭博社报道……
我们提出了 SS3D,一个基于 SfM 的大规模网络自监督预训练流水线,用于从单目视频进行前馈 3D 估计。我们的模型联合预测深度……
在招聘中日益采用 AI 系统引发了对算法偏见和问责制的担忧,促使监管响应,包括欧盟 AI 法案……
图神经网络在节点分类准确率方面表现出色,但它们学习到的信息传递将 ego attributes、neighborhood smoothing、high-pass 等纠缠在一起。
问题 每个 AI 开发者都会遇到这个壁垒:你的 agent 在第一天表现很好,但随后会悄然退化。它开始做出更糟的决策,使用的工具也更少,……
Shapley values 是可解释 AI 的基石,但它们在各种竞争性表述中的激增导致了一个碎片化的局面,几乎没有共识……
单视图 3D 形状检索是一个基础且具有挑战性的任务,随着可用 3D 数据的增长,其重要性日益提升。现有方法...
目标:从脑电图(EEG)解码视觉信息是神经科学和脑机接口(BCI)研究中的重要问题。Ex...
Mutants 在测试和调试中支持两种角色:(i) 作为测试目标,(ii) 作为真实错误的替代品。难以杀死的 Mutants 能提供更好的指导……
介绍:今天是 GoDavaii 冲刺的第 5 天,我们已有 379 名用户,目标是覆盖印度及全球的 100,000 个家庭。每天都带来新的 ch...
用于 Harness bugs 而非 model bugs 的封面图片
摘要:在自然文本上训练的语言模型学习使用周期特征来表示数字,其主导周期为 T = 2、5、10。本文中,我们……
近期在大型语言模型方面的进展显著提升了各类任务的表现,包括用于评估的数学推理。
我们研究深度网络在医学影像中是否学习到有用的 nonrobust features —— 这些是不可被人类解释且高度易感的 predictive input patterns……
自主代理系统(如 OpenClaw)由于长上下文输入和多轮推理,引入了显著的效率挑战。这导致了 prohi...
背景:2026年4月21日,Anthropic悄悄地将Claude Code从其$20 Pro计划中移除——没有邮件、没有公告、没有更新日志。定价页面随之更改……
摘要:在斯普特尼克发射之前的天文图像中描述了出现并在短时间尺度内消失的瞬态、星状点源。我们 ha...
大型语言模型(LLMs)能够进行良好的推理,但在长且噪声较多的上下文中,关键证据往往被埋藏,从而被忽略。我们提出了 HiLight,一种 Evidence Emph…
概述:中国人工智能实验室 DeepSeek 已推出其最新大型语言模型 DeepSeek V4 的两个预览版 https://huggingface.co/collections/deepseek-a...
我们引入 HubRouter,一个可插拔模块,用于将 O(n^2) 注意力层替换为 O(nM) 的 hub‑mediated 路由,其中 M << n 是一个很小的学习数量……
中国AI公司DeepSeek于周五发布了备受期待的下一代AI模型V4的预览,并表示该开源模型可以与……
一次病毒式的红毯瞬间让一群健美的 Instagram 网红曝光——以及那些欲火焚身、根本不在乎他们不是真实人物的粉丝……
大多数构建 LLM 应用的团队都会考虑提示注入。很少有团队会考虑用户向模型发送敏感个人数据时会发生什么。这是……
韩国警方逮捕因发布逃跑狼的 AI 照片的男子!狼的背面在交叉口附近的道路上行走的画面 https://ichef.bbci.co.uk/news/4...
开发者喜欢捷径。但有些捷径不仅仅是缩短构建时间——它们还会削弱信任边界。一个新的 proxy 工具正在流传,它可以让你 poi...
文章 URL: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro 评论 URL: https://news.ycombinator.com/item?id=47885014 得分: 134 评论数: 11
!EPA Michael Kratsios,白宫技术事务主任兼顾问,站在讲台上对着麦克风讲话,身穿黑色西装外套,白色衬衫……
文本生成 • 158B • 约5小时前更新 • 23 • 536 /deepseek-ai/DeepSeek-V4-Flash...
在过去的几周里,开发者和 AI 高级用户报告称,Anthropic 的旗舰模型正在失去优势。在 GitHub、X 和 Reddit 上,社区……
概述:OpenAI 今日发布了其全新的 GPT‑5.5 模型,称其为“迄今为止最智能、最直观易用的模型,也是迈向全新方式的下一步”。
联邦学习(FL)在无服务器平台上的聚合面临硬性的可扩展性上限:现有架构(lambda-FL、LIFL)将客户端划分到 …
Kolmogorov-Arnold Networks(KANs)是一种近期的神经网络架构,提供了相较于多层感知器(MLPs)更好的可解释性替代方案……