[Paper] 数据重复胜过数据规模化 在 Long‑CoT 监督微调 中
在 chain-of-thought 数据上进行 Supervised fine-tuning (SFT) 是推理语言模型的关键后训练步骤。标准的机器学习直觉表明…
在 chain-of-thought 数据上进行 Supervised fine-tuning (SFT) 是推理语言模型的关键后训练步骤。标准的机器学习直觉表明…
欧氏距离在小波散射变换系数(称为路径)之间提供了用于感知质量评估的有信息的梯度……
统一多模态模型(UMMs)在视觉生成方面取得了显著进展。然而,现有基准主要评估结晶智力,……
投影(或降维)方法 P 旨在将高维数据映射到通常的二维散点图,以进行可视化探索。逆投影方法…
表格基础模型,例如 TabPFNv2 和 TabICL,最近在预测基准中取代了梯度提升树,展示了……
在大型语言模型(LLM)开发中,主流范式是先对基础模型进行预训练,然后进行进一步的训练以提升性能和模型……
扩散语言模型通过迭代细化生成文本,这一过程通常计算效率低下,因为许多标记在达到稳定状态后……
随着大型多模态模型的快速发展,可靠的judge和critic模型已成为开放式评估和preference alignment的关键。
自动生成 agentic 工作流——可执行的 operator 图或代码,用于编排推理、验证和修复——已成为一种实用的……
误信息检测是一项关键任务,能够显著受益于外部知识的整合,就像人工事实核查一样。在本...
Flow-matching 模型在图像和视频生成方面提供了最先进的保真度,但其固有的顺序去噪过程使其速度较慢。Existin...
我构建的 Archlyze 是一个仅限浏览器的 SPA,使用 Google Gemini 来分析 Rust、Python、JS/TS、Go 等源代码。它提取组件和依赖……
基于强化学习(RL)的后训练用于显式链式思考(例如 GRPO)提升了多模态大规模推理模型的推理能力。
大型语言模型(LLMs)中的错位指的是未能同时满足安全、价值和文化维度的要求,导致模型产生偏离预期的行为。
Biometric footstep recognition,基于人们在行走时脚下独特的压力模式,是一个新兴领域,应用正日益增长……
大型语言模型(LLMs)展示了强大的通用推理和语言理解能力,但在受严格形式约束的领域中,它们的性能会下降。
我们提出了 PuriLight,一个轻量且高效的框架,用于自监督单目深度估计,以应对计算效率方面的双重挑战……
Kakao凭借自主技术打造的最出色的Omni模型Kanana‑o,终于向大家正式发布。在正式商业化之前,我们邀请热情的开发者和合作伙伴,共同验证技术可能性并实现成长,启动Kanana‑o API Beta服务。韩语和韩国…
多任务策略搜索是一个具有挑战性的问题,因为策略需要在训练案例之外进行泛化。课程学习已被证明是有效的……
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
并非所有 RecSys 工作都是相同的。行业中的异常案例扭曲了我们对推荐系统的定义。TikTok、Spotify 和 Netflix 采用 hybrid……
项目概述 James J. Collins,MIT 医学工程与科学 Termeer 教授,Abdul Latif Jameel 诊所的教师共同负责人…
最近的研究表明,当 LLMs 被适当地提示和配置时,它们表现出混合的结果。这类结果往往能够达到或超过 baseline...
软件漏洞检测(SVD)是现代系统中的关键挑战。大型语言模型(LLMs)提供自然语言解释以及预…
我构建的 MemCP 是一个插入 Claude Code 的 MCP 服务器。它在你执行 /compact 时防止上下文丢失,并提供结构化的记忆系统。N...
我们都有过这种经历。你花了45分钟来微调一个 prompt。你添加了:- “Think step by step.” - “Be logically consistent.” - “Double‑check your reasoning.” 你…
引言:AI 正在软件测试的各个方面出现。脚本生成更快,结果自动汇总,仪表板承诺提供洞察……
引言 当我们谈论 AI 系统时,我们常常关注模型、训练数据和性能指标。在所有这些之下,隐藏着更为根本的……
大型语言模型(LLM)代理在自动化教学系统设计(ISD)方面展现出有希望的潜力,教学系统设计是一种系统化的教育开发方法……
虽然大多数 brain-computer interface 研究侧重于将 neural signals 解码为 behavior 或 intent,但相反的挑战是使用 controlled stimuli 来……
层次聚合聚类(Hierarchical Agglomerative Clustering,HAC)是一种广泛使用的聚类方法,基于反复合并最近的一对簇,依据簇间距离……
markdown !https://besuccess.com/wp-content/uploads/2024/08/img-2020-12-31-img-2020-12-31-Blue-Piano-Keys-Music-YouTube-Channel-Art-1-cut.pnghttps://www.koreatec...
检索增强生成(RAG)概述 RAG 已经从单一蓝图发展为多样化的架构生态系统,每种架构都针对特定的性能进行调优,...
Realfood.gov 网站使用 Elon Musk 的 Grok 聊天机器人提供营养信息——其中一些与政府的新指南相矛盾……
固态硬盘(SSD)对数据中心、消费平台和关键任务系统至关重要。然而,诊断它们的性能和可靠性却非常困难……
近期在 LLM 引导的进化计算,特别是 AlphaEvolve 方面的进展,已经展示了在发现新颖数学构造方面的显著成功……
大型语言模型(LLMs)经常提供看似合理的链式思考(CoT)推理轨迹,但可能隐藏内部偏见。我们将这些称为 *unverbalized* …
现实世界中为具身代理收集数据仍然成本高且不安全,这需要可扩展、逼真且可直接用于模拟器的 3D 环境。然而,现有的……
Multiple rotation averaging (MRA) 是 3D 视觉和机器人领域的一个基础优化问题,旨在恢复全局一致的绝对旋转 fr...
扩展 action‑controllable world models 受限于动作标签的稀缺。虽然 latent action learning 有望从 u… 提取 control interfaces。
从未标记的视频数据中学习可迁移的知识并将其应用于新环境,是智能体的一项基本能力。该工作预…
数据隐私和可解释人工智能(XAI)是现代机器学习系统的两个重要方面。为了增强数据隐私,最近的机器…
利用表示编码器进行生成建模提供了一条实现高效、高保真合成的路径。然而,标准的 diffusion transformers 未能…
在互联网规模的视频上进行视觉-语言-动作(VLA)策略的预训练很有吸引力,但当前的潜在动作目标往往学习错误的东西:它们……
我们研究单个训练样本如何塑造循环变换器的内部计算,其中共享块被应用于 τ 次递归迭代到 e...
语言模型已成为量子计算教育和研究的实用工具,从摘要技术论文到解释理论概念等。
我们介绍了 Forensim,这是一种基于注意力的状态空间框架,用于图像伪造检测,可同时定位被篡改(目标)区域和源区域……