[Paper] GENIUS:生成式流体智力评估套件
统一多模态模型(UMMs)在视觉生成方面取得了显著进展。然而,现有基准主要评估结晶智力,……
3122 posts from this source
统一多模态模型(UMMs)在视觉生成方面取得了显著进展。然而,现有基准主要评估结晶智力,……
投影(或降维)方法 P 旨在将高维数据映射到通常的二维散点图,以进行可视化探索。逆投影方法…
表格基础模型,例如 TabPFNv2 和 TabICL,最近在预测基准中取代了梯度提升树,展示了……
在大型语言模型(LLM)开发中,主流范式是先对基础模型进行预训练,然后进行进一步的训练以提升性能和模型……
扩散语言模型通过迭代细化生成文本,这一过程通常计算效率低下,因为许多标记在达到稳定状态后……
我们研究在给定的有限线段以及具有有限正半径的圆上,对 n 台移动机器人群的 min-sum uniform coverage problem,其中……
随着大型多模态模型的快速发展,可靠的judge和critic模型已成为开放式评估和preference alignment的关键。
自动生成 agentic 工作流——可执行的 operator 图或代码,用于编排推理、验证和修复——已成为一种实用的……
误信息检测是一项关键任务,能够显著受益于外部知识的整合,就像人工事实核查一样。在本...
Flow-matching 模型在图像和视频生成方面提供了最先进的保真度,但其固有的顺序去噪过程使其速度较慢。Existin...
基于强化学习(RL)的后训练用于显式链式思考(例如 GRPO)提升了多模态大规模推理模型的推理能力。
大型语言模型(LLMs)中的错位指的是未能同时满足安全、价值和文化维度的要求,导致模型产生偏离预期的行为。
Biometric footstep recognition,基于人们在行走时脚下独特的压力模式,是一个新兴领域,应用正日益增长……
大型语言模型(LLMs)展示了强大的通用推理和语言理解能力,但在受严格形式约束的领域中,它们的性能会下降。
我们提出了 PuriLight,一个轻量且高效的框架,用于自监督单目深度估计,以应对计算效率方面的双重挑战……
多任务策略搜索是一个具有挑战性的问题,因为策略需要在训练案例之外进行泛化。课程学习已被证明是有效的……
最近的研究表明,当 LLMs 被适当地提示和配置时,它们表现出混合的结果。这类结果往往能够达到或超过 baseline...
软件漏洞检测(SVD)是现代系统中的关键挑战。大型语言模型(LLMs)提供自然语言解释以及预…
大型语言模型(LLMs)正日益被集成到软件系统中,催生了一类新系统,称为 LLMware。超越传统……
大型语言模型(LLM)代理在自动化教学系统设计(ISD)方面展现出有希望的潜力,教学系统设计是一种系统化的教育开发方法……
虽然大多数 brain-computer interface 研究侧重于将 neural signals 解码为 behavior 或 intent,但相反的挑战是使用 controlled stimuli 来……
层次聚合聚类(Hierarchical Agglomerative Clustering,HAC)是一种广泛使用的聚类方法,基于反复合并最近的一对簇,依据簇间距离……
Global protocols 从鸟瞰视角指定分布式、message‑passing 协议,并用作 synthesizing 本地实现的 specification。
AMD MI300A APU 将 CDNA3 GPU 与高带宽内存和先进的加速器特性集成在一起:FP8 矩阵核心、异步计算引擎(ACE),以及……