[Paper] InftyThink+: 有效且高效的无限时域推理通过强化学习
大型推理模型通过扩展推理时的 chain-of-thought 实现了强大的性能,但这种范式面临二次成本、上下文长度限制……
3122 posts from this source
大型推理模型通过扩展推理时的 chain-of-thought 实现了强大的性能,但这种范式面临二次成本、上下文长度限制……
AI 代理能预测它们在任务上是否会成功吗?我们通过在任务的前期、进行中和结束后获取成功概率估计来研究 agentic uncertainty。
本文提出了针对主动磁悬浮系统的数据驱动最优导数反馈控制器的设计与实现。一个直接的,mod...
Tokenization 是神经语言建模在形态丰富语言(MRLs)如土耳其语中的关键设计选择,因为该语言具有高度的生产性黏着构词。
学习既在语义上有意义又在不同运行之间保持稳定的无监督表征仍然是现代表征学习中的核心挑战。
深度神经网络的分类性能在很大程度上依赖于获取大规模、准确标注的数据集。然而,在医学影像领域,获取……
真实的 sound propagation 对于虚拟场景的沉浸感至关重要,然而物理上精确的 wave-based simulations 在计算上仍然难以承受……
通用 AI 架构能否超越预测,去发现支配宇宙的物理定律?真正的智能依赖于 “world models” —— ca...
视觉大语言模型(VLLMs)的视觉能力一直落后于其语言能力。尤其是,许多基准测试…
完全无监督的 segmentation pipelines 天真地寻找最显著的对象(如果存在的话)。因此,文献中报告的大多数方法……
贝叶斯最优实验设计(BOED)旨在最大化实验的期望信息增益(EIG)。这需要对似然进行估计,...
用于文本到图像生成的多模态扩散变换器(MMDiTs)保持独立的文本和图像分支,并在它们之间实现双向信息流……
Transformer 架构的平滑性已在泛化、训练稳定性和对抗鲁棒性方面得到广泛研究。Ho...
虽然 large-scale text-to-image diffusion models 在 visual quality 上持续提升,但它们日益增长的规模扩大了 state-of-the-art 模式之间的差距。
大型语言模型(LLMs)在生成代码时常会出现细微但关键的错误,尤其是在处理复杂任务时。现有的自动修复方法通常依赖于…
教学视频编辑仅使用文本提示对输入视频进行编辑,实现直观的自然语言控制。尽管进展迅速,大多数 m...
我们研究了大语言模型(LLMs)在多目标对齐中的一种持续性失效模式:训练仅在部分目标上提升性能……
多轮 jailbreak 捕捉了安全对齐聊天机器人的真实威胁模型,其中单轮攻击仅是一个特例。然而现有方法 br...
认知科学中的一个核心问题是,概念表征是汇聚到共享的流形以支持泛化,还是分散成正交的……
确保嵌入式固件的软件质量至关重要,尤其是在安全关键领域,需要遵循功能安全标准(ISO 26262)……
歧义在大型语言模型(LLMs)的自然语言理解中持续带来挑战。为了更好地了解词汇歧义如何被解决……
ISAC 实现了普遍监测,但现代传感算法往往对能量受限的边缘设备来说过于复杂。这促使人们开发 le...
结构偏差(Structural bias,SB)指的是优化算法对搜索空间中特定区域的系统性偏好,这种偏好独立于目标函数而产生。
CI/CD 流水线故障管理在手动执行时非常耗时。自动化此过程并不容易,因为实现有效所需的信息……