· ai
[论文] Softmax 作为大提示场景下的线性注意力:基于测度的视角
Softmax attention 是 transformer 架构的核心组成部分,但其 nonlinear 结构对理论分析提出了重大挑战。我们 dev...
Softmax attention 是 transformer 架构的核心组成部分,但其 nonlinear 结构对理论分析提出了重大挑战。我们 dev...
大型语言模型(LLMs)的快速部署在机器学习(ML)领域产生了对加强安全和隐私措施的迫切需求。LLMs 正在...
视频抠图仍受限于现有数据集的规模和真实感。虽然利用分割数据可以提升语义稳定性,但缺乏 effe...
通过多智能体竞争以及赢得比赛的稀疏高层目标,我们发现敏捷飞行(例如,高速运动推动平台……)的表现。
评估 conditional coverage 仍然是评估 predictive systems 可靠性时最持久的挑战之一。虽然 conformal methods 可以……
基于坐标的神经网络已经成为表示连续物理场的强大工具,但它们面临两个根本性病理:光谱……
公共区块链本身吞吐量低、延迟高,这促使人们寻找链下可扩展性解决方案,例如支付通道网络(Payment Channel Networks,PCNs)。然而……
模型指纹检测技术已经成为一种有前景的方法,用于将 AI 生成的图像归属到其源模型,但它们的鲁棒性仍然...
我们提出了一种无监督机器学习框架,能够发现量子多体基态的最优压缩表示。利用自动编码器……
生成逼真的合成显微图像对于在标签稀缺的环境中训练深度学习模型至关重要,例如在细胞计数等任务中。
联邦学习(FL)将模型训练分布在保留本地数据的客户端上,但这种架构暴露了一个根本性的漏洞:Byza...
在线产品评论包含丰富但嘈杂的信号,这些信号会让用户不堪重负,妨碍有效的决策。现有的基于LLM的摘要工具仍然是通用的……