[Paper] 针对 Kolmogorov-Arnold 网络的优化架构
在尝试通过架构增强来改进 Kolmogorov‑Arnold 网络(KANs)时,这些增强带来的复杂性阻碍了进展,削弱了 t...
4788 posts from this source
在尝试通过架构增强来改进 Kolmogorov‑Arnold 网络(KANs)时,这些增强带来的复杂性阻碍了进展,削弱了 t...
基于忆阻器的内存计算已成为一种有前景的范式,通过实现克服冯·诺依曼瓶颈和内存墙的限制。
准确的波动率预测在银行业、投资和风险管理中至关重要,因为对未来市场走势的预期直接影响……
3D Gaussian Splatting(3DGS)的最新成功通过实现快速优化和实时渲染高质量辐射,重新塑造了新视角合成。
大规模视频生成模型在对真实场景的逼真外观和光照交互建模方面展现了显著潜力。然而...
我们提出了 Particulate,这是一种前馈方法,给定单个静态的日常物体 3D 网格,直接推断出其底层结构的所有属性。
大规模且多样化的机器人示范数据的收集仍然是模仿学习的主要瓶颈,因为真实世界的数据获取成本高且 s...
许多系统在其组件之间表现出复杂的相互作用:某些特征或行为会相互放大效果,其他则提供冗余信息,……
现实是一场在刚性约束与可变结构之间的舞蹈。对于视频模型而言,这意味着生成既保持保真度又保持结构的运动……
在常规临床照片中准确量化白癜风的范围对于纵向监测治疗反应至关重要。我们提出一种可信的,f...
Softmax attention 是 transformer 架构的核心组成部分,但其 nonlinear 结构对理论分析提出了重大挑战。我们 dev...
大型语言模型(LLMs)的快速部署在机器学习(ML)领域产生了对加强安全和隐私措施的迫切需求。LLMs 正在...
视频抠图仍受限于现有数据集的规模和真实感。虽然利用分割数据可以提升语义稳定性,但缺乏 effe...
通过多智能体竞争以及赢得比赛的稀疏高层目标,我们发现敏捷飞行(例如,高速运动推动平台……)的表现。
评估 conditional coverage 仍然是评估 predictive systems 可靠性时最持久的挑战之一。虽然 conformal methods 可以……
基于坐标的神经网络已经成为表示连续物理场的强大工具,但它们面临两个根本性病理:光谱……
公共区块链本身吞吐量低、延迟高,这促使人们寻找链下可扩展性解决方案,例如支付通道网络(Payment Channel Networks,PCNs)。然而……
模型指纹检测技术已经成为一种有前景的方法,用于将 AI 生成的图像归属到其源模型,但它们的鲁棒性仍然...
我们提出了一种无监督机器学习框架,能够发现量子多体基态的最优压缩表示。利用自动编码器……
生成逼真的合成显微图像对于在标签稀缺的环境中训练深度学习模型至关重要,例如在细胞计数等任务中。
联邦学习(FL)将模型训练分布在保留本地数据的客户端上,但这种架构暴露了一个根本性的漏洞:Byza...
在线产品评论包含丰富但嘈杂的信号,这些信号会让用户不堪重负,妨碍有效的决策。现有的基于LLM的摘要工具仍然是通用的……
确保 AI-enabled 系统的安全,特别是在 autonomous driving 和 healthcare 等高风险领域,已变得日益关键。Trad...
基于视觉基础模型(Visual Foundation Model,VFM)表征的视觉生成提供了一条极具前景的统一路径,用于整合视觉理解、感知……
本文通过引入一种名为 Generative Parametric Design (GPD) 的新框架,提出了仿真驱动工程科学中的一种新范式。GPD …
脉冲神经网络(SNNs),被视为人工神经网络的第三代,预计能够弥合人工智能与……
最近的视频分析进展通过为各个摄像头持续重新训练专用的轻量级 DNN 模型来应对实时数据漂移。然而,...
虽然 voice-based AI systems 已经实现了显著的 generative capabilities,但它们的交互往往在对话上显得支离破碎。本文考察了其中的……
Speculative generation 已成为一种有前景的技术,通过利用并行性来验证多个…,加速大型语言模型(LLMs)的推理。
从闭环数据中学习控制器参数已被证明可以提升闭环性能。贝叶斯优化是一种广泛使用的黑箱和采样……
对时空动力学的精确建模对于理解科学和工程中的复杂现象至关重要。然而,这项任务面临着根本的...
临床医学中的治疗决策是一个高风险领域,AI 指导与患者特征之间的复杂相互作用相互影响……
大型语言模型(LLMs)正日益嵌入学术写作实践中。虽然已有大量研究探讨了研究人员如何使用这些工具……
Snowflake 风格的分布式 ID 生成器是大规模生成 k-ordered、唯一标识符的行业标准。然而,传统的要求 f...
从大量非结构化的历史报纸档案中提取连贯且人类可理解的主题面临重大挑战,原因是……
介绍 FirecREST v2,它是我们开源 RESTful API 的下一代,用于以编程方式访问 HPC 资源。FirecREST v2 提供了 100 倍的性能提升……
检索增强生成(RAG)模型依赖检索到的证据来指导大型语言模型(LLM)生成器,然而当前系统将检索视为……
编码代理正变得越来越能够完成以前需要人工开发者的端到端软件工程工作流,包括 ra...
我们考虑审计 black-box 大型语言模型(LLMs)的问题,以确保它们在生产环境中部署时能够可靠运行,特别是在……
社交媒体在现代政治中是关键的媒介,因为它既反映了政治家的意识形态,又促进了与年轻一代的沟通。
对牙科中的多模态数据进行可靠的解释对于自动化口腔健康护理至关重要,然而当前的多模态大语言模型(MLLMs)仍面临困难……
在视频理解中,关键帧选择面临重大挑战。传统的 top‑K 选择方法会独立对帧进行打分,往往会失败于……
对边缘设备上实时 DNN 应用的需求日益增长,需要更快地推理日益复杂的模型。虽然许多设备包括 sp...
在不断演进的云计算和网络环境中,服务功能链(SFC)在实现复杂服务方面发挥着关键作用。
使用 closeness centrality 识别中心节点是分析大规模复杂网络的关键任务,但其去中心化计算仍然是 cha...
大型语言模型(LLMs)在自然语言理解和推理方面展现出卓越的能力,但却存在幻觉问题:生成的 f...
专注于代码的大型语言模型(CodeLLM)在生成代码片段、文档和测试用例方面展示了卓越的能力。Howe...
从手工设计的启发式方法向数据驱动的进化算法转变面临一个根本性的两难困境:在实现神经可塑性的同时不牺牲 …