[Paper] 层次时间感受窗口与零样本时间尺度泛化在生物约束的尺度不变深度网络中
人类认知在嵌套的时间尺度上整合信息。虽然大脑皮层表现出层次化的Temporal Receptive Windows (TRWs),但局部电路常常……
3293 posts from this source
人类认知在嵌套的时间尺度上整合信息。虽然大脑皮层表现出层次化的Temporal Receptive Windows (TRWs),但局部电路常常……
大语言模型微调受内存瓶颈限制:一个 7B 参数模型需要 84GB——14GB 用于权重,14GB 用于梯度,56GB 用于 FP32 优化……
我们研究量子软件工程(QSE)生态系统的现状,重点关注学术界和工业界的成就、活动和参与。
Oblivious 负载均衡在网络中涉及使用预定路径将流量从源路由到目的地,且该路径独立于流量,以便……
人工智能通过在海量数据集上使用数千个 GPU 或 TPU 训练的大型神经网络迅速发展。此类训练可能占用…
我们引入APoW,这是一种受Hashcash式nonce搜索启发的新型工作量证明(PoW)构造,它能够通过…审计其他矿工的工作。
预训练大型语言模型(LLMs)日益需要分布式计算,但带宽限制使得在资源充足的情况下进行扩展变得困难。
检测未知的 deepfake 操作仍然是 face forgery detection 中最具挑战性的问题之一。当前最先进的方法未能生成……
我们提出了 VINO,一个统一的视觉生成器,能够在单一框架内进行图像和视频的生成与编辑。它不依赖于特定任务的……
在音乐创作中,快速原型对于探索和完善想法至关重要,但现有的生成工具在用户需要同时具备结构……时往往力不从心。
我们介绍了 Talk2Move,这是一种基于强化学习(RL)的扩散框架,用于文本指令驱动的场景中对象的空间变换。Spatially m...
偏远地区的农民需要快速可靠的植物病害识别方法,但他们往往缺乏实验室或高性能计算的渠道。
本工作介绍了 Falcon-H1R,这是一款 7B 参数的推理优化模型,证明了在 s... 实现竞争性推理性能的可行性。
公司经常需要应对多版本系统,即同一软件的多个版本同时运行。问答 ...
最近的研究提出将 3DGS 与语义特征向量相结合,以实现语义分割和图像渲染的同步进行。然而,这些方法通常将……
有毒性检测本质上是主观的,受不同人口群体的多元视角和社会先验的影响。虽然“pluralistic”模型……
我们提出 BEDS(Bayesian Emergent Dissipative Structures),一个统一 non-equilibrium thermodynamics、Bayesian inference 等概念的理论框架。
本研究探讨基于 autoencoder 的机器学习技术在异常检测中的应用,以识别具有非传统特征的系外行星大气……
Out-of-distribution (OOD) 预测通常通过限制模型仅使用因果或不变协变量来实现,以避免非因果的虚假关联……
自回归语言模型通常在推理阶段使用温度参数来塑造概率分布,并控制文本生成的随机性。
无接触指纹识别提供了一种卫生且方便的替代方案,取代接触式系统,实现快速采集,无需潜在指纹,预…
经验评估是指导基础模型研究进展的主要指南。尽管已有大量工作专注于训练前沿视觉……
Geo-Foundation Models(GFMs)已在多种下游应用中证明有效,包括语义分割、分类和回归任务。H...
随着大型语言模型(LLM)代理越来越多地承担高风险的自主决策任务,它们推理过程的透明度已经成为…
编码理论在实现可靠的通信、存储和计算方面发挥着关键作用。传统方法假设最坏情况的对抗模型,并……
训练 large language models 需要在众多 accelerators 上分布计算,但实践者会选择并行策略(data parallelism、tensor parallelism、pipeline parallelism……)。
高频交易(HFT)环境的特征是大量的限价订单簿(LOB)数据,这些数据众所周知地噪声大且非线性。Alpha de...
单目全向视觉里程计(OVO)系统利用 360 度相机克服透视 VO 系统的视场限制。然而,ex...
我们提出了一种隐私保护的方法,通过共享其 transformer embeddings 的噪声版本来共享文本数据。已有研究表明,隐藏表示...
墨西哥是一个拥有大量土著语言的国家,其中使用最广泛的是 Nawatl,当前有超过两百万人在使用……
随着人口增长,废物产生量不断增加,这对有效管理和回收材料带来了挑战。人工废物分类是……
在大型语言模型(LLMs)中,参数数量在过去几年呈指数增长,例如,从 GPT-2 的 15 亿参数增长到 175 billion。
随着全球城市化的不断增长,交通基础设施的高效管理对交通部门和城市规划者至关重要。它是必需的……
PDF 是互联网上使用量第二大的文档类型(仅次于 HTML)。然而,现有的 QA 数据集通常从文本来源开始,或仅针对特定的 …
基础分割模型,例如 Segment Anything Model(SAM),通过大规模预训练展现出强大的零样本泛化能力,但适应 th...
基于聚合物的长效注射剂(LAIs)通过实现受控药物递送,已彻底改变了慢性疾病的治疗,从而降低了给药频率……
现代身份和信任系统在最需要它们的环境中崩溃:灾区、断开或受损的网络,以及对抗性的…
我们提出了 SER 建模语言,用于自动验证并发程序的可串行化,即检查程序的每一次并发执行是否满足串行化要求……
功能验证日益依赖基于断言的验证(Assertion-Based Verification,ABV),它已成为验证硬件设计的关键方法,原因在于其高效性……
卷积神经网络(CNN)是视觉识别的标准方法,因为它们能够从原始像素中学习层次化表示……
基于指令的图像编辑是生成式 AI 中发展最快的领域之一。过去一年里,该领域已经达到新的水平,出现了数十个……
代码覆盖率分析已成为软件开发中的标准方法,有助于评估测试套件的有效性,识别未…
自回归大型语言模型在众多基准测试中取得了强劲的结果,但解码仍然受到序列依赖的延迟限制,取决于 p…
Quantum computation 是本质上混合的,快速的经典对 qubit operators 的操作对于确保量子软件的可扩展性是必要的。我们介绍…
可解释人工智能(XAI)方法,如 SHAP 和 LIME,生成数值特征归因,这对非专家用户仍然难以理解。先前的工作已经表明 L...
编译器对于软件的性能和正确执行至关重要,并在各个科学学科中具有普遍的相关性。尽管如此,...
本文提出了一种由 LLM 驱动的工作流,以支持 Software Defined Vehicle(SDV)软件开发,涵盖安全感知系统拓扑等方面。
阿拉伯语的特点是拥有丰富的地区方言网络,这些方言在语音和词汇上有显著差异,反映了地理和…