[Paper] DARC:鼓伴奏生成与细粒度节奏控制
在音乐创作中,快速原型对于探索和完善想法至关重要,但现有的生成工具在用户需要同时具备结构……时往往力不从心。
在音乐创作中,快速原型对于探索和完善想法至关重要,但现有的生成工具在用户需要同时具备结构……时往往力不从心。
我们介绍了 Talk2Move,这是一种基于强化学习(RL)的扩散框架,用于文本指令驱动的场景中对象的空间变换。Spatially m...
偏远地区的农民需要快速可靠的植物病害识别方法,但他们往往缺乏实验室或高性能计算的渠道。
本工作介绍了 Falcon-H1R,这是一款 7B 参数的推理优化模型,证明了在 s... 实现竞争性推理性能的可行性。
公司经常需要应对多版本系统,即同一软件的多个版本同时运行。问答 ...
最近的研究提出将 3DGS 与语义特征向量相结合,以实现语义分割和图像渲染的同步进行。然而,这些方法通常将……
有毒性检测本质上是主观的,受不同人口群体的多元视角和社会先验的影响。虽然“pluralistic”模型……
我们提出 BEDS(Bayesian Emergent Dissipative Structures),一个统一 non-equilibrium thermodynamics、Bayesian inference 等概念的理论框架。
本研究探讨基于 autoencoder 的机器学习技术在异常检测中的应用,以识别具有非传统特征的系外行星大气……
Out-of-distribution (OOD) 预测通常通过限制模型仅使用因果或不变协变量来实现,以避免非因果的虚假关联……
自回归语言模型通常在推理阶段使用温度参数来塑造概率分布,并控制文本生成的随机性。
无接触指纹识别提供了一种卫生且方便的替代方案,取代接触式系统,实现快速采集,无需潜在指纹,预…
经验评估是指导基础模型研究进展的主要指南。尽管已有大量工作专注于训练前沿视觉……
Geo-Foundation Models(GFMs)已在多种下游应用中证明有效,包括语义分割、分类和回归任务。H...
随着大型语言模型(LLM)代理越来越多地承担高风险的自主决策任务,它们推理过程的透明度已经成为…
编码理论在实现可靠的通信、存储和计算方面发挥着关键作用。传统方法假设最坏情况的对抗模型,并……
训练 large language models 需要在众多 accelerators 上分布计算,但实践者会选择并行策略(data parallelism、tensor parallelism、pipeline parallelism……)。
高频交易(HFT)环境的特征是大量的限价订单簿(LOB)数据,这些数据众所周知地噪声大且非线性。Alpha de...
单目全向视觉里程计(OVO)系统利用 360 度相机克服透视 VO 系统的视场限制。然而,ex...
我们提出了一种隐私保护的方法,通过共享其 transformer embeddings 的噪声版本来共享文本数据。已有研究表明,隐藏表示...
墨西哥是一个拥有大量土著语言的国家,其中使用最广泛的是 Nawatl,当前有超过两百万人在使用……
随着人口增长,废物产生量不断增加,这对有效管理和回收材料带来了挑战。人工废物分类是……
在大型语言模型(LLMs)中,参数数量在过去几年呈指数增长,例如,从 GPT-2 的 15 亿参数增长到 175 billion。
随着全球城市化的不断增长,交通基础设施的高效管理对交通部门和城市规划者至关重要。它是必需的……