· ai
[Paper] 教老 Tokenizer 新词:用于预训练模型的高效 Tokenizer 适配
Tokenizer 适配在将预训练语言模型转移到新领域或新语言中发挥重要作用。在本工作中,我们解决了两个互补的……
466 posts from this source
Tokenizer 适配在将预训练语言模型转移到新领域或新语言中发挥重要作用。在本工作中,我们解决了两个互补的……
我们考虑仅使用 membership queries 主动学习未知 binary decision tree 的问题,这是一种学习者必须对 … 的情形。
虽然最近在大型语言模型方面的进展提升了偏见检测和分类的能力,但像宗教这样的敏感话题仍然带来挑战……
Mixture-of-Experts (MoE),虽然作为大型语言模型(LLM)架构提供了显著优势,但在部署到低‑…
基于SMT求解器的自动化验证工具在验证复杂软件系统方面取得了显著进展。然而,这些工具面临一个根本性的……
高效模拟复杂等离子体动力学对于推动聚变能源研究至关重要。粒子-在-网格(Particle-in-Cell,PIC)蒙特卡罗(Monte Carlo,MC)模拟提供了...
语言模型依赖于大规模的文本语料库,这些语料库通常会进行质量过滤,这一过程可能会无意中排除非标准的语言变体……
人工智能(AI)和深度学习(DL)的快速发展催生了多个以优化为驱动的子领域,尤其是神经……
脉冲神经网络(SNNs)已成为计算神经科学和人工智能领域的一个有前景的方向,提供了诸如……的优势。
Transformer 解码器在各种任务中取得了强劲的结果,但 KV 缓存所需的内存在长序列长度下变得难以承受。虽然 …
机器学习在医学早期预测方面最近表现出突破性性能,然而,过于关注提升预测准确性导致了一个 …
现代软件系统日益给传统的代码库组织策略带来压力。Monorepos 提供一致性,但往往面临可扩展性问题……