Bolmo的架构实现高效的字节级LM训练,同时不牺牲质量
发布: (2025年12月15日 GMT+8 13:00)
1 min read
原文: VentureBeat
Source: VentureBeat
引言
希望实现无分词器的多语言模型的企业,正日益转向字节级语言模型,以降低在噪声或资源匮乏文本中的脆弱性。为了进入这一细分市场——并在大规模上实现其实用性——Allen Institute for AI(AI2)推出了 Bolmo,这是一系列全新的模型……