· ai
[Paper] BSAT: B-Spline 自适应分词器用于长期时间序列预测
使用 transformer 进行长期时间序列预测受到自注意力二次复杂度和统一切片刚性的阻碍,这可能会……
使用 transformer 进行长期时间序列预测受到自注意力二次复杂度和统一切片刚性的阻碍,这可能会……
现有用于推断行人过街行为的范式,从统计模型到监督学习方法,表现出有限的泛化能力……
Ticket troubleshooting 指的是通过工单系统报告的问题进行分析和解决的过程。在大型组织提供的…
本文提出了一种遗传算法(GA)方法,用于生产线中成本最优的任务调度。系统由一组串行处理任务组成……
语言模型(LM)概率并不是可靠的质量评估指标,因为自然语言是模糊的。当多个输出选项都是有效的时,模型的概率……
大型语言模型(LLMs)因其高性能(例如准确率)而逐渐成为解决众多自然语言任务的突出 AI 模型……
生成奖励模型(Generative Reward Models,GRMs)因其可解释性、推理时的可扩展性以及……而在奖励建模领域受到广泛研究兴趣。
现代语言模型中的序列建模层通常在存储容量和计算效率之间面临权衡。虽然 Softmax attention …
脉冲神经网络(SNN)是对时空数据进行处理的动力系统,但它们的可学习参数通常仅限于突触权重,...
Large Protein Models 已显示出在 generative protein design 方面的强大潜力,但它们经常产生 structural hallucinations,生成序列……
在移动和边缘计算环境中部署大型语言模型(LLMs)受到设备资源有限、无线带宽稀缺以及…
大型语言模型(LLMs)经常产生上下文幻觉,即生成的内容与提示中明确陈述的信息相矛盾或被忽略。