ai — Page 85 | EUNO.NEWS

1个月前 · ai

[Paper] PPSEBM：一种具备渐进参数选择的能量模型用于持续学习

持续学习仍然是机器学习中的根本性挑战，需要模型从任务流中学习，同时不忘记先前获得的知识。

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[Paper] 使用 Auto-Encoders 对 Mamba 的选择性记忆进行表征

状态空间模型（SSMs）是语言建模中一种有前景的 transformer 替代方案，因为它们在推理时使用固定内存。然而，这种固定 ...

#research #paper #ai #nlp
1个月前 · ai

[Paper] VTCBench：视觉语言模型能否通过视觉-文本压缩理解长上下文？

与扩展 LLMs 的 context window 相关的计算和内存开销严重限制了它们的可扩展性。一个值得注意的解决方案是 vision-te…

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai

[Paper] 多少算太多？探索 LoRA Rank 在保持知识和领域鲁棒性方面的权衡

大型语言模型正日益通过微调适配下游任务。全监督微调（SFT）和参数高效微调（P...）

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[论文] 使用 LLM-as-Judges 评估安全指标

LLMs（Large Language Models）在文本处理流水线中被越来越多地使用，以智能地响应各种输入和生成任务。这引发了...

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[Paper] 类人工作记忆来自人工内在可塑性神经元

工作记忆使大脑能够整合瞬时信息，以实现快速决策。人工网络通常通过 recurrent 或 par...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[论文] 你永远不了解一个人，你只了解他们的防御：在支持性对话中检测心理防御机制的层次

心理防御是人们用来管理痛苦的策略，通常是自动的。防御的僵化或过度使用与心理健康呈负相关……

#research #paper #ai #nlp
1个月前 · ai

进入Omniverse：OpenUSD 和 NVIDIA Halos 加速机器人出租车和物理 AI 系统的安全

进入Omniverse：OpenUSD 与 NVIDIA Halos 加速机器人出租车的安全性，物理 AI 系统——全新的 NVIDIA 安全框架和技术正在推进 h...

#ai #gpu #nvidia
1个月前 · ai

[Paper] Bolmo：字节化下一代语言模型

我们推出 Bolmo，这是首个在 1B 和 7B 参数规模上具有竞争力的完全开放的字节级语言模型（LMs）系列。与以往研究相比……

#research #paper #ai #nlp
1个月前 · ai

[Paper] 语义等价的代码转换如何影响代码LLMs的成员推断？

大型语言模型在代码方面的成功依赖于海量的代码数据，包括公共开源仓库，如 GitHub，以及私有的、保密的…

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 关于评估由生成模型撰写的代码审查的相关性

在代码审查中使用像 ChatGPT 这样的大语言模型可以带来有前景的效率提升，但也引发了对正确性和安全性的担忧。Existing e...

#research #paper #ai #machine-learning
1个月前 · it

Mistral 推出 OCR 3，数字化企业文档，宣称 74% 胜率和每千页 2 美元的定价

Mistral AI，这家估值为117亿欧元的法国人工智能公司，于周二推出了其第三代光学字符识别模型，...

#it #startups #ai

Newer posts

Older posts