Mistral

3周前 · ai

我训练探针捕捉 AI 模型的 sandbagging

TL;DR：我从三个 open‑weight 模型中提取了“sandbagging directions”，并训练了线性探针，以 90‑96% 的准确率检测 sandbagging 意图。The mo...

#sandbagging #model probing #linear probes #AI safety #Mistral #Gemma #evaluation gaming #model steering
1个月前 · ai

Mistral 通过新开放权重前沿和小模型逼近大型 AI 竞争对手

Mistral 推出其 Mistral 3 系列，包括前沿模型和为离线、可定制的企业使用而设计的高效小模型——旨在证明……

#Mistral #large language models #frontier model #small models #open-weight AI #fine-tuning #enterprise AI #offline AI
1个月前 · ai

Mistral 3 模型系列已发布

文章链接: https://mistral.ai/news/mistral-3 评论链接: https://news.ycombinator.com/item?id=46121889 得分: 138 评论数: 38

#Mistral #large language model #LLM #AI model release #generative AI