Trillion Labs,公开‘Tri 21B Think’…进入全球 AI 性能评估前30

发布: (2026年2月19日 GMT+8 13:13)
2 分钟阅读
原文: Platum

Source: Platum

模型发布

AI模型创业公司Trillion Labs公开了基于强化学习的推理专用模型 Tri 21B 思考。在全球AI性能分析机构 Artificial Analysis(AA) 的排行榜上进入前 30 名。

主要特征

  • 强化学习应用:在原有模型 Tri 21B 上应用强化学习,提升推理能力。
  • 回溯(backtracking)结构:在问题求解过程中,将思考步骤以 token 形式展开,并在需要时回到前一步重新审视的机制。
  • 测试时扩展(Test‑time Scaling):基于 AI 思考时间越长,解决复杂任务的能力越强的技术实现。

性能与效率

  • AA 排行榜:进入前 30 名,证明了全球水平的性能。
  • 参数规模:210 亿(21 B)参数。
  • GPU 要求:仅需 1 张 GPU 即可运行,对比需要数十张 GPU 才能运行 100 B 以上大型模型。
  • 实现背景:在没有大企业或政府基础设施支持的情况下,仅凭民间资本实现。

Trillion Labs 介绍

  • 成立背景:前 Naver HyperCLOVA X 开发团队成员、代表人申在民(신재민)于 2024 年创立。
  • 主要研发:成立一年内基于自主研发的跨语言互学习架构 XLDA,从头开发并发布了 7 B·21 B·70 B 全系列 LLM。
  • 其他产品:视觉语言模型(VLM)、基于扩散的 Transformer 结构的大型语言模型(dLLM)、移动世界模型(gWorld)等陆续推出。
0 浏览
Back to Blog

相关文章

阅读更多 »

什么是 LLM Gateway?

markdown !smakoshhttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploa...

为什么仅有LLMs并非智能体

引言 大型语言模型功能强大,但单独称它们为“agents”是一种类别错误。这种混淆在实际项目中经常出现……