Kakao 首次公开多模态 AI ‘카나나‑o’ API，扩大应用

发布: 3天前 (2026年2月22日 GMT+8 11:42)

4 分钟阅读

Source: Byline Network

Kakao 多模态 AI “Kanana‑o” API 首次公开

Kakao 首次公开其自主研发的多模态 AI 模型的应用程序接口（API）。虽然模型已经以开源形式发布，但此次是通过实际使用功能实现的案例，推动 Kanana 模型大众化的首次尝试。

被选中的人员在 Beta 测试期间每天可以按规定次数调用 API 进行测试。

Kanana‑o 是 Kakao 于 2023 年 5 月发布的统一多模态语言模型。它能够同时理解文本、语音、图像，并实时给出答案。该模型整合了此前专注图像处理的 Kanana‑v 与专注音频理解·生成的 Kanana‑a 两个模型而开发。

Kanana‑o 与全球竞争模型基准性能比较（提供=Kakao）

在 Kakao 业绩发布电话会议（12 日）上，精神아 代表强调：“Kanana Omni 目前在国内多模态模型同级别中创下最高基准，计划在今年上半年完成模型升级，并扩大实际 AI 服务的应用。”

Kakao 计划在今年上半年将多模态功能引入自有服务，实现不仅使用文本，还能通过语音和图像进行交流的服务。这将提升用户体验，并在各种业务场景中扩大 AI 的应用，预期将产生积极影响。