CrowdWorks加入“国家代表AI项目数据供应合作伙伴”。
Source: VentureSquare
Source: …
韩语 (Korean)

AI 技术公司 CrowdWorks 于 24 日宣布加入韩国 AI 技术自立的 “国家代表 AI” 项目。
在科学技术信息通信部的独立 AI 基础模型(独帕莫)开发项目追加公开征集里,Motif Technologies Consortium 被选中,CrowdWorks 将作为该联盟的 数据供应核心合作伙伴 参与。它将与 LG AI 研究院、SK 电讯、Upside 等一起,成为引领国内 AI 生态的四大精英团队之一。
- 角色:为 3,000 亿(300 B)参数级推理型大语言模型(LLM)开发提供 高质量数据
- 核心工作:构建分阶段推理(Chain‑of‑Thought)学习数据集 → 增强模型的逻辑推理与专业知识学习能力
为此,CrowdWorks 将使用自行研发的 非结构化文档数据预处理解决方案 “Alpy Knowledge Compiler”,将表格、图表等复杂结构的文档转换为 AI 可理解的 AI‑Ready 数据。该技术被评估为模型稳定学习和分阶段推理执行的关键因素。
CrowdWorks 之前也为国内精英团队提供过学习数据,完成了图书、广播视频理解数据集的构建,实战能力已获验证。公司方面表示:“我们将整合与国内大型科技公司合作中积累的数据清洗技术和高质量数据构建经验,全面支持独立 AI 模型的开发。”
- 查看更多相关报道
中文

Crowdworks 加入国家 AI 项目数据供应合作伙伴
AI 技术公司 Crowdworks 于 24 日宣布,加入“国家 AI”项目,以实现韩国 AI 技术的自主可控。
Motif Technologies Consortium 在科学技术信息通信部的额外公开招标中入选,负责开发自主的 AI 基础模型(Dokpamo)。Crowdworks 将作为 关键数据提供方 与 LG AI 研究中心、SK Telecom、Upstage 一起参与该联盟,构成国内 AI 生态系统的四支精英团队之一。
- 职责:提供开发 300 B 参数推理型大语言模型(LLM) 所需的高质量数据。
- 重点:构建 Chain‑of‑Thought 学习数据集,以增强模型的逻辑推理和专业知识获取能力。
为实现上述目标,Crowdworks 使用其自主研发的非结构化文档预处理解决方案 Alpy Knowledge Compiler,将复杂文档(表格、图表等)转换为 AI‑ready 数据。该技术有望在保证模型学习稳定性和逐步推理性能方面发挥关键作用。
Crowdworks 之前已通过为国内顶尖团队提供训练数据、构建图书和广播视频理解数据集等实践,证明了其能力。公司表示:“凭借与国内大型科技公司合作积累的数据净化技术和高质量数据构建经验,我们将全力支持自主 AI 模型的研发。”
- 查看更多相关文章
日语 (Japanese)

CrowdWorks 加入“国家代表 AI 项目数据供应合作伙伴”行列
AI 科技企业 CrowdWorks 于 24 日透露,将加入大韩民国为实现 AI 技术自立而设立的“国家代表 AI”项目。
在科学技术信息通信部的自主 AI 基金模型(独派母)开发业务追加公开招募中,Motif Technology Consortium 被选定,CrowdWorks 将作为该联盟的 数据供应核心合作伙伴 参与。与 LG AI 研究院、SK 电信、Upstage 等一起,成为引领国内 AI 生态系统的四大精英团队之一。
- 角色:负责 3,000 亿(300 B)参数级推理型大型语言模型(LLM)开发所需的 高质量数据。
- 重点:构建阶段性推理(Chain‑of‑Thought)学习数据集,提升模型的逻辑推理和专业知识学习能力。
为此,CrowdWorks 将使用自行研发的 非结构化文档数据前处理解决方案 “Alpy Knowledge Compiler”,将表格、图表等复杂结构的文档转换为 AI 可理解的 AI‑Ready 数据。该技术被评估为模型稳定学习和阶段性推理执行的关键。
CrowdWorks 之前也向国内精英团队提供过学习数据,验证了图书、广播影像理解数据集构建等实战能力。公司表示:“我们将汇聚与国内大厂合作积累的数据精炼技术和高质量数据构建经验,全面支持自主 AI 模型的开发。”
- 查看更多相关文章
中文 (Chinese)

Crowdworks 加入国家人工智能项目数据供应合作伙伴
人工智能技术公司 Crowdworks 于 24 日宣布,将加入韩国的“国家人工智能”项目,以实现韩国人工智能技术的自主化。
Motif Technologies Consortium 入选韩国科学技术信息通信部(MSICT)人工智能基础模型(Dokpamo)开发的追加公开招标。Crowdworks 将作为该联盟的 核心数据供应伙伴 参与,与 LG AI 研究中心、SK Telecom、Upstage 共同组成国内 AI 生态系统的四大精英团队之一。
- 职责:提供开发 3000 亿(300 B)参数级推理型大型语言模型(LLM) 所需的 高质量数据。
- 重点:构建 Chain‑of‑Thought 学习数据集,以提升模型的逻辑推理和专业知识学习能力。
为此,Crowdworks 使用自主研发的 非结构化文档数据预处理解决方案 “Alpy Knowledge Compiler”,将包含表格、图表等复杂结构的文档转换为 AI‑Ready 数据。该技术被视为确保模型稳定学习和分步推理执行的关键。
Crowdworks 之前已为国内精英团队提供训练数据,构建图书、广播视频理解数据集,验证了其实战能力。公司表示:“我们将整合与国内大型科技公司合作中积累的数据净化技术和高质量数据构建经验,全面支持自主 AI 模型的研发。”
- 查看更多相关文章