크라우드웍스, ‘국가대표 AI 프로젝트 데이터 공급 파트너’ 합류
Source: VentureSquare
한국어 (Korean)

AI 테크 기업 **크라우드웍스**가 대한민국 AI 기술 자립을 위한 ‘국가대표 AI’ 프로젝트에 합류한다고 24일 밝혔다.
과학기술정보통신부의 독자 AI 파운데이션 모델(독파모) 개발 사업 추가 공모에서 모티프테크놀로지스 컨소시엄이 선정되었으며, 크라우드웍스는 이 컨소시엄의 데이터 공급 핵심 파트너로 참여한다. LG AI연구원, SK텔레콤, 업스테이지 등과 함께 국내 AI 생태계를 선도하는 4대 정예팀의 일원으로 활동하게 된다.
- 역할: 3,000억(300 B) 파라미터급 추론형 거대언어모델(LLM) 개발에 필요한 고품질 데이터 제공
- 핵심 작업: 단계별 추론(Chain‑of‑Thought) 학습 데이터셋 구축 → 모델의 논리적 추론·전문 지식 학습 역량 강화
이를 위해 자체 개발한 **비정형 문서 데이터 전처리 솔루션 ‘Alpy Knowledge Compiler’**를 활용, 표·차트 등 복잡한 구조의 문서를 AI가 이해 가능한 AI‑Ready 데이터로 변환한다. 해당 기술은 모델의 안정적 학습과 단계별 추론 수행에 필수적 역할을 할 것으로 평가된다.
크라우드웍스는 이전에도 국내 정예팀에 학습 데이터를 공급하며 도서·방송영상 이해 데이터셋 구축 등 실전 역량을 검증받았다. 회사 측은 “국내 빅테크와 협업하며 축적한 데이터 정제 기술과 고품질 데이터 구축 노하우를 결집해 독자 AI 모델 개발을 완벽하게 지원할 것”이라고 밝혔다.
- 관련 기사 더 보기
English

Crowdworks Joins National AI Project Data Supply Partners
AI tech company Crowdworks announced on the 24th that it is joining the “National AI” project to achieve AI technology independence in Korea.
The Motif Technologies Consortium was selected in the Ministry of Science and ICT’s additional public offering for the development of its own AI Foundation Model (Dokpamo). Crowdworks will participate as a key data provider for the consortium, alongside LG AI Research Center, SK Telecom, and Upstage, forming one of four elite teams leading the domestic AI ecosystem.
- Responsibility: Supplying high‑quality data required to develop a 300 B‑parameter inference‑type large language model (LLM).
- Focus: Building a Chain‑of‑Thought learning dataset to strengthen the model’s logical reasoning and expert‑knowledge acquisition.
To achieve this, Crowdworks utilizes its proprietary unstructured‑document preprocessing solution, Alpy Knowledge Compiler, converting complex documents (tables, charts, etc.) into AI‑ready data. This technology is expected to play a vital role in ensuring stable model learning and step‑by‑step inference performance.
Crowdworks has previously proven its capabilities by providing training data to elite domestic teams, building datasets for book and broadcast‑video understanding. The company stated, “By leveraging the data‑purification technology and high‑quality data‑construction expertise accumulated through collaborations with domestic big‑tech companies, we will fully support the development of proprietary AI models.”
- See more related articles
日本語 (Japanese)

クラウドワークスが「国家代表AIプロジェクトデータ供給パートナー」に参加
AIテック企業 クラウドワークス が大韓民国AI技術自立のための「国家代表AI」プロジェクトに合流すると24日明らかにした。
科学技術情報通信部の独自AIファンデーションモデル(独派母)開発事業追加公募で モチーフテクノロジーコンソーシアム が選定され、クラウドワークスはこのコンソーシアムの データ供給コアパートナー として参加する。LG AI研究院、SKテレコム、アップステージなどと共に国内AIエコシステムをリードする4大精鋭チームの一員となる。
- 役割:3,000億(300 B)パラメータ級推論型巨大言語モデル(LLM)開発に必要な 高品質データ を担当。
- 重点:段階的推論(Chain‑of‑Thought)学習データセットを構築し、モデルの論理的推論と専門知識学習能力を強化。
このために自社開発した 非定型文書データ前処理ソリューション「Alpy Knowledge Compiler」 を活用し、表やチャートなど複雑な構造の文書を AI が理解可能な AI‑Ready データに変換する。この技術はモデルの安定した学習と段階的な推論実行に不可欠と評価されている。
クラウドワークスは以前にも国内精鋭チームに学習データを供給し、図書・放送映像理解データセット構築など実戦能力を検証された。同社は「国内ビッグテックと協業して蓄積したデータ精製技術と高品質データ構築ノウハウを結集し、独自のAIモデル開発を完全に支援する」と明らかにした。
- 関連記事をもっと見る
中文 (Chinese)

Crowdworks 加入国家人工智能项目数据供应合作伙伴
人工智能技术公司 Crowdworks 于 24 日宣布,将加入韩国的“国家人工智能”项目,以实现韩国人工智能技术的自主化。
Motif Technologies Consortium 入选韩国科学技术信息通信部(MSICT)人工智能基础模型(Dokpamo)开发的追加公开招标。Crowdworks 将作为该联盟的 核心数据供应伙伴 参与,与 LG AI 研究中心、SK Telecom、Upstage 共同组成国内 AI 生态系统的四大精英团队之一。
- 职责:提供开发 3000 亿(300 B)参数级推理型大型语言模型(LLM) 所需的 高质量数据。
- 重点:构建 Chain‑of‑Thought 学习数据集,以提升模型的逻辑推理和专业知识学习能力。
为此,Crowdworks 使用自主研发的 非结构化文档数据预处理解决方案 “Alpy Knowledge Compiler”,将包含表格、图表等复杂结构的文档转换为 AI‑Ready 数据。该技术被视为确保模型稳定学习和分步推理执行的关键。
Crowdworks 之前已为国内精英团队提供训练数据,构建图书、广播视频理解数据集,验证了其实战能力。公司表示:“我们将整合与国内大型科技公司合作中积累的数据净化技术和高质量数据构建经验,全面支持自主 AI 模型的研发。”
- 查看更多相关文章