크라우드웍스, ‘국가대표 AI 프로젝트 데이터 공급 파트너’ 합류

발행: (2026년 2월 24일 오후 02:32 GMT+9)
10 분 소요

Source: VentureSquare

위에 제공된 소스 링크 외에 번역할 텍스트가 없습니다. 번역이 필요한 본문을 알려주시면 한국어로 번역해 드리겠습니다.

한국어 (Korean)

Image

AI 테크 기업 **크라우드웍스**가 대한민국 AI 기술 자립을 위한 ‘국가대표 AI’ 프로젝트에 합류한다고 24일 밝혔다.

과학기술정보통신부의 독자 AI 파운데이션 모델(독파모) 개발 사업 추가 공모에서 모티프테크놀로지스 컨소시엄이 선정되었으며, 크라우드웍스는 이 컨소시엄의 데이터 공급 핵심 파트너로 참여한다. LG AI연구원, SK텔레콤, 업스테이지 등과 함께 국내 AI 생태계를 선도하는 4대 정예팀의 일원으로 활동하게 된다.

  • 역할: 3,000억(300 B) 파라미터급 추론형 거대언어모델(LLM) 개발에 필요한 고품질 데이터 제공
  • 핵심 작업: 단계별 추론(Chain‑of‑Thought) 학습 데이터셋 구축 → 모델의 논리적 추론·전문 지식 학습 역량 강화

이를 위해 자체 개발한 **비정형 문서 데이터 전처리 솔루션 ‘Alpy Knowledge Compiler’**를 활용, 표·차트 등 복잡한 구조의 문서를 AI가 이해 가능한 AI‑Ready 데이터로 변환한다. 해당 기술은 모델의 안정적 학습과 단계별 추론 수행에 필수적 역할을 할 것으로 평가된다.

크라우드웍스는 이전에도 국내 정예팀에 학습 데이터를 공급하며 도서·방송영상 이해 데이터셋 구축 등 실전 역량을 검증받았다. 회사 측은 “국내 빅테크와 협업하며 축적한 데이터 정제 기술과 고품질 데이터 구축 노하우를 결집해 독자 AI 모델 개발을 완벽하게 지원할 것”이라고 밝혔다.

  • 관련 기사 더 보기

한국어

Image

Crowdworks, 국가 AI 프로젝트 데이터 공급 파트너에 합류

AI 기술 기업 Crowdworks 가 24일, 한국의 AI 기술 자립을 목표로 하는 “국가 AI” 프로젝트에 합류한다고 발표했습니다.

Motif Technologies Consortium 가 자체 AI 기반 모델(Dokpamo) 개발을 위한 과학기술정보통신부의 추가 공모에서 선정되었습니다. Crowdworks는 LG AI Research Center, SK Telecom, Upstage와 함께 컨소시엄의 핵심 데이터 제공자 로 참여해 국내 AI 생태계를 이끄는 4개 엘리트 팀 중 하나를 구성합니다.

  • 역할: 300 B 파라미터 추론형 대규모 언어 모델(LLM) 개발에 필요한 고품질 데이터 공급.
  • 핵심: 모델의 논리적 추론 및 전문가 지식 습득을 강화하기 위한 Chain‑of‑Thought 학습 데이터셋 구축.

이를 위해 Crowdworks는 자체 비정형 문서 전처리 솔루션 Alpy Knowledge Compiler 를 활용해 복잡한 문서(표, 차트 등)를 AI‑ready 데이터로 변환합니다. 이 기술은 모델 학습의 안정성과 단계별 추론 성능을 보장하는 데 중요한 역할을 할 것으로 기대됩니다.

Crowdworks는 이전에 국내 엘리트 팀에 학습 데이터를 제공하고, 도서·방송·영상 이해를 위한 데이터셋을 구축한 바 있어 그 역량을 입증했습니다. 회사는 “국내 대기업과의 협업을 통해 축적된 데이터 정제 기술과 고품질 데이터 구축 전문성을 활용해 자체 AI 모델 개발을 전폭적으로 지원하겠다”고 밝혔습니다.

  • 관련 기사 더 보기

일본어 (Japanese)

Image

클라우드워크스가 “국가대표 AI 프로젝트 데이터 공급 파트너”에 참여

AI 기술 기업 클라우드워크스 가 대한민국 AI 기술 자립을 위한 “국가대표 AI” 프로젝트에 합류한다는 것을 24일에 밝혔습니다.

과학기술정보통신부의 독자 AI 파운데이션 모델(독파모) 개발 사업 추가 공모에서 모티프 테크놀로지 컨소시엄 이 선정되었으며, 클라우드워크스는 이 컨소시엄의 데이터 공급 코어 파트너 로 참여합니다. LG AI 연구원, SK 텔레콤, 업스테이지 등과 함께 국내 AI 에코시스템을 이끄는 4대 정예 팀의 일원이 됩니다.

  • 역할:3,000억(300 B) 파라미터급 추론형 거대 언어 모델(LLM) 개발에 필요한 고품질 데이터 를 담당합니다.
  • 중점:단계적 추론(Chain‑of‑Thought) 학습 데이터셋을 구축하여 모델의 논리적 추론 및 전문 지식 학습 능력을 강화합니다.

이를 위해 자체 개발한 비정형 문서 데이터 전처리 솔루션 “Alpy Knowledge Compiler” 를 활용하여 표와 차트 등 복잡한 구조의 문서를 AI가 이해 가능한 AI‑Ready 데이터로 변환합니다. 이 기술은 모델의 안정적인 학습과 단계적 추론 실행에 필수적이라고 평가받고 있습니다.

클라우드워크스는 이전에도 국내 정예 팀에 학습 데이터를 공급하고, 도서·방송 영상 이해 데이터셋 구축 등 실전 능력을 검증했습니다. 회사는 “국내 빅테크와 협업하여 축적한 데이터 정제 기술과 고품질 데이터 구축 노하우를 결집해 독자적인 AI 모델 개발을 완전히 지원한다”고 밝혔습니다.

  • 관련 기사 더 보기

한국어 (Korean)

Image

Crowdworks, 국가 인공지능 프로젝트 데이터 공급 파트너에 합류

인공지능 기술 기업 Crowdworks 가 24일에 발표했으며, 한국의 “국가 인공지능” 프로젝트에 참여해 한국 인공지능 기술의 자주화를 실현한다.

Motif Technologies Consortium 가 한국 과학기술정보통신부(MSICT)의 인공지능 기본 모델(Dokpamo) 개발을 위한 추가 공개 입찰에 선정되었습니다. Crowdworks 는 해당 연합의 핵심 데이터 공급 파트너 로 참여하며, LG AI 연구센터, SK Telecom, Upstage와 함께 국내 AI 생태계의 네 개 주요 엘리트 팀 중 하나를 구성합니다.

  • 역할3000억(300 B) 파라미터 수준 추론형 대형 언어 모델(LLM) 개발에 필요한 고품질 데이터 제공.
  • 핵심:모델의 논리 추론 및 전문 지식 학습 능력을 향상시키기 위해 Chain‑of‑Thought 학습 데이터셋 구축.

이를 위해 Crowdworks 는 자체 개발한 비구조화 문서 데이터 전처리 솔루션 “Alpy Knowledge Compiler” 를 사용하여 표, 차트 등 복잡한 구조를 포함한 문서를 AI‑Ready 데이터로 변환합니다. 이 기술은 모델의 안정적인 학습 및 단계별 추론 실행을 보장하는 핵심으로 여겨집니다.

Crowdworks 는 이전에 국내 엘리트 팀에 훈련 데이터를 제공하고, 도서 및 방송 영상 이해 데이터셋을 구축하여 실전 능력을 검증했습니다. 회사는 “우리는 국내 대형 기술 기업과의 협업을 통해 축적한 데이터 정제 기술과 고품질 데이터 구축 경험을 통합하여 자주 AI 모델 개발을 전면 지원할 것입니다.” 라고 밝혔습니다.

  • 관련 기사 더 보기
0 조회
Back to Blog

관련 글

더 보기 »

Arvind KC, 인사 최고 책임자 임명

공지: 우리는 Arvind KC를 OpenAI의 Chief People Officer로 맞이하게 되어 기쁩니다. KC는 engineering 깊이와 people leadership이라는 드문 조합을 가지고 있습니다....