AI 풀스텍 기업 ‘엘리스그룹’, 1,900억 토큰 규모 한국어 AI 교육용 데이터셋 허깅페이스에 공개
발행: (2026년 1월 14일 오후 03:01 GMT+9)
2 min read
원문: beSuccess
Source: beSuccess
AI 풀스택 기업 엘리스그룹, 한국어 교육용 데이터셋 공개
AI 인프라와 클라우드, 산업별 솔루션을 제공하는 AI 풀스택 기업 ㈜엘리스그룹(대표 김재원)이 한국어 교육용 데이터셋 2종을 글로벌 오픈소스 플랫폼 ‘허깅페이스(Hugging Face)’에 공개했다. 엘리스그룹은 한국어 AI 모델 학습에 적합한 고품질 데이터를 연구자, 개발자, 기업이 폭넓게 활용할 수 있도록 제공해 국내외 AI 연구·개발 활성화를 지원할 계획이다. 이번에 공개된 데이터셋은 거대 언어 모델(LLM)의 한국어 성능을 학술∙교육 도메인에서 강화하기 위해 설계된 ‘한국어 파인웹 교육 데이터셋 데모(Korean FineW…