우르두 카티브 손글씨 데이터셋: 오프라인 우르두 손글씨 텍스트 인식용 CRNN 기반 베이스라인 평가

발행: 1일 전 (2026년 6월 17일 PM 11:46 GMT+9)

3 분 소요

원문: arXiv

출처: arXiv - 2606.19139v1

Overview

자동 서체 인식(HTR)은 본질적으로 도전적인 작업이며, 특히 큐리지 스크립트를 다룰 때는 복잡성이 더욱 증가합니다. 다양한 큐리지 스크립트에 대한 상당한 노력이 있었음에도 불구하고 우르두 서체 텍스트 인식(UHTR)에 대한 연구는 상대적으로 제한적입니다. 이 연구 격차는 그 스크립트가 제시하는 독특한 도전과 벤치마크 데이터셋의 부족·불가능성 principalmente 때문입니다. 따라서 UHTR 연구를 진전시키기 위해, 이 연구는 역사적 카티브(Katib) 글씨로 작성된 자료에서 구체적으로 구성된 특수 실물 데이터셋인 우르두 카티브 손글씨 데이터셋(UKHD)을 제시합니다. 본 연구의 지식으로는 역사적 시대에 카티브가 작성한 자료에서 구체적으로 구성된 오프라인 우르두 손글씨 텍스트 라인 데이터셋이 처음라는 점입니다. 나스타리케 서예체 스타일의 평행 펜(flat nib) 글쓰기 변형을 다양하게 포함하고 있습니다. 또한 다양한 CRNN 기반 하이브리드 모델의 효과를 평가하여 우르두 카티브 손글씨 인식(UKHR)을 위한 최적 아키텍처를 찾았습니다. 분석된 모델 중 CNN‑BGRU‑CTC 모델이 더 견고한 성능을 보였으며, 저Character Error Rate(CER)와 저Word Error Rate(WER)를 나타냈습니다. 본 연구는 우르두 서체 문학을 보존하기 위한 견고한 인식 시스템 개발을 지원하고 권장함으로써 연구 공동체를 목표로 합니다.

Key Contributions

이 논문은 다음과 같은 분야에서 연구를 제시합니다:

cs.CV
cs.CL

Methodology

자세한 방법については 전체 논문을 참고하십시오.

Practical Implications

본 연구는 cs.CV 분야의 발전을 기여합니다.

Authors

라므자 바샤라트
무함마드 우스만 알리

Paper Information

arXiv ID: 2606.19139v1
분류: cs.CV, cs.CL
발행일: 2026년 6월 17일
PDF: PDF 다운로드

우르두 카티브 손글씨 데이터셋: 오프라인 우르두 손글씨 텍스트 인식용 CRNN 기반 베이스라인 평가

Overview

Key Contributions

Methodology

Practical Implications

Authors

Paper Information

관련 글

네이티브 액티브 퍼셉션을 통한 멀티모달 이해 추론

루프된 세계 모델

[논문] 현재 관측을 넘어서: 제어 가능한 비마르코 게임에서의 다중모달 대형 언어 모델 평가

[논문] 튜링 보상으로 사용자 시뮬레이터 학습