OCR이란? (그리고 실제 적용 사례 4가지)

발행: 2개월 전 (2026년 2월 5일 오후 06:08 GMT+9)

3 분 소요

원문: Dev.to

Source: Dev.to

OCR이란?

OCR은 Optical Character Recognition의 약자입니다. 간단히 말하면, 문서 사진이나 스캔한 PDF와 같은 텍스트 이미지들을 실제 기계가 읽을 수 있는 텍스트 형식(예: 일반 텍스트, JSON, .txt 파일)으로 변환하는 기술입니다.

OCR이 없으면 사진 속 페이지는 컴퓨터에게 단지 색상 픽셀의 격자에 불과합니다. OCR을 사용하면 그 격자가 검색하고, 편집하고, 저장할 수 있는 데이터가 됩니다.

최신 OCR 엔진은 패턴 인식과 머신러닝을 활용해 글자와 숫자의 형태를 식별합니다. 폰트가 특이하거나 조명이 어두워도 인식이 가능합니다.

🧾 영수증 데이터를 엑셀에 수동으로 입력하는 대신, 앱이 OCR을 사용해 사진을 스캔하고 총 금액, 날짜, 가맹점 이름을 추출하여 자동으로 비용을 기록합니다.

🆔 은행 앱에 가입하고 운전면허증을 업로드하면, OCR이 이름, 생년월일, ID 번호를 읽어 즉시 인간 검토 없이 신원을 확인합니다.

🚗 스마트 주차장은 차량이 들어오고 나갈 때 카메라와 OCR을 사용해 번호판을 읽고 자동으로 주차 요금을 계산합니다.

🦾 화면 판독기는 픽셀을 읽을 수 없습니다. OCR 도구는 웹사이트의 이미지에서 텍스트를 스캔하고 추출하여 시각 장애인에게 음성으로 읽어줍니다.

OCR은 물리적인 “종이” 세계와 디지털 “데이터” 세계를 연결하는 다리입니다. 만약 수동 데이터 입력을 디지털화해야 하는 앱을 만든다면, 스택에 OCR 라이브러리(예: Tesseract.js 또는 Google Vision API)가 필요할 것입니다!