왜 당신의 ATS가 이력서의 40%를 거부하는가 (지원자 때문이 아니다)
Source: Dev.to
Overview
우리는 최근 한 채용 대행사의 고통스러운 문제를 디버깅하는 데 도움을 주었습니다: 그들의 ATS가 파이프라인을 통해 들어오는 이력서의 거의 절반을 조용히 거부하고 있었습니다. 후보자들이 자격이 부족한 것도 아니었고, 이력서 자체도 나쁘지 않았습니다—파서는 단지 아무도 눈치채지 못한 방식으로 깨져 있었습니다.
Problems
Problem 1: Two‑column layouts
파서는 왼쪽‑오른쪽, 위‑아래 순으로 읽습니다. 두 열 이력서는 한 열의 기술이 다른 열의 날짜와 합쳐지는 현상을 일으킵니다. “Python”이 데이터베이스에 “Python 2019‑2021”로 저장되어 키워드 매칭이 조용히 실패합니다.
Problem 2: Text boxes
현대 이력서 템플릿은 헤더와 연락처 정보를 텍스트 상자에 넣어 사용합니다. 대부분의 파서는 텍스트 상자를 이미지로 처리하고 건너뛰기 때문에 후보자의 이메일과 전화번호가 완전히 사라집니다.
Problem 3: Compressed PDFs
지원자들은 파일 크기를 줄이기 위해 “최적화된” PDF를 내보냅니다. 압축 과정에서 텍스트 레이어가 사라져 파서는 텍스트 대신 이미지를 보게 됩니다. 파싱 신뢰도는 ~12 %로 떨어집니다.
Problem 4: Multi‑page headers
이름과 연락처 정보가 각 페이지 헤더에 반복되면 파서는 세 명의 다른 사람으로 인식합니다. ATS는 중복 레코드를 생성하고, 채용 담당자는 매번 약 20 분을 들여 중복을 제거합니다.
Problem 5: Custom fonts
Canva와 Figma 템플릿에서 사용하는 글꼴은 OCR이 잘못 인식합니다. “Marketing Manager”가 쓰레기 문자로 변환돼 키워드 매칭이 다시 실패합니다.
Root Cause
대부분의 이력서 파서는 10년 이상 된 Word 2007 포맷용으로 만들어졌습니다. 이제 후보자들은 Canva, Figma, LaTeX 등을 사용합니다. 이 불일치는 연간 수천 시간의 수동 데이터 입력 비용을 초래하고, 실패는 조용히 진행되기 때문에 눈에 띄지 않습니다.
Solution
What we built
우리는 이러한 문제를 해결하기 위해 ResumifyAPI (https://resumifyapi.com)를 만들었습니다:
- <200 ms 파싱 시간 — 직접 PDF 텍스트 레이어 추출, OCR은 백업으로만 사용
- 최신 템플릿에서도 92 % 파싱 신뢰도, 다중 열 레이아웃 포함
- 56개 필드 추출 — 연락처 정보, 기술, 경력, 학력, ATS 점수
- GDPR‑준수 — 파싱 후 이력서 데이터는 보관되지 않음
- 단일 API 호출 — 파일을 POST하면 구조화된 JSON을 반환
무료 티어: 하루 5회 파싱, 신용카드 필요 없음. 현재 사용 중인 파서와 비교해 볼 가치가 있습니다.