[논문] 비판‑정제를 통한 에이전시 퍼소나 생성: 산업 평가
개요
페르소나는 소프트웨어 공학에서 요구사항 도출, 설계, 검증을 지원하기 위해 널리 사용되지만, 수동으로 만들면 비용이 많이 들고 시간이 오래 걸리며 규모를 확장하기 어렵습니다. 최근 LLM 기반 접근 방식은 텍스트 데이터를 활용해 페르소나 생성을 자동화하지만, 대부분 단일 시도(single-shot) 생성과 주관적 평가에 의존해 실용적인 신뢰성이 제한됩니다. 우리는 반복적인 비판‑보완 루프(iterative critique‑refinement loop)를 중심으로 한 산업 수준의 페르소나 생성 방법인 PerGent를 제시합니다. 구체적으로 PerGent는 생성기와 비판기 역할을 하는 LLM 에이전트를 사용하고, 이를 오케스트레이터가 조정하여 인터뷰, 설문조사, 채용 공고와 같은 외부 자원을 활용해 사용자 정의 최대 라운드 수만큼 반복적으로 페르소나를 다듬습니다. 우리는 Kinaxis의 산업 현장에서 PerGent를 배포하고 평가했으며, 단일 시도 방식 등을 포함한 세 가지 베이스라인과 비교했습니다. 현장 전문가 평가에서 PerGent는 가장 높은 전문가 승인율(96.9%)을 기록했으며, 모든 베이스라인을 능가했습니다. 또한 LLM 도입 이전에 도메인 전문가가 수작업으로 만든 최선 실천 페르소나와 PerGent가 생성한 페르소나를 비교했습니다. 베이스라인에 비해 PerGent는 전문가 내용의 더 큰 비율을 재현할 뿐만 아니라, 사전 LLM 페르소나에 없던 상당한 신규 콘텐츠도 추가했습니다. 마지막으로 Kinaxis에서 PerGent를 배포하고 평가하면서 얻은 교훈을 정리합니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.SE
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실무적 함의
이 연구는 cs.SE 분야의 발전에 기여합니다.
저자
- Mohammad Hossein Amini
- David Dewar
- Shiva Nejati
- Mehrdad Sabetzadeh
논문 정보
- arXiv ID: 2606.09637v1
- 분류: cs.SE
- 출판일: 2026년 6월 8일
- PDF: PDF 다운로드