제가 GenAI 기반 데이터 분석에 도전한 방법 (그리고 AI 전략에 대한 새로운 관점을 열다)

발행: (2025년 12월 18일 오전 11:59 GMT+9)
11 min read
원문: Dev.to

Source: Dev.to

위에 제공된 소스 링크 외에 번역할 텍스트가 없습니다. 번역이 필요한 전체 내용을 알려주시면 한국어로 번역해 드리겠습니다.

Tata의 GenAI‑기반 데이터 분석 시뮬레이션에 대한 나의 여정

Commonwealth Bank Software Engineering ChallengeAWS Solutions Architect 여정을 마친 뒤, 나는 다음 도전을 갈망했다. 그때 Forage에서 제공하는 Tata의 GenAI‑기반 데이터 분석 시뮬레이션을 발견하게 되었다.

“편안함은 적이다. 계속 움직여라.”

아래는 실제 컨설팅 시나리오—연체 위험 예측, 윤리적인 AI 시스템 설계, 그리고 엔드‑투‑엔드 GenAI‑기반 분석 솔루션 구축—를 어떻게 해결했는지에 대한 이야기이다.

직접 해보고 싶나요? 읽기 전에 시뮬레이션을 여기에서 확인해 보세요. 스포일러 경고가 앞에 있습니다!

시나리오: AI 전환 컨설턴트

시뮬레이션은 여러분을 AI 전환 컨설턴트 역할에 배치하여 Geldium Finance의 컬렉션 팀과 함께 일하게 합니다.

고객문제목표
Geldium Finance높은 연체율, 비효율적인 채권 회수, AI 전략 부재연체 위험 예측 및 윤리적이고 확장 가능한 채권 회수 전략 구축을 위한 GenAI 기반 분석 솔루션 설계

이는 단순한 이론적 연습이 아니라 impact에 관한 것이었습니다.

Source:

도전 과제: 세 가지 상호 연결된 문제

제가 이 시뮬레이션에서 가장 좋았던 점은 작업들이 구획화되지 않았다는 것이었습니다. 각 작업이 이전 작업을 기반으로 하여 실제 컨설팅 업무가 흐르는 방식을 그대로 반영했습니다.

작업 1 – 탐색적 데이터 분석 (EDA) with GenAI

  • 데이터셋: 연체 플래그가 포함된 실제 고객 금융 데이터.
  • 목표: GenAI 도구를 활용해 데이터 품질을 평가하고, 위험 지표를 식별하며, 예측 모델링을 위한 인사이트를 구조화하는 EDA 수행.

상관 행렬을 보는 데 몇 시간을 소비하는 대신, GenAI를 사고 파트너로 활용했습니다—Claude와 ChatGPT가 다음을 도와주었습니다:

  • 가설 구조화
  • 이상치 식별
  • 숨겨진 패턴 도출

마인드셋 전환: GenAI는 분석을 대체하는 것이 아니라 규모에 맞춰 인사이트 생성 능력을 증폭시키는 것입니다.

작업 2 – 예측 모델링 프레임워크 설계

  • 목표: 고객 연체 위험을 평가하기 위한 초기 노코드 예측 모델링 프레임워크 구축.

노코드 접근 방식은 코드를 한 줄도 작성하기 전에 비즈니스 타당성, 확장성, 설명 가능성을 고민하게 만들었습니다. 제 프레임워크는 GenAI를 활용해:

  • 복잡한 알고리즘 없이 위험 점수 산정 로직 정의
  • 투명하고 감사 가능한 의사결정 경로 생성
  • 비즈니스 목표에 맞는 평가 기준 도출
  • 초기 단계부터 규제·컴플라이언스 고려사항 삽입

핵심 인사이트: 가장 좋은 모델은 비기술 이해관계자들이 실제로 이해하고 신뢰하는 모델입니다.

작업 3 – AI 기반 컬렉션 전략 설계

  • 목표: 다음을 포함하는 포괄적인 컬렉션 전략 설계
    • 에이전시 AI(자율 AI 에이전트) 활용
    • 윤리적 AI 원칙 및 공정성 고려
    • 규제·컴플라이언스 요구사항 충족
    • 수천 명의 고객에 대한 확장성 확보

다음과 같은 질문에 고민했습니다:

  • 편향을 증폭시키지 않고 줄이는 AI 자동화를 어떻게 설계할까?
  • 실제 확장 가능한 구현 프레임워크는 어떤 모습일까?
  • 공격적인 컬렉션과 고객에 대한 공감 사이의 균형은 어떻게 맞출까?

제출물은 200페이지 분량의 아키텍처 문서가 아니라, 비즈니스 요구와 윤리적 책임을 균형 있게 조화시킨 사려 깊고 실행 가능한 전략이었습니다.

Why This Challenge Hits Different

#Reason
1Real‑World Messiness – 더러운 데이터, 맞지 않는 요구사항, 모순되는 제약조건이 트레이드‑오프와 정당성을 강요합니다. 실제 업무와 똑같습니다.
2GenAI Integration (Not AI Replacement) – 질문은 “AI 솔루션을 어떻게 구축하나요?”가 아니라 “AI 도구를 사용해 비즈니스 문제를 어떻게 해결하나요?”였습니다.
3Ethical Complexity – 컬렉션은 민감한 영역이며, 시뮬레이션은 공정성, 편향 완화, 규제 인식을 요구했습니다.
4Progressive Scaffolding – 각 과제가 이전 과제 위에 자연스럽게 쌓여, 현실적인 컨설팅 참여 흐름을 만들었습니다.
5Forage’s Presentation – 다듬어지고 전문적인 형태로, 실제 클라이언트 이메일과 그럴듯한 시나리오가 포함돼 훈련 과제를 포트폴리오 수준의 작품으로 바꾸었습니다.

내가 만든 것

DeliverableWhat It Does
EDA Summary Report데이터 품질 평가, 위험 지표 식별, 구조화된 인사이트
Predictive‑Modeling Framework코드 없이 위험 점수 로직, 투명한 의사결정 경로
Collections Strategy윤리적 AI 아키텍처, 구현 로드맵, 규제 정렬
Streamlit ApplicationEDA 및 모델 계획을 위한 인터랙티브 대시보드

기술 스택

  • Python + Pandas – 데이터 정제
  • Streamlit – 인터랙티브 대시보드
  • GenAI (Claude / ChatGPT / Grok) – 워크플로 전반에 걸친 사고 파트너
  • Markdown – 구조화된 문서화

👉 오픈‑소스 코드 (GitHub):
GitHub Repository

주요 내용

  • 비즈니스 문제부터 시작하세요 – 모든 모델 결정은 영향으로 되돌아가야 합니다.
  • GenAI는 증폭시킬 뿐, 대체하지는 않습니다 – 이를 생각 파트너로 활용하고, 의존 도구로 쓰지 마세요.
  • 설명 가능성 > 복잡성 – 이해관계자가 신뢰하는 모델이 최선입니다.
  • 윤리는 선택 사항이 아닙니다 – 공정성과 규정 준수는 처음부터 내재되어야 합니다.
  • 실제 제품을 배포하세요 – 저는 보고서만 작성한 것이 아니라, 실제 작동하는 Streamlit 앱을 만들었습니다.

직접 해보세요

그런 다음 돌아와서 알려 주세요:

  • 가장 놀라웠던 점은 무엇인가요?
  • 분석에 대한 접근 방식이 어떻게 바뀌었나요?
  • 어떤 윤리적 딜레마와 씨름했나요?

진심으로 여러분의 의견을 듣고 싶습니다. 이런 도전의 아름다움은 정답이 하나가 아니라—사려 깊은 문제 해결에 있습니다.


Potential Next Steps

EnhancementDescription
Advanced VisualizationsMore sophisticated Streamlit dashboards
ML Model ImplementationValidate the no‑code framework with actual models
Ethical AI DocumentationLessons learned in bias mitigation
Prompting StrategiesDeep dive into GenAI techniques that worked

Final Thoughts

이 프로젝트는 나를 데이터 분석가, ML 전략가, 컨설턴트, 엔지니어 등 여러 역할로 확장시켰습니다. 하지만 그게 핵심입니다—실제 문제는 깔끔한 상자 안에 들어오지 않죠.

작동하는 애플리케이션, 탄탄한 문서, 그리고 GenAI가 기업 분석에 어떻게 들어맞는지에 대한 더 날카로운 관점을 얻고 떠났습니다. 이것이 제가 모든 참여에서 제공하는 결과물입니다.

한 번 시도해 보세요. 댓글에서 여러분의 의견을 기다리고 있겠습니다. 🚀

Back to Blog

관련 글

더 보기 »