인간과 AI, 함께 데이터를 탐험하다 - BDA 2.0 서비스의 탄생, 현재 그리고 미래

Published: (February 10, 2026 at 06:53 PM EST)
8 min read

Source: Samsung Tech Blog

February 11, 2026
정민주 조회수 15

들어가며 : BDA 2.0의 개발 배경

2025년 OpenAI가 발행한 ‘The State of Enterprise AI 2025’ 보고서에 따르면, 테크 산업에서 ChatGPT 모델의 이용자 수는 11배 증가했습니다. 가장 성장세가 느린 교육 분야에서도 2배의 성장률을 보였습니다 (Figure 1). 특히, 데이터 분석 업무를 하며 연관 도구를 사용하는 선제적 이용자들(frontier)의 이용률은 16배 이상 증가하였습니다 (Figure 2).

Figure 1

Figure 2

AI 도구 사용이 일상화되면서 인간‑AI 협업 양상이 복잡성을 띠게 되었습니다. 이는 다음 세 가지 형태로 구분됩니다.

인간 중심 모드 (Human‑Centric Mode)

  • 사람이 주요 의사결정권을 갖고, AI는 보조 도구로 사용됩니다.
  • 인간의 직관과 감독을 중시하며, AI는 데이터 집약적이거나 반복적인 작업을 처리합니다.

공생 모드 (Symbiotic Mode)

  • 인간과 AI가 긴밀히 협력하여 서로의 능력을 높이는 파트너십입니다.
  • 양방향 상호작용, 공유 의사결정, 지속적 피드백 교환을 특징으로 하며, 집단적 목표 달성을 위해 시너지를 추구합니다.

AI 중심 모드 (AI‑Centric Mode)

  • AI가 주요 주체로서 결정 과정을 주도하고 인간의 개입이 최소화됩니다.
  • 주로 AI가 자체적으로 자동화 작업을 수행해 시스템 효율성을 극대화합니다.

빅데이터 분석 등 머신러닝 모델을 활용하는 작업은 대부분 인간 중심 모드에 포함되었습니다. 2022년 11월 ChatGPT 등 생성형 AI와 LLM이 본격적으로 상용화되면서 인간‑AI 협업은 공생 모드로 전환되었습니다. 이후 AI 기술 전반의 지속적인 발전에 따라 일부 분야에서는 AI 중심 모드로 나아가려는 연구와 논의가 활발히 이루어지고 있습니다.

BDA 1.0은 데이터 분석 영역을 인간 중심 모드에서 공생 모드로 전환하기 위해 기획·개발된 플랫폼입니다. 삼성닷컴의 판매 데이터와 삼성 계정 데이터를 자연어 질의만으로 분석하고, 메트릭을 시각화하여 업무 생산성을 높이고자 했습니다.

BDA 1.0을 확장하는 과정에서 다음과 같은 문제가 드러났습니다.

  • 도메인 지식·데이터 구조 없이 LLM의 자연어‑SQL 변환 정확도가 낮음 (Spider 2.0 기준 최신 MoE LLM 50% 정확도).
  • LLM 훈련·평가와 도메인 데이터 제공 역할이 분리돼 커뮤니케이션 비용이 크게 증가.

이를 해결하기 위해 Human‑In‑The‑Loop 전략을 도입했습니다. 사람은 도메인 데이터를 제공하고, 이를 사용해 LLM을 훈련·평가합니다. 특히 Expert‑In‑The‑Loop를 적용해, 데이터 도메인별 전문성을 가진 사용자가 적절한 시점에 시스템에 개입하도록 UI/UX를 설계했습니다. 이 개선을 거쳐 BDA 2.0이 탄생했습니다.

BDA 2.0 서비스 소개

Figure 3

Figure 4

서비스에 접속하면 처음 보이는 Home 화면은 대부분의 대화형 LLM 서비스와 유사한 챗봇 화면입니다. 데이터 도메인별 전문 AI(에이전트)를 사용해 분석을 실행하려면 Home에서 즐겨찾기에 추가한 에이전트를 선택하거나 Catalog에서 원하는 도메인의 에이전트를 탐색합니다 (Figure 3, 4).

Figure 5

Figure 6

사용자는 자연어 질의를 통해 SQL을 생성하고 실행 결과를 확인할 수 있습니다. 복잡한 요청일 경우 SQL 길이와 출력 데이터 양이 많아지므로, 주요 인사이트나 하이라이트를 제공받아 효율적으로 파악할 수 있습니다 (Figure 5, 6). 이 기능은 BDA 1.0과 유사합니다.

BDA 2.0의 차별점은 Lab 화면에서 사용자가 직접 에이전트를 만들고 배포할 수 있다는 점입니다.

Figure 7

Figure 8

Lab에 접속하면 에이전트를 생성하고(Figure 7), 해당 에이전트가 특화될 데이터 범위를 설정할 수 있습니다(Figure 8).

Figure 9

Figure 10

Figure 11

에이전트가 올바른 SQL을 생성하도록 가이드하는 데이터를 입력합니다. 여기에는:

  • 에이전트 데이터 범위가 되는 테이블 메타데이터
  • 도메인 메타데이터
  • 자연어‑SQL 쌍을 포함한 Train Set
  • 학습 품질을 검증하기 위한 Test Set

이 모두가 포함됩니다 (Figure 9‑11).

Figure 12

Figure 13

Test Set을 통해 에이전트가 정확한 SQL을 생성하도록 준비가 되었는지 검증합니다(Figure 12). 검증 결과가 만족스럽지 않다면, 추가 데이터 제공 방안을 AI가 제안하고, 지정된 횟수만큼 반복 개선을 수행하는 AI Optimization 자동화 기능을 활용할 수 있습니다(Figure 13).

BDA 2.0의 향후 도전 과제

공생 모드의 인간‑AI 협업은 과거에 없던 새로운 경험이며, BDA 2.0 개발에 참여한 사람들 역시 사용자로서 새로운 감각과 영감을 얻고 있습니다. 앞으로 BDA 2.0은 사람과 AI 사이의 다양한 상호작용을 실험하고, 더 나은 데이터 분석 경험을 제공하기 위해 지속적으로 발전해 나갈 것입니다.

0 views
Back to Blog

Related posts

Read more »

생성형 AI 기술로 고전 드라마 화질을 4K급으로 개선

들어가며 VD 사업부 화질 Solution Lab의 이현승입니다. 본 포스트에서는 오래 전 제작된 고전 드라마를 AI 기술을 통해 4K 수준의 화질로 자동 리마스터링하는 기술을 소개하고자 합니다. 이러한 기술의 배경과 발전 흐름, 서비스 적용 시 겪은 문제점과 실험 결과를 설명해드리겠...

2월은 정주행의 달! 리디, 팬심 맞춤 프로모션 진행

!https://ridicorp.com/wp-content/uploads/2026/02/RIDI_PROMOTION_202602-940x634.jpg 프로모션 개요 콘텐츠 플랫폼 기업 리디 주식회사대표 배기식, 이하 리디는 설 연휴와 발렌타인데이를 맞아 팬들의 취향을 저격하는 시즌 맞춤...