Generative AI의 기본 개념 설명

발행: 3개월 전 (2026년 1월 16일 오후 03:48 GMT+9)

10 분 소요

원문: Dev.to

Source: Dev.to

도메인 2 – 생성 AI 기본

작업 설명 2.1

도메인 1은 AI/ML의 언어를 제공합니다.
도메인 2는 AWS 시험 내용과 실제 워크로드에서 점점 더 핵심이 되고 있는 보다 구체적인 주제, 즉 Generative AI에 초점을 옮깁니다.

레이블(예: 사기/비사기)이나 숫자(예: 다음 달 수요)를 예측하는 대신, GenAI 모델은 방대한 데이터셋에서 학습한 패턴을 기반으로 텍스트, 이미지, 오디오, 비디오, 코드와 같은 새로운 콘텐츠를 생성합니다.

이 도메인은 핵심 구성 요소(토큰, 임베딩, 트랜스포머, 디퓨전), 일반적인 사용 사례 및 기본 모델의 고수준 라이프사이클을 다룹니다.

🎯 목표

생성 AI의 핵심 개념과 용어를 정의합니다.
생성 AI 모델의 일반적인 실제 사용 사례를 인식합니다.
데이터 및 모델 선택부터 사전 학습, 파인튜닝, 평가, 배포, 피드백에 이르는 기본 모델 라이프사이클을 설명합니다.

1️⃣ 기본적인 GenAI 개념 정의

1.1 Tokens

Tokens 은 언어 모델이 읽고 쓰는 기본 단위(단어, 서브‑워드, 구두점, 공백)입니다.
Tokens 가 중요한 이유: 비용/지연 시간 및 모델 제한은 종종 토큰 수(입력 + 출력)와 연결됩니다.

1.2 Chunking

Chunking 은 큰 텍스트를 더 작은 구간(“chunks”)으로 나누어 효과적으로 처리할 수 있게 합니다.
Retrieval‑Augmented Generation (RAG) 에서 사용됩니다: 청크를 저장/검색한 뒤 가장 관련성 높은 청크를 모델에 제공합니다.
Chunking 이 중요한 이유: 모델은 context‑window 제한이 있기 때문에, 청크를 사용하면 유용한 정보를 프롬프트에 맞출 수 있습니다.

1.3 Embeddings

Embeddings 은 의미를 포착하는 콘텐츠(텍스트, 이미지 등)의 수치적 표현입니다.
의미가 비슷한 항목은 유사한 임베딩을 갖게 됩니다.
Embeddings 의 활용 분야:
- 의미 검색
- 클러스터링
- 추천
- Retrieval

1.4 Vectors

Vector 는 임베딩을 나타내는 숫자 배열입니다.
벡터는 유사도 측정(예: 코사인 유사도)으로 비교되어 “가장 의미가 가까운” 항목을 찾습니다.

1.5 Prompt Engineering

Prompt engineering 은 모델 출력에 방향을 제시하기 위해 지시문과 컨텍스트를 설계하는 작업입니다.
주요 기법:
- 명확한 지시문
- 역할 프롬프팅
- Few‑shot 예시 제공
- 제약 조건 설정
- 형식 요구사항 지정
- 검색된 컨텍스트와의 결합(grounding)
왜 중요한가: 효과적인 프롬프트만으로도 재학습 없이 품질을 크게 향상시킬 수 있습니다.

1.6 Transformer‑Based LLMs

최신 LLM은 transformer 아키텍처를 기반으로 합니다.
핵심 아이디어: 입력의 관련 부분에 집중하도록 하는 어텐션 메커니즘.
강점:
- 언어 이해 및 생성
- 요약
- 추출
- 제한이 있지만 추론과 유사한 행동

1.7 Foundation Models (FMs)

Foundation models 은 광범위한 데이터셋으로 학습된 대규모 범용 모델로, 다양한 작업에 적응할 수 있습니다.
LLM이 흔한 형태이지만, 이미지, 오디오, 멀티모달 작업을 위한 FM도 존재합니다.

1.8 Multimodal Models

Multimodal 모델은 하나 이상의 모달리티(예: 텍스트 + 이미지)를 입력받거나 생성합니다.
예시: 이미지를 제공하고 설명을 요청하거나, 텍스트를 제공해 이미지를 생성하도록 합니다.

1.9 Diffusion Models

Diffusion models 은 이미지 생성에 널리 사용됩니다.
“노이즈 추가” 과정을 역전시키는 방법을 학습합니다: 노이즈에서 시작해 점진적으로 이미지를 만들어냅니다.
왜 중요한가: 고품질 텍스트‑투‑이미지 생성의 핵심 기술입니다.

2️⃣ GenAI 모델의 잠재적 사용 사례 식별

GenAI는 대규모로 콘텐츠를 생성, 변환 또는 상호작용해야 할 때 빛을 발합니다. 일반적인 실제 사용 사례는 다음과 같습니다:

#	사용 사례	예시
2.1	요약	회의록, 사고 보고서, 법률 문서, 지원 티켓, 의료 기록(거버넌스 포함)
2.2	AI 어시스턴트 및 챗봇	직원 헬프데스크, IT‑ops 어시스턴트, 지식베이스 Q&A, HR 정책 어시스턴트
2.3	번역	다국어 고객 지원, 글로벌 문서화, 현지화 파이프라인
2.4	코드 생성	보일러플레이트 생성, 코드 설명, 테스트 생성, 리팩토링 지원
2.5	고객 서비스 에이전트	응답 초안 작성, 의도 분류, 해결 제안, 일상적인 상호작용 자동화
2.6	시맨틱 검색	의미 기반 검색(임베딩 + 검색)
2.7	추천 엔진	임베딩 및 생성적 추론을 사용해 관련 제품/콘텐츠 제안
2.8	이미지/비디오/오디오 생성	마케팅 크리에이티브, 제품 목업, 보이스오버, 프로토타이핑, 콘텐츠‑제작 워크플로우

Note: GenAI는 언어/콘텐츠 생성이나 비정형 데이터 이해에 특히 강력하지만, 결정론적 출력이 필요한 경우에는 적합하지 않습니다.

3️⃣ 기본 모델 라이프사이클 설명

기본 모델은 전통적인 머신러닝과 유사한 라이프사이클을 따르지만, GenAI에 특화된 단계와 의사결정이 포함됩니다:

3.1 데이터 선택

크고 다양성 있는 데이터셋 선택 (텍스트, 이미지, 코드 등).
필터링, 품질 관리 적용 및 민감 데이터, 라이선스, 안전성 고려 사항을 처리합니다.

3.2 모델 선택

기존 FM을 선택하거나 사전 학습/맞춤화를 결정합니다. 고려 요소:
- 기능 요구사항 (품질, 추론, 멀티모달)
- 지연 시간 / 비용 제약
- 도메인 특화 여부
- 거버넌스 요구사항

3.3 사전 학습

방대한 코퍼스를 사용해 기본 모델을 학습시켜 일반적인 표현을 학습합니다.
이 단계는 비용이 많이 들며 일반적으로 대형 제공업체가 수행합니다.

3.4 파인튜닝

추가 데이터(대개 더 작고 고품질)를 사용해 모델을 특정 도메인이나 작업에 맞게 조정합니다.
톤, 형식, 도메인 지식, 작업 성능을 개선할 수 있습니다.

3.5 평가

품질, 안전성, 성능을 평가합니다:
- 작업 품질 (도움 정도, 정확성)
- 견고성 (예외 상황)
- 편향 / 공정성
- 독성 / 안전성
- 환각 경향 (해당되는 경우)

3.6 배포

모델을 서비스 형태로 제공하고… (이하 내용이 이어집니다)