[Paper] Data-Driven Methods와 AI를 활용한 Engineering Design: 도전 과제와 기회에 초점을 맞춘 체계적 문헌 검토
Source: arXiv - 2511.20730v1
Overview
새로운 체계적 문헌 리뷰는 데이터‑주도 방법(DDM)과 AI가 엔지니어링 설계 라이프사이클 전반에 어떻게 활용되고 있는지를 지도화한다. 지난 10년간 발표된 114개의 피어‑리뷰 논문을 분석함으로써, 저자들은 머신러닝(ML) 기법이 활발히 사용되는 영역, 아직 드문 영역, 그리고 엔지니어가 실제 제품 개발에 AI를 적용하려 할 때 마주하는 장애물을 밝혀낸다.
Key Contributions
- 포괄적인 매핑: DDM(ML, 통계, 딥러닝, 대리 모델)을 V‑모델의 네 단계(시스템 설계, 구현, 통합, 검증)와 연결.
- 정량적 추세: 오늘날 ML과 전통적인 통계 도구가 주도하고 있으며, 딥러닝 활용이 가속화되고 있음을 보여줌.
- 갭 식별: 검증 단계에서 AI 기반 기여가 현저히 적으며, 단계 간 추적 가능성이 약함.
- 도전 과제 분류: 해석 가능성, 데이터 품질, 모델 전이성, 실제 검증 등을 포함.
- 향후 로드맵: 해석 가능한 하이브리드 모델과 컴퓨터 과학 알고리즘과 엔지니어링 설계 작업 간의 긴밀한 정렬을 요구.
Methodology
저자들은 PRISMA 체계적 리뷰 프로토콜을 따랐다:
- 범위 정의 – 간소화된 V‑모델(설계 → 구현 → 통합 → 검증)을 기준 프레임워크로 채택.
- 데이터베이스 검색 – 2014‑2024년 사이에 “data‑driven”, “AI”, “engineering design” 관련 키워드로 Scopus, Web of Science, IEEE Xplore를 조회.
- 스크리닝 – 초기 1,689건 중 중복 및 범위 외 논문을 제거해 전체 텍스트 분석 대상은 114개 논문.
- 분류 – 각 연구를 다음 항목에 따라 코딩:
- DDM 유형(예: 지도 학습, 클러스터링, 딥러닝, 대리 모델링)
- 적용된 라이프사이클 단계
- 보고된 도전 과제 및 검증 접근법
- 통합 – 집계된 수치, 추세선, 주제 분석을 통해 최종 인사이트 도출.
이 과정은 다른 연구자들이 리뷰를 재현하거나 확장할 수 있도록 투명하게 설계되었다.
Results & Findings
| Lifecycle Stage | Dominant DDMs | Emerging Techniques | Notable Gaps |
|---|---|---|---|
| System Design | 지도 학습(회귀, 분류), 클러스터링, 대리 모델 | 딥러닝(예: 생성 설계) – 아직 <10% | 개념 탐색을 위한 강화 학습 활용 제한 |
| System Implementation | 회귀, 통계 DOE, 대리 모델링 | 구성 요소 수준 예측을 위한 DL | 실시간 모델 업데이트를 다루는 연구 부족 |
| System Integration | 다목표 최적화, 클러스터링, 대리 모델 | 시스템 수준 성능 예측을 위한 DL | 학제 간 데이터 융합에 대한 연구 부족 |
| Validation | 주로 통계적 검증(교차 검증, 오류 지표) | 딥러닝 기반 검증 거의 없음 | 현장 테스트 또는 하드웨어‑인‑루프 실험 부족 |
- 추세: 딥러닝 논문 비중이 2014년 <2 %에서 2023년 >15 %로 증가했으며, 이는 신뢰도가 상승하고 있지만 아직 초기 단계임을 시사한다.
- 도전 과제:
- 해석 가능성: 엔지니어가 안전‑중요 결정에 블랙박스 모델을 신뢰하기 어려움.
- 추적 가능성: 모델 출력과 설계 요구사항을 단계별로 연결하는 것이 번거로움.
- 실제 검증: 대부분의 논문이 시뮬레이션 검증에 머무르고, 물리적 프로토타입에 적용하는 경우는 드뭄.
Practical Implications
- 제품 개발 팀을 위해 – 상용 ML 도구(회귀, 클러스터링)는 초기 설계와 통합 작업에 충분히 성숙했다. 팀은 작은 규모로 시작해 인프라 구축 부담 없이 이러한 방법을 활용해 트레이드‑오프 분석을 가속화할 수 있다.
- 툴 벤더에게 – 해석 가능성(예: SHAP, LIME)과 버전 관리된 모델 출처 정보를 PLM/ALM 시스템에 직접 삽입하는 플랫폼에 시장 기회가 있다. 이는 추적 가능성 격차를 메워줄 것이다.
- AI 엔지니어에게 – 딥러닝 활용 증가 추세는 CAD 기하학에 특화된 그래프 신경망 등 도메인‑특화 아키텍처를 개발하고, 이를 후속 단계에 안전하게 전이할 필요성을 강조한다.
- 품질·안전 보증 – 검증 단계 AI 활용이 부족하므로, 시뮬레이션, 디지털 트윈, 하드웨어‑인‑루프 실험을 결합한 새로운 테스트 프레임워크가 필요하다. 이는 규제 기관과 인증 기관이 AI‑보강 설계를 평가하도록 돕는다.
- 교육·훈련 – 교육 과정 설계자는 물리 기반 모델과 데이터‑주도 모델을 결합한 하이브리드 모델링을 강조해, AI 모델을 구축하고 비판적으로 평가할 수 있는 엔지니어를 양성해야 한다.
Limitations & Future Work
- 범위 제한 – 리뷰는 세 개 주요 데이터베이스에 색인된 논문만을 대상으로 했으며, 산업 백서나 컨퍼런스 데모는 누락될 수 있다.
- V‑모델 단순화 – 실제 개발은 반복적이거나 애자일 사이클을 따르는 경우가 많아, 네 단계 매핑이 완전히 포착하지 못할 수 있다.
- 분석 깊이 – 방법론의 보급 정도는 정량화했지만, 동일 설계 문제에 대한 다양한 DDM의 성능 비교는 수행하지 않았다.
향후 연구는 (1) 특정 AI 알고리즘을 구체적인 엔지니어링 설계 작업에 직접 연결하는 분류 체계를 만들고, (2) 해석 가능한 하이브리드 모델 구축 가이드라인을 개발하며, (3) 시뮬레이션에서 물리 프로토타입으로 AI를 이전시키는 견고한 검증 파이프라인을 설계하는 것을 목표로 해야 한다.
Authors
- Nehal Afifi
- Christoph Wittig
- Lukas Paehler
- Andreas Lindenmann
- Kai Wolter
- Felix Leitenberger
- Melih Dogru
- Patric Grauberger
- Tobias Düser
- Albert Albers
- Sven Matthiesen
Paper Information
- arXiv ID: 2511.20730v1
- Categories: cs.SE, cs.AI, cs.LG
- Published: November 25, 2025