기상·기후 과학 AI 혁명, 실은 혁신적이지 않다

발행: 3일 전 (2026년 6월 8일 PM 08:00 GMT+9)

10 분 소요

Source: Ars Technica

지금은 정말 뜨거워요







  머신러닝에는 한계가 있다—그럼 어떻게 활용되고 있을까?


      


        
          ![](https://cdn.arstechnica.net/wp-content/uploads/2026/05/ai-climate-mapping.jpg)
        


      크레딧:

      
      Aurich Lawson | Getty Images

              
      

      




      크레딧:

      
      Aurich Lawson | Getty Images

AI를 피할 수 없는 시대가 된 듯합니다. 디지털 “비서”가 끼어들지 않게 문장을 입력하려 애쓰거나, 이유는 모르겠지만 Wi‑Fi 연결이 필요 없는 새 냉장고를 찾는 데 어려움을 겪고 있든 말이죠. 기술이 양자 도약을 이루고 있는 건지, 아니면 사람들만 허풍을 부리고 있는 건지 궁금해도 손색이 없습니다.

그렇다면 날씨와 기후 모델링에 AI가 점점 더 많이 사용되는 현상을 우리는 어떻게 받아들여야 할까요?

올해 초, 미국 국립기상청(NWS) 사무소가 아이오와 주에 존재하지 않는 도시 이름(예: “Whata Bod”, “Orangeotild”)을 넣은 예보 지도를 게시하면서 대화가 순조롭게 시작되지 않았습니다. 다행히도 이는 실제 예보 모델이 아니라 소셜 미디어용으로 만든 AI 생성 이미지였습니다. 기상학자와 기후 과학자들이 아직 대형 언어 모델 프롬프트 엔지니어에게 대체된 것은 아닙니다.

하지만 AI는 연구자들이 수년간 연구해 온 기법을 통해 이 분야에 활용되고 있으며, 그 강점과 약점도 잘 알려져 있습니다. 그리고 당연히, 날씨와 기후 시뮬레이션 모델에 적용되는 기법은 서로 다릅니다.

ML, LLM이 아니다

이 모든 모델에서 “AI”는 머신러닝을 의미합니다. 머신러닝의 다양한 변형에 대한 기술적 세부사항을 파고들지는 않겠지만, 기본 아이디어는 간단합니다: 컴퓨터를 이용해 데이터 속 패턴을 찾아내는 것이죠.

데이터에 직선 추세선을 맞추는 선형 회귀는 패턴을 식별하는 가장 단순한 방법입니다. 더 복잡한 곡선이나 방정식으로 회귀를 수행할 수도 있습니다. 머신러닝의 힘(그리고 잠재적 함정)은 알고리즘이 훨씬 높은 복잡성을 처리할 수 있어, 사람이 손으로는 찾기 어려운 관계까지도 포착한다는 점입니다.

머신러닝은 처음부터 모델을 학습시키는 것으로 시작합니다. 모델에 신경망 같은 구조를 부여하면, 알고리즘의 동작을 미세 조정할 수 있는 여러 개의 ‘노브’를 독립적으로 조정할 수 있게 됩니다. 그리고 수천 장의 새 사진처럼 정답이 라벨링된 방대한 예시 데이터를 제공합니다. 모델은 반복적으로 사진 내용과 올바른 종을 연결하는 최적의 노브 값을 찾아냅니다.

몇 가지 제한점은 명백합니다. 이 알고리즘은 학습되지 않은 종이나, 예시와 너무 다른 하위 집단을 식별하지 못합니다. 학습 데이터의 품질도 매우 중요합니다. 예를 들어 소나무 나무 사이에 있는 까치 사진만 사용한다면, 모델은 소나무 잎을 까치의 특징으로 포함시킬 수도 있습니다.

추가 작업 없이 우리는 모델이 어떻게 답을 도출했는지 알기 어려울 수 있습니다. 내부 메커니즘은 대부분 경우에 블랙박스와 같습니다.

그럼에도 장점은 확실합니다. 머신러닝 알고리즘은 인간이 만든 최선의 알고리즘보다 계산 효율성(정확도까지 포함한다면) 면에서 종종 뛰어납니다. 단, 올바르게 사용하지 않으면 제한점이 드러납니다.

클라우드 컴퓨팅

날씨 예보 모델의 경우, 과정은 새 식별 예시와 크게 다르지 않지만, 두 개의 서로 다른 시점에 수집된 날씨 데이터 세트로 모델을 학습시킵니다.

이 모델들은 모든 위치에서 물리 방정식을 풀지 않기 때문에 전통적인 날씨 모델보다 훨씬 빠르게 실행됩니다.

Google, Nvidia, Huawei, 그리고 Microsoft 등 여러 기업이 독립 학계와 협업해 현재 사용 중인 예보 모델과 견줄 만한 초기 모델을 개발했습니다. 모델이 어디에서 강점이 있고 어디에서 약점이 있는지 파악한 뒤, 주요 기상 예보 센터들은 자체 모델 개발에 착수했습니다.

유럽 중기예보센터(ECMWF)는 2025년 2월에 최초의 머신러닝 기반 모델을 서비스에 투입했으며, 기존의 통합 예보 시스템(IFS) 모델과 병행 운용했습니다.

AIFS 모델은 재분석 데이터를 활용해 학습됩니다. 재분석은 모든 가용 날씨 관측치를 모아 측정이 없는 영역을 물리적으로 일관된 형태로 채워 만든 데이터셋입니다. 이 중요한 도구는 이전 스냅샷을 기반으로 다음 전 세계 스냅샷(6시간 뒤)을 예측하는 머신러닝 작업을 크게 단순화합니다.

각 스냅샷은 온도, 기압, 풍향·풍속, 수증기, 구름량, 강수량, 태양 복사, 토양 수분 등에 대한 정보를 담고 있습니다. 물리 법칙을 적용하는 대신, 모델은 과거에 어떻게 변했는지를 나타내는 공간 패턴을 단순히 추출합니다.

이 때문에 이상 현상이 발생할 수 있습니다. 머신러닝 모델은 “열” 열에 적힌 값이 강수량이며 강수량은 음수가 될 수 없다는 사실을 ‘알지’ 못하고, 혹은 한 격자 셀에서 바깥으로 나가는 바람은 인접 셀로 들어오는 바람과 질량·에너지 보존 법칙에 의해 균형을 이뤄야 한다는 점도 모릅니다. 전체 오류를 최소화하도록 최적화된 모델은 비논리적인 불가능성을 허용하면서 목표에 도달할 수 있습니다.

이 문제를 다루는 일반적인 방법은 모델 출력에 제약을 두는 것입니다. 예를 들어 ECMWF 모델은 음수로 예측된 강수량을 0으로 재매핑합니다. 물리적 가드레일을 설정하는 작업은 머신러닝 모델을 개선하기 위한 주요 초점 중 하나입니다.

          ![유럽 전역의 세 가지 강수 예보 지도.](https://cdn.arstechnica.net/wp-content/uploads/2026/05/AIFS_tp_paper_new_old_IFSshort-1024x284.jpg)
        
          AIFS 모델이 음수 강수량을 제한하도록 업그레이드하기 전(왼쪽)과 후(중간) 그리고 비교를 위한 전통적인 IFS 모델(오른쪽)입니다.
                          
                      
      
      
    


  AIFS 모델이 음수 강수량을 제한하도록 업그레이드하기 전(왼쪽)과 후(중간) 그리고 비교를 위한 전통적인 IFS 모델(오른쪽)입니다.

          
      크레딧:

                  
      
      Moldovan 외

이러한 머신러닝 모델의 가장 큰 장점은 계산 효율성에서 확연히 드러납니다. ECMWF에 따르면 IFS 한 번 실행에 소요되는 에너지는 AIFS 한 번 실행에 비해 약 1,000배이며, 실행 시간도 약 30분이 걸리는 반면 AIFS는 3분 정도에 끝납니다. 이러한 절감 효과는 50개의 멤버를 운용하는 앙상블 예보 모델에서는 특히 크게 누적됩니다.

기상·기후 과학 AI 혁명, 실은 혁신적이지 않다

ML, LLM이 아니다

클라우드 컴퓨팅

관련 글

‘이대로는 안 된다’: Xbox 경영진, 침체된 브랜드 뒤 ‘가혹한 진실’ 밝힘

알래스카, NSF가 해양 모니터링망을 폐쇄해 눈이 멀다

최초의 복잡한 세포는 여러 종의 유전자를 혼합해 가지고 있었다.

AI와는 무관하게 내가 좋아하는 macOS 27 골든게이트의 몇 가지.

ML, LLM이 아니다

클라우드 컴퓨팅

관련 글

‘이대로는 안 된다’: Xbox 경영진, 침체된 브랜드 뒤 ‘가혹한 진실’ 밝힘

알래스카, NSF가 해양 모니터링망을 폐쇄해 눈이 멀다

최초의 복잡한 세포는 여러 종의 유전자를 혼합해 가지고 있었다.

AI와는 무관하게 내가 좋아하는 macOS 27 골든게이트의 몇 가지.

AI와는 무관하게 내가 좋아하는 macOS 27 골든게이트의 몇 가지.