💡 🔄 CRISP-DM en la práctica: cuando comienzas un proyecto de datos

Published: (February 16, 2026 at 01:46 PM EST)
3 min read
Source: Dev.to

Source: Dev.to

Introducción

CRISP‑DM aparece en casi todos los cursos de ciencia de datos:

  • Business Understanding
  • Data Understanding
  • Data Preparation
  • Modeling
  • Evaluation
  • Deployment

Suena lineal y ordenado, pero en la práctica no lo es. CRISP‑DM no es un flujo, es un ciclo de fricción constante, y eso es bueno.


Business Understanding

Qué no es

En teoría, el proyecto empieza entendiendo el problema de negocio. En la práctica, el “problema” suele venir formulado como:

  • “Necesitamos un modelo predictivo”
  • “Queremos usar IA”
  • “Queremos algo con GenAI”

Eso no es un problema, es una solución disfrazada.

Qué implica realmente

  • Redefinir el problema en términos medibles.
  • Entender qué decisión se quiere mejorar.
  • Analizar qué pasa si el modelo falla.

Si esta fase se hace mal, el resto del proyecto será técnicamente correcto pero estratégicamente irrelevante.


Data Understanding

Sorprende al iniciar

Los datos:

  • No están completos.
  • No están documentados.
  • No representan exactamente el proceso de negocio.
  • Cambian sin aviso.

En la práctica, Data Understanding y Data Preparation se mezclan constantemente. A menudo se vuelve a Business Understanding porque se descubre que el problema planteado no es viable con los datos existentes.

CRISP‑DM no es lineal; es iterativo.


Modeling

No es el centro del proyecto

Uno de los mayores mitos es que el modelado es “la parte importante”. En proyectos reales, modelar suele representar solo una fracción del esfuerzo total. Lo que realmente consume tiempo es:

  • Limpieza de datos.
  • Redefinición de métricas.
  • Alineación de expectativas.
  • Ajuste de supuestos.
  • Explicación de resultados.

Evaluation

Más que performance

En los libros, Evaluation significa revisar métricas. En la práctica, implica responder preguntas incómodas:

  • ¿Este modelo realmente mejora la decisión?
  • ¿Qué pasa en escenarios extremos?
  • ¿Es estable en el tiempo?
  • ¿Qué riesgos regulatorios existen?

Aquí es donde muchos proyectos “técnicamente buenos” se caen.


Deployment

No es el final

CRISP‑DM termina en Deployment, pero en proyectos reales ese es el inicio de otra etapa:

  • Monitoreo.
  • Detección de drift.
  • Ajustes.
  • Reentrenamiento.
  • Gobierno del modelo.

Un modelo sin monitoreo es un experimento en producción.

Si lo conectas con gobierno de modelos, el despliegue no es solo poner en producción, sino hacerlo observable y controlable.


Lecciones aprendidas usando CRISP‑DM en la práctica

  • Es más iterativo de lo que parece.
  • La mayor parte del valor se define antes de modelar.
  • El éxito depende más de claridad de negocio que de sofisticación algorítmica.
  • Sin gobierno y monitoreo, el marco queda incompleto.

CRISP‑DM sigue siendo uno de los marcos más sólidos para proyectos de datos, pero su poder no está en seguir las fases como checklist, sino en entender que cada fase conversa con las demás.

Cuando se usa bien, no solo estructura el proyecto, sino también la conversación entre datos y negocio.

0 views
Back to Blog

Related posts

Read more »

Preface

Motivation I wanted to record my studies to have consistency. Since I don't directly learn building projects from my CS program, I want to be an expert in my a...