💡 🔄 CRISP-DM en la práctica: cuando comienzas un proyecto de datos
Source: Dev.to
Introducción
CRISP‑DM aparece en casi todos los cursos de ciencia de datos:
- Business Understanding
- Data Understanding
- Data Preparation
- Modeling
- Evaluation
- Deployment
Suena lineal y ordenado, pero en la práctica no lo es. CRISP‑DM no es un flujo, es un ciclo de fricción constante, y eso es bueno.
Business Understanding
Qué no es
En teoría, el proyecto empieza entendiendo el problema de negocio. En la práctica, el “problema” suele venir formulado como:
- “Necesitamos un modelo predictivo”
- “Queremos usar IA”
- “Queremos algo con GenAI”
Eso no es un problema, es una solución disfrazada.
Qué implica realmente
- Redefinir el problema en términos medibles.
- Entender qué decisión se quiere mejorar.
- Analizar qué pasa si el modelo falla.
Si esta fase se hace mal, el resto del proyecto será técnicamente correcto pero estratégicamente irrelevante.
Data Understanding
Sorprende al iniciar
Los datos:
- No están completos.
- No están documentados.
- No representan exactamente el proceso de negocio.
- Cambian sin aviso.
En la práctica, Data Understanding y Data Preparation se mezclan constantemente. A menudo se vuelve a Business Understanding porque se descubre que el problema planteado no es viable con los datos existentes.
CRISP‑DM no es lineal; es iterativo.
Modeling
No es el centro del proyecto
Uno de los mayores mitos es que el modelado es “la parte importante”. En proyectos reales, modelar suele representar solo una fracción del esfuerzo total. Lo que realmente consume tiempo es:
- Limpieza de datos.
- Redefinición de métricas.
- Alineación de expectativas.
- Ajuste de supuestos.
- Explicación de resultados.
Evaluation
Más que performance
En los libros, Evaluation significa revisar métricas. En la práctica, implica responder preguntas incómodas:
- ¿Este modelo realmente mejora la decisión?
- ¿Qué pasa en escenarios extremos?
- ¿Es estable en el tiempo?
- ¿Qué riesgos regulatorios existen?
Aquí es donde muchos proyectos “técnicamente buenos” se caen.
Deployment
No es el final
CRISP‑DM termina en Deployment, pero en proyectos reales ese es el inicio de otra etapa:
- Monitoreo.
- Detección de drift.
- Ajustes.
- Reentrenamiento.
- Gobierno del modelo.
Un modelo sin monitoreo es un experimento en producción.
Si lo conectas con gobierno de modelos, el despliegue no es solo poner en producción, sino hacerlo observable y controlable.
Lecciones aprendidas usando CRISP‑DM en la práctica
- Es más iterativo de lo que parece.
- La mayor parte del valor se define antes de modelar.
- El éxito depende más de claridad de negocio que de sofisticación algorítmica.
- Sin gobierno y monitoreo, el marco queda incompleto.
CRISP‑DM sigue siendo uno de los marcos más sólidos para proyectos de datos, pero su poder no está en seguir las fases como checklist, sino en entender que cada fase conversa con las demás.
Cuando se usa bien, no solo estructura el proyecto, sino también la conversación entre datos y negocio.