Definición del Problema y Objetivos en Machine Learning


Definición del Problema y Objetivos en Machine Learning: La Base de un Proyecto Exitoso

La fase de definición del problema es el cimiento de cualquier proyecto de Machine Learning exitoso. Un modelo mediocre con un problema bien planteado superará siempre a un modelo excelente construido sobre una base mal definida.

Esta etapa determina qué se va a predecir, por qué, cómo se medirá el éxito y qué impacto tendrá en el negocio. Si falla aquí, todo lo que viene después —datos, features, modelos, evaluación— se construye sobre arena.

1. Formulación del problema: de lo vago a lo accionable

La pregunta inicial debe ser concreta, medible y accionable. La diferencia entre un problema bien y mal formulado marca el destino del proyecto.

Ejemplos de problemas mal definidos:

  • «Queremos predecir ventas»
  • «Necesitamos saber qué clientes se irán»
  • «Queremos mejorar la producción»

Ejemplos de problemas correctamente formulados:

  • «Predecir la demanda semanal por producto y tienda con un error inferior al 10% para optimizar niveles de inventario y reducir roturas de stock»
  • «Identificar clientes con probabilidad superior al 70% de abandonar el servicio en los próximos 30 días para activar campañas de retención personalizadas»
  • «Detectar defectos en piezas industriales durante la inspección con una precisión mínima del 95% para reducir costes de calidad y reclamaciones»

Un problema bien definido responde:

  1. Qué se predice exactamente
  2. Para qué se necesita esa predicción
  3. Cuándo se realizará la predicción
  4. Con qué nivel de precisión debe funcionar
  5. Qué acción concreta se tomará con el resultado

2. La variable objetivo: el corazón del proyecto

Sin un target claro y bien definido, no hay modelo posible. La variable objetivo debe ser observable, medible y estar disponible en el momento de la predicción.

Tipos de variables objetivo según el problema:

Tipo Ejemplos Casos de uso
Clasificación binaria Churn (sí/no), Fraude (sí/no) Detección, decisiones binarias
Clasificación multiclase Categoría de producto, Nivel de riesgo Segmentación, categorización
Regresión Precio, Demanda, Tiempo de entrega Predicción de valores continuos
Series temporales Ventas en t+7, Consumo en t+30 Forecasting, planificación
Ranking Orden de productos recomendados Sistemas de recomendación

Errores críticos al definir el target:

  • Usar un target que no existe en los datos históricos
  • Definir un target que no estará disponible en producción
  • Ignorar el concept drift (cambios en el comportamiento del target con el tiempo)
  • Confundir correlación con causalidad al elegir la variable

3. Objetivos del proyecto: más allá del modelo

Un proyecto de ML no termina en un modelo entrenado. Es una solución completa que debe generar valor medible.

Diagrama conceptual sobre la definición del problema, objetivos y variable objetivo en un proyecto de Machine Learning

Los objetivos deben seguir el marco SMART, un método probado para convertir intenciones vagas en metas accionables:

S – Específicos (Specific)

Función: Eliminar la ambigüedad y definir exactamente qué se quiere lograr.

Un objetivo específico responde a las preguntas: ¿Qué exactamente vamos a conseguir? ¿Quién está involucrado? ¿Dónde se aplicará?

  • ❌ Vago: «Mejorar las predicciones»
  • ✅ Específico: «Mejorar la precisión del modelo de predicción de demanda para las 50 tiendas de la región norte»

M – Medibles (Measurable)

Función: Establecer criterios cuantificables para saber si se ha alcanzado el objetivo.

Debe poder responderse con un número o porcentaje. Si no puedes medirlo, no puedes gestionarlo.

  • ❌ No medible: «Reducir el churn significativamente»
  • ✅ Medible: «Reducir la tasa de churn del 25% al 20%» o «Detectar el 95% de los casos de fraude»

A – Alcanzables (Achievable)

Función: Asegurar que el objetivo es realista dados los recursos, tiempo y capacidades disponibles.

Un objetivo debe ser ambicioso pero posible. Objetivos inalcanzables desmotivan al equipo y desperdician recursos.

  • ❌ Inalcanzable: «Alcanzar 100% de precisión en detección de fraude en 2 semanas con datos históricos limitados»
  • ✅ Alcanzable: «Alcanzar 92% de precisión en detección de fraude en 3 meses, mejorando el 85% actual»

R – Relevantes (Relevant)

Función: Garantizar que el objetivo está alineado con las prioridades estratégicas del negocio.

Pregúntate: ¿Por qué es importante este objetivo? ¿Cómo contribuye a los objetivos generales de la empresa? ¿Vale la pena el esfuerzo?

  • ❌ Irrelevante: «Predecir el color favorito de los clientes» (si no impacta en ventas ni retención)
  • ✅ Relevante: «Predecir la probabilidad de compra en los próximos 7 días para optimizar el gasto en campañas de marketing»

T – Temporales (Time-bound)

Función: Establecer una fecha límite clara que genere urgencia y permita planificar.

Sin un plazo definido, los objetivos se postergan indefinidamente. El tiempo también ayuda a priorizar recursos.

  • ❌ Sin plazo: «Reducir costes de inventario»
  • ✅ Con plazo: «Reducir costes de inventario un 15% antes del cierre del Q2 2026»

Ejemplo completo aplicando SMART:

Objetivo mal definido:
«Queremos usar ML para mejorar nuestro negocio»

Objetivo SMART:
«Reducir la tasa de abandono de carrito del 68% al 55% en los próximos 4 meses mediante un modelo de recomendación personalizada, generando un incremento estimado de €200K en ventas mensuales»

  • S: Reducir abandono de carrito con recomendaciones personalizadas
  • M: Del 68% al 55% (13 puntos porcentuales)
  • A: Basado en benchmarks del sector y pruebas piloto previas
  • R: Impacto directo en ingresos (€200K/mes)
  • T: 4 meses de plazo

Esta estructura te ayuda a validar si tu objetivo está bien construido antes de invertir recursos en el proyecto.

4. Métricas de éxito: técnicas vs. negocio

La métrica técnica debe servir a la métrica de negocio, nunca al revés. Un modelo con un AUC-ROC de 0.95 que no genera valor es un fracaso.

Métricas técnicas por tipo de problema:

Clasificación:

  • Accuracy: cuando las clases están balanceadas
  • Precision: cuando los falsos positivos son costosos
  • Recall: cuando los falsos negativos son críticos
  • F1-score: balance entre precision y recall
  • AUC-ROC: capacidad de discriminación general

Regresión:

  • MAE (Mean Absolute Error): errores en la misma escala que el target
  • RMSE (Root Mean Squared Error): penaliza errores grandes
  • MAPE (Mean Absolute Percentage Error): error relativo, útil para comparar

Métricas de negocio:

  • ROI del proyecto
  • Reducción de costes operativos
  • Incremento en ventas o retención
  • Ahorro de tiempo en procesos manuales

Regla de oro: Si tu modelo tiene un 98% de accuracy pero no reduce costes ni aumenta ingresos, has fallado en la definición del problema.

5. Restricciones y requisitos del mundo real

Un modelo no opera en el vacío. Debe cumplir restricciones que a menudo son más importantes que la métrica técnica.

Restricciones técnicas:

  • Latencia máxima: ¿cuánto tiempo puede tardar la predicción? (100ms, 1s, 1 hora)
  • Recursos computacionales: memoria, CPU, GPU disponibles
  • Frecuencia de actualización: ¿cada cuánto se reentrena el modelo?
  • Disponibilidad de datos: ¿qué features estarán disponibles en tiempo real?

Restricciones de negocio:

  • Interpretabilidad: ¿necesitas explicar cada decisión? (compliance, regulación)
  • Coste de implementación: presupuesto disponible
  • Riesgo aceptable: ¿cuál es el coste de un error?
  • Impacto en usuarios: experiencia del cliente

Restricciones legales:

  • Cumplimiento de GDPR y protección de datos
  • Manejo de datos sensibles (salud, finanzas)
  • Obligación de explicabilidad (derecho a explicación)

6. De la predicción a la acción

Un modelo sin acción asociada es solo un gráfico bonito. La predicción debe desencadenar una decisión o proceso concreto.

Ejemplos de acciones basadas en predicciones:

  • Si probabilidad de churn > 0.7 → enviar oferta personalizada al cliente
  • Si demanda prevista > stock actual → generar orden de compra automática
  • Si score de fraude > umbral → bloquear transacción y activar revisión manual
  • Si defecto detectado → retirar pieza de la línea de producción

La acción debe estar definida ANTES de entrenar el modelo, porque condiciona:

  • El umbral de decisión óptimo
  • El balance entre precision y recall
  • El coste de los errores (falsos positivos vs. falsos negativos)

7. Caso práctico completo

Veamos cómo se integran todos estos elementos en un proyecto real:

Problema:
Predecir qué clientes de una plataforma SaaS abandonarán el servicio en los próximos 30 días.

Variable objetivo:
Churn binario (1 = abandona, 0 = permanece)

Objetivo del proyecto:
Reducir la tasa de churn del 22% al 18% en 6 meses, incrementando el LTV promedio un 15%.

Métricas técnicas:

  • Recall ≥ 0.85 (capturar al menos el 85% de los churners reales)
  • AUC-ROC ≥ 0.90 (buena capacidad de discriminación)
  • Precision ≥ 0.60 (evitar saturar al equipo de retención)

Métrica de negocio:
Incrementar la tasa de retención mensual del 78% al 82%, generando €150K adicionales en ARR.

Restricciones:

  • Modelo interpretable (requisito del departamento legal)
  • Latencia < 100ms para scoring en tiempo real
  • Datos actualizados diariamente
  • Coste de campaña de retención: €15 por cliente

Acción:
Enviar campaña de retención personalizada a clientes con probabilidad > 0.7, con incentivo proporcional al valor del cliente.

Evaluación del impacto:
Si la campaña retiene al 30% de los clientes identificados, el ROI del proyecto es positivo a partir del mes 3.

Conclusión

Definir correctamente el problema es el paso más importante de todo el proceso de Machine Learning. Un problema claro, un target bien definido y objetivos alineados con el negocio son la base de cualquier solución que genere valor real.

Cuando esta fase se ejecuta correctamente, el resto del workflow fluye de forma natural: la exploración de datos tiene un propósito claro, la ingeniería de features se orienta al objetivo, la selección del modelo responde a restricciones concretas, y la evaluación mide lo que realmente importa.

Invertir tiempo en esta etapa no es opcional. Es la diferencia entre un proyecto de ML exitoso y un modelo que nunca llega a producción.


En el próximo artículo de la serie exploraremos la preparación y exploración de datos (EDA): cómo entender el dataset, detectar problemas de calidad, identificar patrones ocultos y construir la base para un modelo sólido.