Mi checklist de calidad de datos para catálogos: las preguntas que hago antes de tocar nada

Una guía práctica para evaluar la calidad de un catálogo antes de empezar a completarlo, corregirlo o enriquecerlo.

El error más común es completar sin entender bien cómo hacerlo

Cuando un catálogo tiene problemas, lo primero que suele pasar es esto: alguien empieza a completar datos. Agrega descripciones, corrige nombres, suma atributos. Y parece que eso ayuda. Pero en la mayoría de los casos, no.

Si no entendés el problema, lo más probable es que termines ordenando mal… o empeorando lo que ya estaba desordenado.

Completar no es mejorar. Mejorar empieza por entender.

Este artículo parte de esa idea: antes de tocar un dato, primero hay que mirar el sistema.

Un catálogo puede tener mucha información y, aun así, funcionar mal, porque la calidad no tiene que ver con cantidad, sino con cómo está construido el dato.

En términos simples, un dato de calidad es un dato que:

  • está completo,
  • es consistente,
  • se entiende,
  • se puede usar en distintos contextos.

Esto no es teórico. Es lo que determina si:

  • un producto se puede filtrar
  • una búsqueda devuelve resultados correctos
  • un canal acepta o rechaza la información

Un dato no vale por existir. Vale por poder usarse.

¿Por qué uso un checklist (y no empiezo a “arreglar”)?

Antes de cambiar algo, necesito entender qué estoy mirando. Por eso uso siempre el mismo enfoque: revisar, detectar patrones y recién después intervenir.

Me ayuda a evitar el error más común de empezar a resolver síntomas sin haber entendido la causa. Diagnosticar no es frenar el trabajo: es evitar hacerlo dos veces.

El checklist de calidad de datos

Estas son las preguntas que uso como base. No son complejas, pero sí son estructurales.

1. Completitud: ¿están los datos que realmente importan?

No se trata de si hay información, sino de si está la información correcta.

  • ¿Los atributos clave están completos?
  • ¿Hay campos críticos vacíos?
  • ¿Todos los productos tienen un nivel similar de detalle?

Un catálogo incompleto no falla de forma visible, pero limita todo lo demás:

  • filtros
  • comparaciones
  • publicación en canales

Lo que falta no siempre se nota… pero siempre impacta.

2. Consistencia: ¿los datos siguen una misma lógica?

Este es uno de los puntos más críticos.

  • ¿El mismo atributo se usa igual en todo el catálogo?
  • ¿Hay distintas formas de decir lo mismo?
  • ¿Se repiten valores con variaciones mínimas?

Cuando no hay consistencia, el catálogo deja de comportarse como sistema. Empieza a ser una suma de excepciones.

Cuando cada producto se carga distinto, el catálogo deja de ser confiable.

3. Estructura: ¿el dato está bien organizado?

Acá dejo de mirar el contenido y miro la forma.

  • ¿Cada atributo representa una sola cosa?
  • ¿Hay campos que mezclan información?
  • ¿Se usa texto libre donde debería haber opciones definidas?

Este punto es clave porque define si el dato se puede escalar. Si la estructura no es clara, el dato no se puede reutilizar. Un dato mal estructurado no se puede automatizar, ni filtrar, ni integrar.

4. Usabilidad: ¿estos datos sirven para el canal donde van a usarse?

Este es el filtro final.

  • ¿La información alcanza para un eCommerce?
  • ¿Cumple requisitos de marketplaces?
  • ¿Permite comparar productos?

Hoy hay algo más, los datos no solo tienen que servir para personas, sino también para sistemas que los interpretan. Si el dato no es claro, no se muestra. Y si no se muestra, no existe.

Lo que aparece en casi todos los catálogos

Cuando aplico este checklist, casi siempre encuentro lo mismo:

  • atributos duplicados
  • valores inconsistentes
  • campos clave vacíos
  • exceso de texto libre
  • estructuras que no escalan

No es un error puntual. Es el resultado de haber crecido sin reglas claras, el desorden no aparece de golpe: se construye sin que se note.

Qué hacer después del diagnóstico (sin intentar arreglar todo)

Detectar problemas no significa resolverlos todos al mismo tiempo. De hecho, intentar hacerlo suele empeorar las cosas.

Lo que mejor funciona es:

  • priorizar
  • ordenar por impacto
  • definir criterios antes de ejecutar

Primero se define cómo debería ser el dato. Después se corrige. El orden no empieza corrigiendo datos, empieza definiendo reglas.

Frenar antes de empezar no es una pérdida de tiempo. Es lo que hace que el trabajo tenga sentido. Un buen diagnóstico no solo muestra qué está mal: define por dónde empezar y qué vale la pena resolver primero. Porque en un catálogo, el problema no es cuánto dato falta, sino qué tan claro es el que ya existe. Y cuando eso se entiende, todo lo demás deja de ser un parche y empieza a ser una mejora real.

Foto del avatar

Analista PIM en CRITERIA Smart Cataloging. Proviene del mundo editorial y aplica esa mirada a la organización, estructuración y enriquecimiento de información de producto. Especializada en análisis de datos de catálogo y en hacer accesibles los procesos de gestión de producto para equipos no técnicos.