Ficha Educativa

Significación estadística vs significación clínica: la diferencia crucial

Un hallazgo estadísticamente significativo puede carecer de valor clínico si el efecto es minúsculo. El impacto real importa más que los valores p a la hora de decidir si un tratamiento ayuda a los pacientes.

Evalúa9 min de lectura
Cómo se estructura esta entrada
Primero definiciones, luego mecanismos y finalmente “¿qué implica esto?”. Si tienes prisa, revisa rápidamente los encabezados y los recuadros destacados.
No es asesoramiento médico.
Contenido únicamente educativo. Si los síntomas son graves, persistentes o preocupantes, consulta con un profesional sanitario.

Por qué estadísticamente significativo ≠ clínicamente relevante

Imagina que una empresa farmacéutica publica un estudio que muestra que su probiótico reduce la proteína C reactiva (PCR) en 0,1 mg/L frente a placebo (p < 0,001). El titular dice «Probiótico antiinflamatorio revolucionario». Suena impresionante hasta que descubres que los especialistas en inflamación consideran clínicamente relevante una reducción de 5 mg/L.

Esta brecha —entre significación estadística y clínica— determina cómo interpretas la investigación. Los tamaños de muestra grandes son un arma de doble filo. Con 10 000 participantes puedes detectar efectos tan pequeños que no importan en la vida real. El efecto es real estadísticamente pero irrelevante clínicamente.

La diferencia mínima clínicamente importante (DMCI) cuantifica esta brecha. Representa el menor efecto que los pacientes percibirían como significativo. Para la gravedad de los síntomas del SII, la DMCI podría ser una reducción de 1 punto en una escala de 10. Para el colesterol, una reducción de 30 mg/dL puede importar; 1 mg/dL no, por muy pequeño que sea el valor p.

Consideremos un ensayo con estatinas: la pravastatina redujo los eventos coronarios graves del 6,5 % al 5,5 % en cinco años —una reducción absoluta del 1 % (estadísticamente significativa, clínicamente modesta). El número necesario a tratar era 100. En la prevención primaria de pacientes de bajo riesgo, los clínicos debatieron durante décadas si esto justificaba la medicación diaria.

Los criterios de valoración compuestos crean otro problema. A veces los investigadores combinan varios desenlaces (infarto, ictus, muerte, hospitalización) en una única medida de «éxito». Si un fármaco reduce los infartos un 0,1 % pero aumenta los ictus un 0,05 %, el compuesto parece positivo. Desagregar los componentes revela la imagen real. De forma similar, los resultados comunicados por los pacientes pueden mostrar significación en fatiga mientras el dolor empeora —el compuesto enmascara un intercambio perjudicial.

¿Cómo se determina la DMCI? Los diseñadores de ensayos clínicos preespecifican cada vez más umbrales de DMCI antes de iniciar los estudios. En estudios de microbioma, la investigación sobre DMCI va rezagada porque carecemos de datos de resultados a largo plazo. ¿Importa clínicamente un aumento del 20 % en Faecalibacterium prausnitzii? Todavía estamos aprendiendo.

El tamaño del efecto tiende un puente sobre la brecha. Una d de Cohen de 0,8 señala un gran impacto clínico; 0,2 sugiere efectos pequeños. Los estudios deberían informar del tamaño del efecto junto con los valores p. Las directrices de las revistas lo exigen cada vez más. La lista de verificación CONSORT (para ensayos aleatorizados) obliga a informar del tamaño del efecto, aunque el cumplimiento sigue siendo irregular.

Al evaluar la investigación, hazte tres preguntas: (1) ¿Es estadísticamente significativa? (2) ¿Cuál es el tamaño del efecto? (3) ¿Es el efecto clínicamente relevante para la población estudiada? Si falta alguna respuesta, tu información es incompleta.

Vota y ayúdanos a mejorar con tus comentarios

Fuentes & referencias

  1. Willigenburg NW et al. (2023) The difference between statistical significance and clinical relevance. The case of minimal important change, non-inferiority trials, and smallest worthwhile effect Injury PMID: 37923502
  2. Houle TT et al. (2008) Statistical significance versus clinical significance Seminars in Cardiothoracic and Vascular Anesthesia PMID: 18403377
  3. Godoy P et al. (2013) A critical evaluation of in vitro cell culture models for high-throughput drug screening and toxicity Journal of Internal Medicine PMID: 22252140
  4. Rennert K et al. (2015) Overview of in vitro cell culture technologies and pharmaco-toxicological applications Tissue Engineering Part B Reviews PMID: 20654357
  5. Viennois E et al. (2021) The gut microbiome of laboratory mice: considerations and best practices for translational research Mammalian Genome PMID: 33689000
Estándar Editorial
Every entry is grounded in peer-reviewed research and reviewed for accuracy. Cómo escribimos →