Por qué estadísticamente significativo ≠ clínicamente relevante
Imagina que una empresa farmacéutica publica un estudio que muestra que su probiótico reduce la proteína C reactiva (PCR) en 0,1 mg/L frente a placebo (p < 0,001). El titular dice «Probiótico antiinflamatorio revolucionario». Suena impresionante hasta que descubres que los especialistas en inflamación consideran clínicamente relevante una reducción de 5 mg/L.
Esta brecha —entre significación estadística y clínica— determina cómo interpretas la investigación. Los tamaños de muestra grandes son un arma de doble filo. Con 10 000 participantes puedes detectar efectos tan pequeños que no importan en la vida real. El efecto es real estadísticamente pero irrelevante clínicamente.
La diferencia mínima clínicamente importante (DMCI) cuantifica esta brecha. Representa el menor efecto que los pacientes percibirían como significativo. Para la gravedad de los síntomas del SII, la DMCI podría ser una reducción de 1 punto en una escala de 10. Para el colesterol, una reducción de 30 mg/dL puede importar; 1 mg/dL no, por muy pequeño que sea el valor p.
Consideremos un ensayo con estatinas: la pravastatina redujo los eventos coronarios graves del 6,5 % al 5,5 % en cinco años —una reducción absoluta del 1 % (estadísticamente significativa, clínicamente modesta). El número necesario a tratar era 100. En la prevención primaria de pacientes de bajo riesgo, los clínicos debatieron durante décadas si esto justificaba la medicación diaria.
Los criterios de valoración compuestos crean otro problema. A veces los investigadores combinan varios desenlaces (infarto, ictus, muerte, hospitalización) en una única medida de «éxito». Si un fármaco reduce los infartos un 0,1 % pero aumenta los ictus un 0,05 %, el compuesto parece positivo. Desagregar los componentes revela la imagen real. De forma similar, los resultados comunicados por los pacientes pueden mostrar significación en fatiga mientras el dolor empeora —el compuesto enmascara un intercambio perjudicial.
¿Cómo se determina la DMCI? Los diseñadores de ensayos clínicos preespecifican cada vez más umbrales de DMCI antes de iniciar los estudios. En estudios de microbioma, la investigación sobre DMCI va rezagada porque carecemos de datos de resultados a largo plazo. ¿Importa clínicamente un aumento del 20 % en Faecalibacterium prausnitzii? Todavía estamos aprendiendo.
El tamaño del efecto tiende un puente sobre la brecha. Una d de Cohen de 0,8 señala un gran impacto clínico; 0,2 sugiere efectos pequeños. Los estudios deberían informar del tamaño del efecto junto con los valores p. Las directrices de las revistas lo exigen cada vez más. La lista de verificación CONSORT (para ensayos aleatorizados) obliga a informar del tamaño del efecto, aunque el cumplimiento sigue siendo irregular.
Al evaluar la investigación, hazte tres preguntas: (1) ¿Es estadísticamente significativa? (2) ¿Cuál es el tamaño del efecto? (3) ¿Es el efecto clínicamente relevante para la población estudiada? Si falta alguna respuesta, tu información es incompleta.