Diseños experimentales en Salud Pública: Principales características de los modelos, técnicas de análisis y casos
  1. Mercedes Esteban y Peña
    estebanpm at madrid dot es
    CMS Ciudad Lineal-Madrid Salud, Plaza de Agustin Gonzalez 1 28017, España
DOI
http://dx.doi.org/10.13070/rs.es.1.597
Date
2014-03-13
Cite as
Research es 2014;1:597
licencia
Resumen

Siendo los trabajos experimentales los modelos con mayor nivel de evidencia científica en el campo de la investigación. Es interesante la revisión en el ámbito de la epidemiologia y la salud pública de los diferentes modelos, su aplicabilidad, tipología y ejemplos, así como las medidas para el análisis más habitualmente empleadas. Partiendo del ensayo clínico aleatorio por tanto como modelo más completo, se revisan las diferentes formas de aleatorización, la selección de la población, las formas de analizar los datos- riesgo relativo (RR) o reducción relativa de riesgo (RRR)- entre otras. La medida de las variables de resultado y el seguimiento de la cohorte, con referencia a las guías CONSORT de uso internacional, tambien se desarrollan. Se ha empleado para la revisión: fuentes bibliográficas de salud como Pubmed, ScIELO, Cochrane así como fondos bibliográficos generales y de acceso en red genéricos como google o google scholar y blogs especializados o de expertos; para cumplimentar la revisión. Se plantean ejemplos prácticos de cada modelo. Se valoran las diferentes clasificaciones: según nivel de control, que los agrupa en ensayos clínicos aleatorios, en paralelo etc…. , grupales o comunitarios. Revisando cada uno de ellos: paralelos, cruzados, o de no control. Se desglosan las ventajas y limitaciones de este tipo de estudios.

English Abstract

A discussion of experimental design in public health research.

Introducción

Entendemos por estudios experimentales, aquellos en los que el investigador controla el factor de estudio, es decir quién recibe y quién no recibe la intervención. Como se controla el factor de estudio y las condiciones de la investigación, son considerados los estudios con mayor nivel de evidencia científica. El objetivo es evaluar el efecto de una acción, pudiendo ser tanto un medicamento como:

  • un consejo.
  • una actividad preventiva.
  • una estrategia de diagnóstico.
  • un modelo de organización como actividades de planificación y programación.

Puesto que pueden administrarse a sujetos para evaluar su beneficio, los puntos éticos son claves en este tipo de estudios y hay que considerarlos. Los estudios experimentales se clasifican según el nivel de control en (Cuadro 1).

A) Ensayos controlados.
  • Ensayo clínico aleatorio en paralelo (ECA)
  • Ensayos clínicos cruzados
  • Ensayos comunitarios
  • Ensayos de campo
B) Ensayos no controlados
  • Ensayos sin grupo control
  • Ensayos con control externo
Cuadro 1. Tipos de estudios experimentales

Con la óptica de si la intervención está destinada a disminuir la enfermedad (síntomas, recurrencia o muerte) o si actúan con la posibilidad de evitar una enfermedad se pueden clasificar en terapéuticos o preventivos. Según el enfoque esté en personas o en las comunidades, se agrupan como estudios individuales o comunitarios. Autores limitan a tres las categorías: ensayos clínicos, si actúan sobre los individuos con una enfermedad, ensayos de campo cuando ejercen sobre sujetos que no han adquirido la enfermedad y ensayos comunitarios, si la intervención se hace en comunidades, como es el caso de los estudios de fluoración de las aguas. Explicitaremos cada uno de los estudios experimentales y sus variantes según la clasificación del nivel de control.

Ensayo clínico aleatorio en paralelo o ECA

De los estudios experimentales el más relevante es el ensayo clínico aleatorio en paralelo, ya que es el que proporciona mayor evidencia en la relación causal entre la intervención y la respuesta observada. En su forma más sencilla son dos grupos, uno recibe tratamiento y otro no, usándose como control en el tiempo, observando y cuantificando los resultados. Ambos grupos son aleatorios.

Diseños experimentales en Salud Pública: Principales características de los modelos, técnicas de análisis y casos Figura 1
Figura 1. Estructura del ensayo clínico aleatorio paralelo

Se considera el mejor diseño disponible para valorar una intervención sanitaria. Son estudios prospectivos. Siempre hay un grupo de comparación y un grupo control, por tanto desde el punto de vista práctico es como un estudio de cohortes prospectivo en el que el investigador asigna la exposición.

Uno de los principios empleados en estos estudios es el denominado de incertidumbre, mediante el cual consideramos la intervención planteada sin saber cuál o cuáles de las opciones que se comparan en el ensayo resultaran mejores, peores o iguales entre sí.

La intervención con el grupo control es otro de los aspectos de interés de estos trabajos, admitiendo variaciones; puede emplearse placebo, tratamiento activo o ninguna intervención. En el caso del placebo las limitaciones éticas son claras, si la no utilización implica una amenaza vital, no debiéndose en este caso obviar el tratamiento. Los ensayos en Fase III de los medicamentos (cuando ya se prueban en las personas, con un grupo control) son modelos de diseños con no utilización de placebo.

Aleatorización o randomización

Es una característica básica de estos estudios, y una de sus fortalezas para medir la relación entre variables. Consiste en enviar a los participantes a los grupos de forma aleatoria o casual. Puesto que este punto es clave, también lo es que se haga con el máximo cuidado, de tal manera que la pertenencia a un grupo u otro no influya en las valoraciones. La aleatorización por tanto debe cumplir las siguientes características:

  • Que sea realmente al azar, no condicionada por época del año, edad….
  • Debe de ir con un plan previo, libre de interferencias por las partes interesadas, y con desconocimiento de la secuencia de aleatorización (OSA).

La aleatorización puede ser:

  • Simple: Se distribuye a los participantes a un grupo u otro según una tabla de números aleatorios.
  • Por bloques: Se hacen unidades y el primer grupo se hace aleatorio hasta llegar a la mitad, los restantes se pasan al segundo grupo, y así sucesivamente hasta completar los grupos .La finalidad es evitar que la mayoría de los sujetos vayan a una parte, cosa que puede ocurrir con números pequeños de participantes.
  • Estratificada. En este caso empleamos estratos de la variable predictora, por ejemplo por grupos edad. Se usa para garantizar que haya un equilibrio.
Aplicación de la intervención: Enmascaramiento o técnicas de ciego

El enmascaramiento es otro de los puntos fuertes del ensayo clínico aleatorio ya que favorece el desconocimiento al grupo de intervención al que se pertenece. Existen varias modalidades:

  • Simple ciego: el paciente desconoce el grupo al que pertenece.
  • Doble ciego: lo desconoce el paciente y los proveedores de tratamiento.
  • Triple ciego: además lo desconoce el que analiza los datos u otra persona que interviene en el ensayo, como quién suspende el tratamiento.
  • Con evaluador ciego: si no se pueden utilizar los métodos anteriores, si podemos hacer que la persona que va a medir la variable de respuesta desconozca el grupo en el que están los sujetos.

No siempre es posible utilizar los enmascaramientos, por ejemplo si hay tratamientos quirúrgicos, o si se precisan analíticas para el seguimiento. Por tanto el ciego tiene algunas limitaciones. También se rompe fácilmente en caso de existir efectos secundarios con la aplicación. Si no se utilizan técnicas de enmascaramiento el ensayo se denomina ensayo abierto. Si los individuos modifican su conducta por la influencia del grupo o del tratamiento que puedan estar recibiendo, se dice que ha habido contaminación en el estudio.

Selección de la población

Hay que elegir un grupo de personas con unos criterios de inclusión y exclusión, con unas características clínicas y sociodemográficas que maximicen la frecuencia de enfermedad y marcar un número de sujetos con los que haremos el estudio. La población sobre la que hacemos la exposición es la población experimental, de la que se extraen los sujetos que participaran en el ensayo, por ejemplo enfermos de cáncer. La población diana es aquella a la que se extrapolarán los resultados, por ejemplo Madrid. La población experimental puede seleccionarse tanto que aumente la validez interna del estudio pero quite validez externa, al mermarle representatividad frente a la población general. Lo contrario también ocurre es decir que los criterios sean amplios, por lo que las posibilidades de generalización sean buenas pero con menor validez interna, requiriendo más individuos para detectar la respuesta.

Consentimiento informado. Es un documento necesario en este tipo de estudio. Antes de incluirse debe firmarse este documento con una información en la que debe figurar: objetivo del estudio, las características básicas del diseño, los beneficios, los derechos de abandono, así como la posibilidad de aclarar cualquier duda, con una explicación en términos comprensibles. Este consentimiento puede ser origen de sesgos, ya que los individuos que firman pueden tener intereses y por tanto perfiles distintos a los que no los firman, por lo que habrá que tenerlo en cuenta en los análisis. Es sin embargo un requisito ético imprescindible.

Periodo de preinclusión o run in phase -Run-in period-: Con el objetivo de seleccionar los sujetos por cumplidores o quitar los que tienen efectos secundarios, algunos trabajos utilizan un periodo preinclusión. Esto aumenta la validez interna del estudio, pero disminuye la externa o de extrapolación de los resultados.

Diseños experimentales en Salud Pública: Principales características de los modelos, técnicas de análisis y casos Figura 2
Figura 2. Flujo de pacientes en un ensayo clínico aleatorio, propuesta CONSORT
Medida de las variables de resultado o de respuesta

Resulta importante que seleccionemos la variable que mejor mida los resultados de interés para los pacientes. Se pueden considerar en general tres modalidades de medición de variables:

  • Subrogadas: son medidas de laboratorio o signos físicos relacionados con el problema de estudio: tensión arterial en los problemas cardiovasculares, glucemia en la diabetes, factor reumatoide en la artritis reumatoide etc.
  • Clínicas: son fenómenos clínicos relacionados con el problema de estudio como: ictus en las enfermedades vasculares, comas en la diabetes, episodios de agudización (artritis) en la artritis reumatoide etc.
  • Variables relevantes para los pacientes. Aquí se incluyen las medidas de funcionalidad (escalas de dependencia)o de calidad de vida.
Seguimiento de las cohortes

Algunas de las medidas útiles destinadas a minimizar las pérdidas son recoger información de la filiación como DNI, médico de familia de pertenencia, datos de familiares próximos, fechas claves en las que recordarles su participación en el grupo como por ejemplo onomástica etc. El tiempo de duración del estudio marca la facilidad del seguimiento de la cohorte, siendo a menos tiempo más fácil que no haya pérdidas, igualmente influye la complejidad del protocolo, causándose bajas por efectos secundarios, desmotivación o cambio de opinión. Hay que reseñar que son los motivos del abandono los que causan los sesgos en el estudio y no las pérdidas desde el punto de vista cuantitativo como tales. El cambio de grupo tras la aleatorización no está permitido, aunque puede ser necesario excluir aquellas personas con efectos adversos graves. La declaración CONSORT (Consolidated Standarts of reporting trials) de 1996, recoge las bases para diseñar un ensayo clínico aleatorio y una guía de cómo representar el flujo de pacientes para apreciar cómo es el desarrollo del estudio.

Finalización anticipada

Hay que introducirlo en las normas del estudio y reseñar los criterios por lo que se toman estas decisiones. Estas pueden ser por:

  • Evidencia inequívoca de beneficio o perjuicio del tratamiento.
  • No demostración, ni probabilidad de que aparezcan beneficios.
  • Aparición de niveles muy altos de efectos secundarios.
  • Malos cumplimientos en los tratamientos.
  • No hay suficiente financiación.
  • El tratamiento se plantea obsoleto por los nuevos avances.
  • Otros ensayos demuestran beneficios o perjuicios con este tratamiento.
Análisis de los datos

El proceso se hace con técnicas similares a las cohortes, ya que son realmente una variedad de estas, si bien las pruebas de supervivencia tienen aquí mas cabida. El análisis es similar a cualquier estudio que compara dos grupos. Los análisis se supervivencia se basan en que los componentes del estudio pueden abandonar por diferentes razones, además del propio fallecimiento que puede tener o no que ver con el estudio, como es el caso del desconocimiento del caso, o de la finalización del estudio por diversas razones. Para ello se confeccionan curvas de supervivencia, bien con técnicas paramétricas como son: la distribución exponencial, la distribución de Weibull o la de Lognormal; o bien con pruebas no paramétricas, que son las más empleadas tales como: las de Kaplan-Meier, de Logrank y la regresión de Cox. Las medidas más frecuentemente empleadas para valorar la asociación en estos estudios son:

Riesgo Relativo (RR) o Razón de Riesgos.

Con ello conseguimos averiguar cuantas veces es más frecuente la incidencia de enfermedad entre los expuestos que entre los no expuestos al factor de estudio.

RR = Incidencia grupo de intervención / Incidencia grupo control . . RR = I control / I intervención

Si el Riesgo Relativo es significativo, se plantea la siguiente pregunta: ¿Cuál es el impacto de la aplicación de la intervención? .Para ello empleamos las siguientes medidas

Reducción Absoluta del Riesgo(RAR)

Es la diferencia en términos de riesgo entre el grupo control y el grupo de intervención:

RAR = I control - I intervención

Mide la cantidad de la incidencia en el grupo control que puede atribuirse a no haber sido asignado al grupo de intervención.

Reducción relativa del riesgo(RRR)

Se calcula como el cociente entre la diferencia entre el grupo control y el grupo de intervención (RAR) y la incidencia en el grupo control, multiplicado por 100:

RRR = (I control – I intervención) / I control X 100

Mide la proporción de la incidencia en el grupo control que puede atribuirse a no haber sido asignado al grupo intervención. Se interpreta también como la probabilidad que tiene el paciente de haber sufrido el evento dado que no estuvo en el grupo intervención

Número Necesario a Tratar (NNT).

Representa el número de pacientes que necesitan ser tratados en un período de tiempo específico para lograr un resultado favorable adicional, en relación al tratamiento de comparación (control). Se calcula como el inverso del RAR.

NNT = 1 / RAR

Su uso supone que la intervención es beneficiosa, y expresa de forma muy evidente los beneficios de utilizar un determinado tratamiento o actividad preventiva. Ejemplo. Se hace un ensayo clínico para ver los efectos del suplemento de Omega 3 en la aparición de demencia. En el grupo de intervención aparece en un 3% y en el grupo control en el 5%.(imaginario)

El RR será de 0.003/0.005=0.60= 60% o sea el suplemento con omega hace que el riesgo de demencia no sea un 60%, que sería sin suplemento. El RAR es de 0.05-0.03=0.02= 2%. De tomar a no tomar omega 3 el riesgo de demencia ha disminuido un 2%. En términos relativos de riesgo (RRR) = 0.05-0.03/0.05=0.04= 40%. O sea por el uso de omega 3 la demencia se ha disminuido un 40%. El NNT seria 1/0.02= 50. O sea si de cada 100 personas se han evitado dos demencias con el tratamiento, hay que tratar a 50 para evitar una demencia. En definitiva son formas diferentes de expresar los resultados.

Finalmente en el apartado de análisis de los datos tenemos varias opciones respecto a que parte de la muestra contabilizar. Esto plantea discusiones de cómo abordar las pérdidas por abandonos o por no adherencia al tratamiento. Existen varias opciones: una es considerar exclusivamente los sujetos que han cumplido con el protocolo, es lo que se denomina análisis de casos válidos o por protocolo, se incluyen los que han recibido la intervención, es decir se ponen en la comparación todos los individuos. Para mantener la comparabilidad sin embargo la mejor alternativa es analizar los grupos por la intención de tratar, independientemente si han cumplido o no con el protocolo, esta es la opción considerada como mas admitida en los ECA, es la opción denominada análisis por intención de tratar o según asignación aleatoria, según la intención inicial, independientemente de que tomaran el tratamiento, ya que considera que la distribución de los grupos por aleatoriedad mantiene mejor las condiciones para comparar. Esta es la estrategia considerada válida en un ensayo clínico, aunque es la opción más difícil para obtener resultados favorables a la nueva intervención.

Ejemplo de ECA

El efecto de la digoxina sobre la mortalidad y la morbilidad en pacientes con insuficiencia cardíaca [1].

Antecedentes: El papel de los glucósidos cardiacos en el tratamiento de pacientes con insuficiencia cardíaca crónica y el ritmo sinusal normal, sigue siendo controvertido. Se estudió el efecto de la digoxina sobre la mortalidad y la hospitalización en un estudio aleatorizado, doble ciego, ensayo clínico. Métodos: En el estudio principal, los pacientes con una fracción de eyección del ventrículo izquierdo de 0,45 o menos, fueron asignados al azar a digoxina (3.397 pacientes) o placebo (3.403 pacientes), además de los diuréticos y los inhibidores de la enzima convertidora de angiotensina (mediana de la dosis de digoxina, 0,25 mg por día, con un promedio de seguimiento, 37 meses). En un estudio complementario de los pacientes con fracciones de eyección superior al 0,45, 492 pacientes fueron asignados al azar a la digoxina y 496 con placebo. Resultados: En el análisis principal, la mortalidad no fue afectada. Hubo 1.181 muertes (34,8 por ciento) con digoxina y 1.194 muertes (35,1 por ciento) con placebo (cociente de riesgo cuando la digoxina se comparó con placebo, 0,99; intervalo de confianza 95 por ciento, 0,91 a 1,07, p = 0,80). En el grupo digoxina, hubo una tendencia hacia una disminución en el riesgo de muerte atribuida a la insuficiencia cardíaca (razón de riesgo 0,88; intervalo de confianza 95 por ciento, 0,77 a 1,01, p =0,06). Había 6 por ciento menos de hospitalizaciones en general en ese grupo que en el grupo placebo, y un menor número de pacientes fueron hospitalizados por empeoramiento de insuficiencia cardiaca (26,8 por ciento frente a 34,7 por ciento; razón de riesgo: 0,72, IC del 95 por ciento intervalo de confianza, 0,66 a 0,79, P <0,001. En el ensayo auxiliar, las conclusiones sobre el resultado primario combinado de muerte u hospitalización por empeoramiento de insuficiencia cardiaca fueron consistentes con los resultados de la prueba principal. Conclusiones: La digoxina no reduce la mortalidad global, pero redujo la tasa de hospitalización tanto en general como por empeoramiento de insuficiencia cardiaca. Estos hallazgos ayudan a definir con mayor precisión el papel de la digoxina en el tratamiento de la insuficiencia cardíaca crónica.

Ventajas y limitaciones (Cuadro 2)

Proporcionan la prueba más sólida causal entre dos variables.
Por la asignación aleatoria tiende a producir una distribución equilibrada, formando grupos comparables.
En general son largos y costosos.
Algunos pueden tener problemas éticos o de viabilidad.
Los participantes pueden estar excesivamente seleccionados y resulta difícil la generalización o extrapolación.
Las pautas de intervención pueden ser rígidas, diferentes de las de la práctica habitual.
En general sólo permiten evaluar el efecto de una intervención.
Cuadro 2. Ventajas y limitaciones.

Proporcionan la prueba más sólida causal entre dos variables.

El ECA en paralelo es el prototipo de estudio experimental, para el campo de la comparación de intervenciones terapéuticas; sin embargo existen variaciones para estudios preventivos o pruebas diagnosticas, que merece la pena conocer.

Variantes de los ensayos clínicos aleatorios
ECA para medidas preventivas o pruebas de campo (Field Trial) o ensayos de campo

Algunos autores, como Bradford Hill, los incluyen como una variante de los ensayos clínicos, otros no, figurando como grupo aparte.

Las peculiaridades que presentan tienen que ver con que los individuos suelen ser sanos, por lo que el tiempo de desarrollo del fenómeno es más largo y se requieren más individuos en la muestra. En este sentido son estudios más complejos. Otra particularidad es que la recolección de la información se hace en la comunidad, en el campo, no en instituciones. Son ejemplos de estos estudios, los realizados con la efectividad para la vacuna de Salk de la poliomielitis, o las pruebas de efectividad de la vacuna antitífica oral.

Tienen un sesgo en la participación, al ser los individuos más sanos los que habitualmente entran en estos estudios. La elección al azar se brinda como la mejor manera de hacer la selección.

Otra de las limitaciones es la que corresponde al adelanto en el diagnostico, pues se hace antes que habitualmente se haría con la historia natural del proceso; también en la duración de la enfermedad, es mas probable que detectemos casos de progresión más lenta, que quizás sean menos graves y con mejor pronóstico. Hay que tenerlo en cuenta para evitar sobreestimar los beneficios.

Ejemplo: Ensayo de campo con vacuna Salk: En abril de 1954 se administraron vacunas en escolares de 2ª grado actuando los de 1º y 3ºcomo controles: Se compararon los casos aparecidos en uno y otro grupo. Este plan fué seguido en 127 áreas de 33 estados, con un total de 1.080.680 alumnos participantes. Además de Estados Unidos, con 217 áreas cubiertas en 44 estados, participaron distritos sanitarios de Canadá y Finlandia. El comité para probar la vacuna de Salk dijo, según O'Neill que fué "el programa más elaborado de su tipo en la historia, con veinte mil médicos y agentes de la salud pública, sesenta y cuatro mil académicos y veinte mil voluntarios".

ECA para evaluación de la eficacia de una prueba diagnóstica

Estos estudios admiten varias maneras, una de ellas es diseñando un ECA, como si la prueba fuera una intervención sanitaria, con asignación aleatoria. A un grupo se le aplica la prueba y el otro sirve de de comparación.

La otra forma de plantear la evaluación de la eficacia de las pruebas diagnosticas es con un estudio descriptivo, en aquellas personas en las que se ha hecho la prueba.

Ejemplo. Evaluación de ultra baja dosis CT en el diagnóstico de las fracturas pediátricas similares utilizando un estudio experimental animal [2].

Objetivo: El objetivo de este estudio prospectivo fue evaluar el empleo de ultra baja dosis CT para el diagnóstico de las fracturas pediátricas similares y determinar el nivel de dosis más bajo necesario para el diagnóstico. Materiales y métodos: Cincuenta y un huesos de cadáveres de cerdos jóvenes fueron fracturadas artificialmente y se examinaron usando un multi- detector CT 64 con 36 diversos niveles de dosis hasta una dosis comparable con la de los rayos X con posterioridad. Dos radiólogos pediátricos analizaron las tomografías computarizadas de acuerdo a la presencia o ausencia de una fractura, la determinación del tipo de fractura y el desplazamiento, así como la certeza de diagnóstico. Para cada protocolo de dosis, se calculó una tasa de éxito para la determinación correcta de los análisis CT antes mencionados. Una tasa de éxito de al menos el 95 % se consideró suficiente para el diagnóstico. Resultados: Todos, pero los niveles de dosis más bajas fueron suficientes para identificar la fractura. Sólo los dos niveles de dosis más bajas fueron suficientes para detectar el tipo de fractura. Todos los niveles de dosis eran adecuadas para la identificación del desplazamiento. El nivel de dosis más bajo suficiente para el diagnóstico era 120 kVp, 11 mAs , y el paso 1.5 , con un CTDI vol de 10 % de una dosis estándar y una dosis eficaz tres veces tan grande como la de los rayos X . Conclusión: La dosis ultrabaja CT ofrece la posibilidad de una reducción de la dosis significativa, sigue permitiendo diagnósticos suficientes de fracturas pediátricas similares.

ECA para estudios de equivalencia o ensayos de no inferioridad

Son estudios diseñados para mostrar la similar efectividad de dos tratamientos o la superioridad/inferioridad de los mismos. Ejemplos son los llamados estudios de bioequivalencia, que corresponden a ensayos fase I realizados por la industria farmacéutica. Otro uso es la comparación de la eficacia de dos intervenciones.

Deben ser especialmente rigurosos porque pretenden comparar dos grupos. Para ello se marca la diferencia entre ambos tratamientos con un rango, es lo que se denomina valor delta. De esta forma si la comparación cae dentro del rango diremos que son equivalentes, si cae fuera no.

Si queremos ver si los profesionales que aplican un protocolo para dejar de fumar obtienen resultados equivalentes, podemos hacerlo con este enfoque. En definitiva estos estudios lo que plantean es si los resultados están dentro de los intervalos de confianza, intervalo delta. Otras veces lo que se plantea es que no sea inferior por eso la denominación también de estudios de no inferioridad. El diseño puede ser el mismo, pero planteando como pregunta que no esté por debajo del intervalo.

Estos estudios son muy duros en cuanto a las medidas de las condiciones del estudio, que deben ser idénticas.

Ejemplo.. La evidencia de ensayos aleatorios de pravastatina, simvastatina y atorvastatina para la prevención de enfermedades cardiovasculares. ¿Son las estatinas iguales [3] ?

Antecedentes: La eficacia relativa de las diferentes estatinas para la prevención cardiovascular a largo plazo sigue siendo en gran medida sin determinar. Métodos: Usando comparación indirecta ajustada, se compararon 3 estatinas (pravastatina, simvastatina y atorvastatina) sobre la base de ensayos aleatorios controlados con placebo publicados para la prevención cardiovascular a largo plazo. Se realizó una búsqueda sistemática de la literatura entre 1980 y 2004. Ensayos controlados con placebo aleatorios de las 3 las estatinas, que estudian las enfermedades cardiovasculares o la muerte como el resultado, inscrito ≥ 1000 participantes, y tenía ≥ 1 año de seguimiento, fueron incluidos. Los ensayos se agruparon según la estatina en estudio. Un riesgo relativo (RR) fue derivado de cada serie de ensayos utilizando un modelo de efectos aleatorios. Comparaciones indirectas ajustadas utilizando los RR agrupados se realizaron entre las estatinas con respecto a los resultados clínicos preespecificados. Resultados: Ocho ensayos controlados con placebo cumplieron con los criterios de inclusión, con 4 ensayos pravastatina (n=25.572), 2 ensayos de simvastatina (n=24.980), y 2 ensayos atorvastatina (n=13.143). Todos los ensayos tenían un grado similar de reducción de lípidos. Evaluaciones de gráficos y estadísticos mostraron una heterogeneidad mínima en los tamaños del efecto de los ensayos. Comparaciones indirectas ajustadas no revelaron una diferencia estadísticamente significativa entre las estatinas en la reducción de la enfermedad coronaria fatal e infartos de miocardio no fatales (simvastatina vs pravastatina: RR 0,93 (IC del 95%: 0,84 a 1,03); atorvastatina vs simvastatina: RR 0,84 (IC del 95 % 0.66 - 1,08); atorvastatina vs pravastatina: RR 0,79 (IC del 95%: 0,61 a 1,02). No hemos podido detectar diferencias ni en los resultados para los accidentes cerebrovasculares fatales y no fatales, todas las muertes cardiovasculares y todas las causas de mortalidad. Conclusión: La evidencia de ensayos aleatorios controlados con placebo de estatinas publicados sugiere que la pravastatina, simvastatina y atorvastatina, cuando se usa a las dosis estándard, muestran una diferencia estadísticamente significativa en su efecto sobre la prevención cardiovascular a largo plazo.

ECA secuencial

Se trata de estudios en los que tanto la muestra como el final del estudio están condicionados a que los resultados obtenidos sean concluyentes. Se marca un número de casos con suficiente potencia estadística como para obtener resultados adecuados. El tamaño de la muestra no está predeterminado, sino que depende de las observaciones que se realicen. En estos estudios es importante determinar la regla con la cual el estudio se termina o “stopping rule”. Los resultados de estos trabajos deben de obtenerse relativamente pronto para ser de utilidad. Ejemplo es el estudio de Allard et all. 1999. con el empleo de dosis suplementarias de opioides en pacientes oncológicos terminales, 15 parejas con el 25 o con 50% de dosis. Se midió intensidad de disnea y la frecuencia respiratoria durante 4 horas.

Ejemplo. Efectos de la reducción intensiva de la glucosa en la diabetes tipo 2. En este estudio aleatorizado, 10.251 pacientes (edad media 62,2 años) con un nivel de hemoglobina glucosilada media del 8,1% fueron asignados a recibir tratamiento intensivo (dirigida a un nivel de hemoglobina glicosilada por debajo del 6,0%) o la terapia estándar (dirigida a un nivel de 7,0 a 7,9 %). De estos pacientes, el 38% eran mujeres y el 35% había tenido un evento cardiovascular previo. El resultado primario fue una combinación de infarto de miocardio no fatal, accidente cerebrovascular no fatal o muerte por causas cardiovasculares. El hallazgo de una mayor mortalidad en el grupo de terapia intensiva condujo a una interrupción de la terapia intensiva después de una media de 3,5 años de seguimiento. Resultados: En un año, la estabilidad de los niveles medios de hemoglobina glicosilada de 6,4% y 7,5% se lograron en el grupo de tratamiento intensivo y el grupo de terapia estándar, respectivamente. Durante el seguimiento, el resultado primario ocurrió en 352 pacientes en el grupo de tratamiento intensivo, en comparación con 371 en el grupo de terapia estándar (hazard ratio, 0,90; 95% intervalo de confianza IC 95%: 0,78 a 1,04, p = 0,16). Al mismo tiempo, 257 pacientes en el grupo de tratamiento intensivo de morir, en comparación con 203 pacientes en el grupo de terapia estándar (razón de riesgo 1,22, IC 95%, 1,01 a 1,46, p = 0,04). La hipoglucemia que requiere la ayuda y el aumento de peso de más de 10 kg fueron más frecuentes en el grupo de tratamiento intensivo (p <0,001). Conclusiones: En comparación con la terapia estándar, el uso de terapia intensiva para dirigirse a los niveles normales de hemoglobina glicosilada durante 3,5 años aumenta la mortalidad y no reduce significativamente los eventos cardiovasculares mayores. Estos hallazgos identifican un daño antes no reconocido de la reducción intensiva de la glucosa en pacientes de alto riesgo con diabetes tipo 2.

ECA factorial

Permite evaluar dos o más intervenciones. Un grupo recibe un tratamiento A el otro el B el otro el A y B y el otro ninguno. Es importante considerar que no haya interferencias en los tratamientos.

Ejemplo de un ensayo factorial, donde cada paciente es aleatorizado dos veces para recibir dos tratamientos en el mismo ensayo;* esto es, bajo el supuesto de que no hay interacción, dos experimentos pueden ser conducidos en uno. Se trata de la evaluación de una intervención para prevenir paludismo y anemia, con quimioprofilaxis de deltaprim y hierro, respectivamente. Los autores establecieron con estos resultados que la quimioprofilaxis de malaria durante el primer año de vida es efectiva en la prevención de paludismo y anemia, y que la suplementación con hierro es efectiva para prevenir anemia severa sin incrementar la susceptibilidad a malaria.

Estudio controlado aleatorio con placebo de suplementos de hierro y la quimioprofilaxis de la malaria para la prevención de la anemia severa y la malaria en los niños de Tanzania [4].

La malaria y la anemia, especialmente debido a la deficiencia de hierro, son dos de las principales causas de morbilidad en todo el mundo. Poco se sabe acerca de la contribución relativa de la infección por plasmodium falciparum y la deficiencia de hierro a la etiología de la anemia en las zonas donde la malaria es endémica. Se realizó una comparación aleatoria de diferentes estrategias para el control de la anemia y la malaria en los lactantes, incluida una evaluación de los efectos de la suplementación con hierro en la susceptibilidad de la malaria. Métodos. 832 niños nacidos en un hospital en un área donde el paludismo hiperendémico de Tanzania, entre enero y octubre de 1995, se asignaron al azar al grupo de DI, que recibieron hierro oral diaria ( 2 mg/kg al día ) más Deltaprim semanal ( 3.125 mg pirimetamina más 25 mg de dapsona ), grupo IP, que recibieron hierro más placebo semanal; grupo DP, que recibieron placebo al día más Deltaprim semanal, o grupo PP, que recibieron placebo al día más placebo semanal. La suplementación diaria fue dado de 8 a 24 semanas de edad, y la quimioprofilaxis semanal 8-48 semanas. La frecuencia de anemia grave (hematocrito < 25 %) y los episodios de malaria se evaluó a través de una combinación de detección pasiva de casos y estudios transversales . Hallazgos. Los grupos que recibieron suplementos de hierro tenían una menor frecuencia de anemia severa que las que no recibieron hierro (0,62 vs 0,87 casos por persona - año; eficacia protectora IC del 28,8 % (IC 95% 6.3 -45 .8). Los suplementos de hierro no tuvo ningún efecto sobre la frecuencia de la malaria (0,87 vs 1,00 casos por persona - año; eficacia protectora 12,8 % (12, 8-32,5)) . Los grupos que recibieron la profilaxis del paludismo tenían frecuencias más bajas de ambos severa anemia (0,45 vs 1,04 episodios por persona y año; eficacia protectora 57,3 % (43,0 -67,9)) y la malaria (0,53 vs 1,34 episodios por persona - año, la eficacia protectora de 60,5% (48,2-69,9)) que los grupos que no recibieron profilaxis. Después del final del período de intervención, los niños que habían recibido quimioprofilaxis del paludismo tenían tasas más altas de anemia severa y la malaria que los grupos no quimioprofilaxis (riesgos relativos de 2,2 (1,3-3,7) y 1.8 (1.3-2,6). Interpretación Quimioprofilaxis de la malaria durante el primer año de vida fue eficaz en la prevención de la malaria y la anemia, pero al parecer sin deterioro del desarrollo de la inmunidad natural. Los suplementos de hierro fueron eficaces en la prevención de la anemia severa, sin aumentar la susceptibilidad a la malaria. Nuestros hallazgos apoyan la suplementación con hierro de los recién nacidos para prevenir la anemia por deficiencia de hierro, incluso en zonas donde la malaria es endémica.

Desarrollo clínico de medicamentos. EC con medicamentos

Son una variedad de estudios experimentales, complejos y con varias etapas. Están destinados a permitir el uso de fármacos en humanos, determinando la pauta, la eficacia, la seguridad y la naturaleza de los efectos adversos. Constan de una Fase I: que tiene como objetivo determinar la seguridad, posología y farmacocinética; generalmente se hacen en voluntarios sanos. Fase II: su objetivo es conocer fundamentalmente la dosis a emplear, suelen hacerse en grupos de pacientes enfermos, muy reducidos y homogéneos. Fase III: se evalúa eficacia y seguridad en condiciones de uso habitual, se hace en grupos más numerosos de pacientes con enfermedad claramente definida. Fase IV: se hacen cuando el fármaco ya está comercializado, para ampliar el conocimiento, tanto de su eficacia como de los efectos secundarios.

Ensayos clínicos cruzados

Cuando se quiere hacer un estudio con dos tratamientos diferentes se pueden aplicar en los mismos sujetos, disminuyendo así la variabilidad. Empleamos un periodo intermedio denominado de lavado para eliminar los restos de los efectos. Hay pocas ocasiones de utilizarlos porque los tratamientos suelen necesitar largos periodos para ver los efectos. Son útiles y se suelen emplear si se quiere probar por ejemplo dos broncodilatadores.

El tiempo denominado de blanqueo debe de ser corto, para no dilatar el tiempo de estudio. Una de las ventajas frente a los estudios en paralelo es que requiere menos participantes y cada participante es su propio control.

Como desventajas está el no poderse usar en enfermedades agudas o que cursan con brotes. Duran más que los estudios en paralelo y no se pueden emplear cuando no está garantizada la desaparición del efecto si el orden de administración puede alterar el resultado.

Un sesgo de estos estudios es el producido por el llamado -efecto periodo- ya que en el intervalo de la administración de los diferentes tratamientos la enfermedad puede variar, por lo que los cambios son por la propia evolución de la enfermedad o por la administración del tratamiento.

La principal ventaja es su eficiencia y las desventajas mas reseñables son las perdidas, que tienen mucha mayor repercusión al contar con menor número de casos y contabilizarse por dos.

Ejemplo. Bupivacaína al 0,5% en comparación con articaína al 4% para la extracción de terceros molares inferiores. Un ensayo aleatorizado controlado cruzado. Objetivo: comparar la acción anestésica de bupivacaína a 0,5% en relación con articaína al 4%, ambas con epinefrina 1:200.000, en la extracción quirúrgica del tercer molar inferior. Como objetivos secundarios los cambios hemodinámicos utilizando ambos anestésicos fueron analizados. Diseño del estudio: Doble ciego, cruzado ensayo clínico aleatorizado. Dieciocho pacientes fueron sometidos a la extirpación bilateral de los molares inferiores terceros con bupivacaína al 0,5% o articaína al 4% en dos citas diferentes. Las variables pre, intra y postoperatorios se registraron. Las diferencias fueron evaluadas con pruebas de McNemar y repetir las pruebas de ANOVA de medidas. Resultados: Ambas soluciones exhiben el mismo tiempo de latencia y la eficacia intraoperatoria. Estadísticos significativos niveles más bajos de dolor se observaron con bupivacaína entre el quinto (p = 0,011) y el noveno (p = 0,007) horas del postoperatorio. Bupivacaína siempre significativamente más larga duración de anestesia de tejidos blandos (p <0,5). La presión arterial sistólica y de frecuencia cardíaca fueron significativamente mayores con articaína. Conclusiones: La bupivacaína puede ser una alternativa válida a la articaína en especial debido a su temprana capacidad de prevención del dolor post-operatorio.

Ensayos comunitarios o de intervención o ensayos comunitarios de intervención o estudios “quasi experimentales”

Son estudios cuya característica fundamental es que la intervención se hace a nivel grupal, no a nivel individual. Se denominan “quasi experimentales” porque no siempre existe aleatorización, hay cierta manipulación. Unas comunidades reciben intervención y otras sirven de control.

Con un diseño cuidadoso y un seguimiento controlado pueden proporcionar evidencias muy fuertes, que nos permitirán emitir juicios causales. La principal ventaja es su capacidad de generalización, su validez externa.

Ejemplo de estos estudios son los realizados con las recomendaciones de estilos de vida utilizando medios de comunicación o con intervenciones comunitarias como son los efectos de la fluoración del agua….Es el caso del Minesotha Health Program, donde se estudiaron tres parejas de comunidades, con grupo de estudio y control que, se diseñó para valorar la prevención de la hipertensión arterial, la promoción de hábitos saludables, la prevención del tabaquismo y el fomento del ejercicio físico, con múltiples estrategias educativas.

El proyecto de prevención de quemaduras de Massachussets (MacKay y Rothman1982), el Proyecto de las "Siete Ciudades" de la Universidad de Stanford, "A su salud" de la Universidad de Texas, y el Proyecto de North Karelia, en Finlandia (Pushka P 1972), son otros ejemplos.

No suele haber asignación aleatoria porque las comunidades se deben de elegir a conveniencia de los investigadores o de las autoridades, según accesibilidad o condiciones de salud, esto es lo que les da el apellido de “quasi experimentales”…..Es el diseño mas adecuado para evaluar gestión y organización de la atención medica. Los diseños suelen ser complejos, así como el análisis de los datos. La declaración CONSORT (Consolidated Standarts of reporting trials) de 1996 amplió la declaración, para hacer referencia a estos estudios y dar detalle de lo que debe de tener un ensayo comunitario en cada uno de sus apartados para ser publicado. Además de este diseño, los estudios comunitarios pueden utilizar otros, de los ya conocidos en epidemiologia. Con las limitaciones para la aleatorización, y siendo necesario vehiculizarlos nos referiremos a una cita de Bradford Hill

  • Todo trabajo científico es incompleto ya sea observacional o experimental.
  • Todo trabajo científico puede mejorarlo o modificarlo el avance del conocimiento.
  • Esto no nos confiere la libertad de ignorar el conocimiento que ya tenemos, ni de posponer la acción que parece demandar en un momento dado.

Con esta cita damos paso a los estudios de resultados o investigación de resultados, es el caso de la realización de tasas de mortalidad o la elaboración de medidas de funcionalidad, de calidad de vida o de autopercepción de salud, que cubrirían la expectativa de una parte de la elaboración de la información necesaria. Un ejemplo es cuando se hace una intervención comunitaria sobre la conveniencia de la realización de ejercicio físico y elaboramos medidas de calidad de vida a posteriori de la intervención para su valoración.

Diseños antes después o controles históricos, son asimismo utilizables en los estudios comunitarios. Algunas limitaciones van en el sentido que antes podamos disponer de la misma calidad de indicadores que después, pero sí son el único diseño posible, no son por ello son descartables. Ejemplo de este tipo de diseños es el empleado para valorar la influencia sobre el pago o cobro en la calidad asistencial del programa –Medicare- de Estados Unidos, comparándose datos antes de instalarse el pago en 1981-1982, con datos después de instalarse en 1985-1986.

Otra alternativa de salvar la aleatorización, es estudiar además de expuestos no expuestos, en los estudios comunitarios hacer un diseño de casos controles con programa no programa, el problema en estos es definir la exposición.

Podemos asimismo simultanear sin aleatorización, usuarios no usuarios, con el sesgo del uso de los usuarios en este caso.

Igualmente podemos comparar simultáneamente poblaciones en las que se ha actuado con las que no, de esta forma evitamos los sesgos anteriores, teniendo en cuenta la homogeneidad de las poblaciones para evitar sesgos socioeconómicos, por ejemplo. Por último podríamos emplear diseños combinados antes-después y usuarios-no usuarios. El estudio de la reducción de fiebre reumática en niños de Baltimore según un programa de tratamiento de la infección clínica faringoamigdalar, es un ejemplo.

Ejemplo. Estudio de Karelia del Norte años '70 ante el pedido de ayuda del gobierno para reducir la mortalidad por enfermedad coronaria excepcionalmente elevada en el este de Finlandia En un período de 20 años, entre la población masculina de Karelia del Norte, el hábito tabáquico se ha reducido ampliamente y los hábitos dietarios han cambiado notablemente. Los cambios dietarios han llevado a cerca de un 15% de reducción en el nivel medio de colesterol sérico en la población. Ha aumentado la actividad física en el tiempo libre. El índice anual de mortalidad por infarto coronario en la población masculina de mediana edad (65 años) en Karelia del Norte se ha reducido más del 50 %. El Proyecto Karelia del Norte demuestra que un programa comunitario bien planeado, decidido e integrado puede tener un impacto substancial en los estilos de vida y factores de riesgo y tal desarrollo conduce a índices reducidos de enfermedades en la comunidad.

Ensayos controlados no aleatorios

En este caso el grupo de sujetos asignados a estudio no se hace de forma aleatoria, existe igualmente un grupo control, pero los sujetos de estudio se asignan por fecha de nacimiento, número de historia etc. Por este motivo la distribución de los grupos es más desequilibrada y pueden no ser totalmente comparables. Se consideran que tienen menor calidad metodológica que los ECA.

Ensayos no controlados

No existe grupo control. La forma con la que comparan los efectos es con la situación inicial, por lo que también se denominan antes-después. A veces estos son difíciles de separar de las series descriptivas, todo depende de si el factor de estudio se controla o no. Al no existir grupo de control es más difícil cerciorar si la intervención se debe al factor de estudio o a otros factores no controlados, por tanto no son útiles para evaluar una eficacia de intervención, mas bien su función es descriptiva.

En algunos casos estos estudios son los mas justificados, como la Fase I de los ensayos clínicos con el uso de medicamentos potencialmente muy tóxicos, empleados en enfermedades muy graves.

Ensayo clínico con control externo

Las personas tratadas se comparan con un grupo de pacientes que reciben otro tratamiento o que han sido tratados con anterioridad. Normalmente son estudios prospectivos. No son grupos que se puedan ni aleatorizar ni enmascarar por lo que están sometidos a sesgos de observador, del paciente o del estadístico. Aquí se incluyen los estudios antes después, cuando una situación basal se considera punto de partida. Se utilizan por ejemplo en caso de intervenciones como anestesia, cardioversiones o intervenciones de cataratas

Referencias
  1. Mauricio Hernández Ávila Epidemiología: diseño y análisis de estudios. 2009. Panamericana.
  2. Marion K. Campbell MK, Diana R Elbourne y Douglas G. Altman. Ensayos clínicos aleatorizados comunitarios (CONSORT CLUSTER). Med Clin . 2005. 125;28-31.
  3. Leon Gordis Epidemiología -Elservier 2009.
  4. Kenneth J. Rothman. Epidemiología moderna. Diaz de Santos. 1987.
  5. Pita Fernández S, Análisis de supervivencia. Disponible en. Disponible en: www.fisterra.com/mbe/investiga/supervivencia/supervivencia.asp
  6. Pita Fernández S. Tipos de estudios clínico epidemiologicos Fisterra. com. Disponible en. Disponible en: www.fisterra.com/mbe/investiga/6tipos_estudios/6tipos_estudios.asp
  7. Ruiz de Adana R. Metodología de la investigación. Disponible en. Disponible en: ricardoruizdeadana.blogspot.com.es/2011/01/unidad-iii-medidas-de-asociacion-en.htmlaccedido
  8. Marcelo M. Gómez Introducción a la metodología de la investigación científica Ed. Brujas Argentina. 2006.
  9. Balluerka Lasa N, Vergara Iraeta A.I. Diseños de investigación experimental en psicología: modelos. Pearson educación España 2002.
  10. Staffan Novell. Diseño de estudios epidemiológicos. Ed. Siglo XXI. Madrid 1994.
  11. The effect of digoxin on mortality and morbidity in patients with heart failure. N Engl J Med. 1997;336:525-33 pubmed
  12. Tuells J; Arístegui J. Vacuna Salk de polio: El ensayo de campo de Thomas Francis Jr. y el incidente Cutter. Vacunas, 2006. 7; 136-9.
  13. Moritz J, Hoffmann B, Sehr D, Keil K, Eggerking J, Groth G, et al. Evaluation of ultra-low dose CT in the diagnosis of pediatric-like fractures using an experimental animal study. Korean J Radiol. 2012;13:165-73 pubmed publisher
  14. Zhou Z, Rahme E, Pilote L. Are statins created equal? Evidence from randomized trials of pravastatin, simvastatin, and atorvastatin for cardiovascular disease prevention. Am Heart J. 2006;151:273-81 pubmed
  15. Tato Herrero, F, Figueiras Guzmán, A, Rodríguez Moreno, C. Bases Metodológicas del ensayo clínico. Universidad de Santiago de Compostela, 1998.
  16. John Whitehead. The Design and Analysis of Sequential Clinical Trials. Wiley & Sons. England. 1997.
  17. Hemmingsen B, Lund S, Gluud C, Vaag A, Almdal T, Hemmingsen C, et al. Intensive glycaemic control for patients with type 2 diabetes: systematic review with meta-analysis and trial sequential analysis of randomised clinical trials. BMJ. 2011;343:d6898 pubmed publisher.
  18. Gerstein H, Miller M, Byington R, Goff D, Bigger J, Buse J, et al. Effects of intensive glucose lowering in type 2 diabetes. N Engl J Med. 2008;358:2545-59 pubmed publisher.
  19. Menendez C, Kahigwa E, Hirt R, Vounatsou P, Aponte J, Font F, et al. Randomised placebo-controlled trial of iron supplementation and malaria chemoprophylaxis for prevention of severe anaemia and malaria in Tanzanian infants. Lancet. 1997;350:844-50 pubmed
  20. Sancho-Puchades M, Vilchez-Perez M, Valmaseda-Castellón E, Paredes-Garcia J, Berini-Aytés L, Gay-Escoda C. Bupivacaine 0.5% versus articaine 4% for the removal of lower third molars. A crossover randomized controlled trial. Med Oral Patol Oral Cir Bucal. 2012;17:e462-8 pubmed.
  21. Bermejo Fraile.B Estudios experimentales Matronas Prof. 2008.9;15-20.
  22. Lazcano-Ponce E, Salazar-Martínez E, P Gutiérrez-Castrellón P, -Llerenas A, Hernández-Garduño A, Viramontes JL, Ensayos clínicos aleatorizados: variantes, métodos de aleatorización, análisis, consideraciones éticas y regulación. Salud pública de México. 2004. 46; 6.
ISSN : 2334-1009