martes, 21 de junio de 2011

Tamaño mínimo para un experimento aleatorizado

En estadística hay dos tipos de error denominados Tipo I y Tipo II. El error Tipo I es cuando siendo que la hipótesis nula (H0) es cierta, se rechaza. El error Tipo II es cuando siendo falsa la hipótesis nula, se acepta. Si la hipótesis nula es que el cambio en el promedio de un grupo en tratamiento es igual al cambio acaecido en un grupo de control, la probabilidad de aceptar lo falso se representa mediante el símbolo β. Entonces la probabilidad de rechazar la hipótesis nula correctamente es el complemento: (1 – β). Dicho valor se denomina poder estadístico.


Estado real del fenómeno observado
H0: Trat=control
H1: Trat<>control
Decisión respecto a H0 basada en los datos
Aceptación
Correcta
(1 – α)
Error Tipo II
β
Rechazo
 Error Tipo I
α
Correcto
(1 – β)

A mayor sea la diferencia entre las medias, mayor el poder estadístico, ya que es más fácil detectar dicha diferencia acertadamente. A más grande el número de observaciones, mayor el poder estadístico. A mayor variabilidad en las observaciones, menor el poder estadístico, ya que en medio de tanta variación es difícil determinar si la hipótesis nula es falsa o si observar un  fenómeno que contradice la hipótesis no es simplemente debido a la variabilidad en los datos[1]. Idealmente el poder estadístico debe estar por encima de 0.8, dando con ello un parámetro respecto al tamaño de muestra que se necesitaría

Para calcular el tamaño mínimo de una muestra con el objeto de comparar la diferencia entre las medias, se precisa:

  • Tener una idea aproximada de la varianza.
  • La magnitud relevante de la diferencia a detectar. Dicha magnitud puede establecerse respecto a la desviación estándar, por ejemplo un porcentaje.
  • Seguridad del estudio (riesgo de cometer un error. Se estableció una significancia del 95%, es decir, que hay un riesgo del 5% de considerar que hay diferencia entre los grupos a comparar siendo que no la hay (error tipo I)
  • Poder estadístico (1 - β) (riesgo de cometer un error β). Si bien se mencionó que puede ser 0.2, supongamos se establece en 0.15, es decir, habrá riesgo de aceptar que no hay diferencia entre los grupos, siendo que sí la hay (error tipo II), en una de cada seis implementaciones.
  • Definir si la hipótesis va a ser unilateral o bilateral. Supongamos que en nuestro caso es bilateral por cuanto al comparar las medias, una puede ser mayor o menor a la otra. No se establece dirección.
         n = (2*(zα+zβ)2*S2)/(d2), dónde

n = individuos en cada uno de los grupos.
α = valor Z asociado al riesgo deseado. (Z2.5% = 0.5987)
β = valor Z asociado al riesgo deseado. (Z7.5% = 0.7734)
S2 = Varianza de la variable cuantitativa.
d = valor mínimo de la diferencia que se desea detectar.

Fuentes
[1] http://healthcare-economist.com/2010/08/03/statistical-power
[2] http://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp