sábado, 30 de mayo de 2015

TEMA 9. ESTADÍSTICA INFERENCIAL. MUESTREO Y ESTIMACIÓN

Bueno, pues llegados a este punto, puede decirse que este es el tema de mayor importancia dentro de la asignatura  ya que abarca numerosos puntos, todos ellos fundamentales para la realización de problemas.
Este tema puede encasillarse en varios puntos importantes: cálculo del error estándar y Teorema central del límite, intervalos de confianza y finalmente el muestreo (tipos y cálculo de tamaños muestrales).

Para empezar, voy a explicar algunos conceptos previos a los cálculos. Por un lado, la población de estudio, que es el conjunto de pacientes o individuos sobre los que queremos estudiar alguna cuestión y se distingue de muestra en que ésta son los individuos concretos que participan en el estudio. Siendo el conjunto de ellos el tamaño muestral.

Al conjunto de procedimientos que permiten pasar de lo particular de la muestra a lo general, la población, le denominamos inferencia estadística o con palabras cotidianas ''extrapolar''.

Finalmente señalar la diferencia entre un parámetro que es la medida que queremos obtener, y un estimador que es la variable de estudio obtenida en la muestra.


  • Error estándar
Es la medida que trata de captar la variabilidad de los valores del estimador. Mide el grado de variabilidad de los valores en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.

Error de una media
Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta.
Error de una proporción
Para calcularlo debemos diferenciar si se trata de una media o una proporción. Siendo para una media la fórmula que aparece en primer lugar y para una proporción la de abajo.
s= desviación típica.
n=tamaño de la población.
p=proporción del estimador.

De ambas fórmulas se deduce que a mayor tamaño de la muestra, menor será el error que cometamos.



  • Teorema central del límite
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador que se trate.
Si sigue una distribución normal como ya dije en anteriores entradas, 1S abarca un 68,26% de las observaciones, 2S un 95,45% de las observaciones y 3S un 99%.


  • Intervalos de confianza
Los intervalos de confianza son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
IC de una media
Se trata de un par de números tales que, con un nivel de confianza determinados, podemos asegurar que el valor del parámetro es mayor que el límite inferior y menor que el superior.
Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite mediante la siguiente fórmula.
IC de una proporción


Siendo la p la proporción o la media X , Z el valor que depende el intervalo de confianza que nos piden (95%- z=1,96) (99%- z=2,58).

El signo significa que cuando elija el signo negativo se conseguirá el límite inferior y cuando se elija el positivo se tendrá el extremo superior.
Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir, los extremos estarán más distanciados y por tanto el intervalo será menos preciso.


  • Muestreo y tipos
Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.
La población general de la que queremos obtener conclusiones las vamos a elegir al azar, para obtener la muestra y a partir de esta hacer inferencia de la población entera.

Encontramos diferentes tipos, el probabilístico en el que todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra. Dentro de este grupo se encuentran: el aleatorio simple, aleatorio sistemático, estratificado, conglomerado y multietápico.
Por otro lado el no probabilístico en el que se sitúan el accidental o por cuotas y finalmente el de conveniencia del estimador.


  • Tamaño muestral
El tamaño de la muestra va a depender del error estándar, de la mínima diferencia entre los grupos de comparación, la variabilidad de la variable a estudiar (varianza) y del tamaño de la población de estudio. Se diferencia al igual que el IC en si es sobre una media o una proporción.

Para una media:  
Siendo Z el valor que depende del nivel de confianza, S la desviación típica y E el error máximo aceptado por los investigadores. Todo ello elevado al cuadrado.         (desviación típica al cuadrado= varianza)


Para una proporción:

Datos iguales a la anterior fórmula siendo N el tamaño de la población y p la proporción.

Se redondea siempre hacia arriba el número de sujetos de la muestra.

Espero que se entienda, al final de todo pondré varios ejemplos de cada tipo de fórmula para practicar. A trabajar!!!!!

No hay comentarios:

Publicar un comentario