viernes, 26 de junio de 2009

METODOLOGÍA DE LA INVESTIGACIÓN II

1: La planificación de la investigación.

1: Diseño de la investigación.-Diseño de un estudio.
La investigación se debe entender como el proceso dedicado a responder a una pregunta. Dicha respuesta lo que pretender es aclarar la incertidumbre de nuestro conocimiento. No se trata de almacenar datos de forma indiscriminada sino que se define como un proceso sistemático, organizado y objetivo destinado a responder a una pregunta. La palabra "sistemático" significa que a partir de la formulación de una hipótesis u objetivo de trabajo se recogen unos datos según un plan preestablecido que, una vez analizados e interpretados, modificarán o añadirán nuevos conocimientos a los ya existentes. El método científico parte de la observación de una realidad, se elabora una hipótesis explicativa, se contrastan las hipótesis y dicha hipótesis se acepta se realizan proposiciones que forman la teoría científica.
TABLA 1. Esquema general del planteamiento de un estudio.
Ø Hipótesis de trabajo
Ø Objetivos
Ø Diseño de estudio
Ø Selección de variables
Ø Definición de variables
Ø Escala de medida
Ø Protocolo de recogida de datos
Ø Selección de la muestra
o ¿Cuántos?
o ¿Quiénes?
Ø Recogida de datos
Ø Automatización de los datos
Ø Depuración de los datos
Ø Análisis
Ø Resultados
Ø Conclusiones

La epidemiología y la estadística son instrumentos indispensables para la realización de este proceso. En general podemos decir lo que habitualmente sucede es que de una población se extrae una muestra, sobre la que se realiza un experimento o medición y los resultados del mismo se extrapolan nuevamente a la población realizando una estimación con una seguridad definida completando así la inferencia.
Tabla 2. Elementos de la inferencia estadística
La definición del objetivo es el eje en torno al cual se construye la estructura del estudio. Si este objetivo no está claramente definido será difícil tomar decisiones sobre el tipo de estudio más apropiado, sobre la selección de la muestra, sobre el tamaño muestral, sobre las variables a medir y sobre el análisis estadístico a realizar.
El problema a investigar debe entenderse como la incertidumbre sobre algún hecho o fenómeno que el investigador desea resolver realizando mediciones en los sujetos del estudio. En este proceso es fundamental la realización de la revisión bibliográfica que como se señala en la tabla 3 presenta importantes utilidades y por consiguiente es imprescindible.
Tabla 3. UTILIDAD DE LA REVISIÓN BIBLIOGRÁFICA
-Tipos de estudios epidemiológicos observacionales.
Los estudios epidemiológicos observacionales pueden ser de tres tipos dependiendo del momento en que se llevan a cabo y de la información disponible en cada caso:
Transversales: Se desarrollan en un "momento" concreto del tiempo. Son los
estudios de prevalencia.
Longitudinales: Se desarrollan durante un "período" definido de tiempo y suponen trabajar con dos bloques de información relativos a la misma población, la existente al comienzo del periodo de tiempo en estudio y la existente al final de ese periodo de tiempo. Estos pueden ser a su vez:
3.
Estudio caso control: Son "retrospectivos". estudio de cohorte: Son de carácter "prospectivo".
-Estudios descriptivos.
Un estudio descriptivo es un tipo de metodología a aplicar para deducir un ambiente o circustancia que se esté presentando; se aplica describiendo todas sus dimensiones, en este caso se describe el órgano u objeto a estudiar.
Los estudios descriptivos clásicos son los
estudios de series de casos y los estudios de prevalencia.
Objetivos de un estudio descriptivo
Identificar casos de enfermedad, estimar su frecuencia y examinar tendencias de la
población estadística.
Justificar
estudios analíticos para probar hipótesis específicas.
-Estudios analíticos.
Un estudio analítico o
estudio etiológico es un estudio epidemiológico en el que en el análisis del estudio se establecen relaciones entre las variables, de asociación o de causalidad. Cuando se plantea realizar un estudio analítico, se conoce bastante sobre la enfermedad, así pueden probarse hipótesis específicas previas surgidas de un estudio descriptivo.
Son estudios analíticos típicos: El
estudio de cohorte, el estudio caso control y el ensayo clínico.
Objetivos de un estudio analítico
Probar hipótesis etiológicas o preventivas y estimar los efectos crónicos sobre la
salud.
Justificar estudios adicionales para probar hipótesis aún más específicas.
Sugerir aspectos potenciales para la
prevención de la enfermedad o promoción de la salud.
-Estudios de casos y controles.
Un estudio caso-control, es un
estudio epidemiológico, observacional, analítico, en el que los sujetos son seleccionados en función de que tengan (casos) o no tengan (control) una determinada enfermedad, o en general un determinado efecto. Una vez seleccionados los individuos en cada grupo, se investiga si estuvieron expuestos o no a una característica de interés y se compara la proporción de expuestos en el grupo de casos frente a la del grupo de controles.
Contenido
1 Tipos de estudio de caso control
2 Técnica de un estudio de caso control
3 Ventajas de los estudios caso control
4 Inconvenientes de los estudios caso control
5 Enlaces externos
Tipos de estudio de caso control
Estudio de caso control retrospectivo: Todos los casos han sido
diagnosticados antes de que se inicie el estudio.
Estudio de caso control prospectivo: Los casos son diagnosticados con posterioridad al inicio del estudio y así pueden incluirse los casos nuevos que se detecten durante cierto tiempo establecido previamente.
Estudio de caso control de base poblacional: Combina elementos del
estudio de cohorte y de caso control. Se sigue a un grupo de individuos hasta que aparece la enfermedad de interés como en un estudio de cohortes. Estos casos se comparan con un grupo control, muestreado de la misma población. Una vez que se obtienen todos los casos y los controles se analiza el tipo de exposición previa o actual, como en un estudio de caso control.
-Estudio de cohortes.
Un estudio de
cohorte es un estudio epidemiológico, observacional, analítico, longitudinal prospectivo o retrospectivo, en el que los individuos que componen los grupos de estudio se seleccionan en función de la presencia de una determinada caraterística o exposición. Estos individuos no tienen la enfermedad de interés y son seguidos durante un cierto periodo de tiempo para observar la frecuencia con que la enfermedad aparece en cada uno de los grupos. También se llama estudio de seguimiento, de proyección o de incidencia, y tienen por objetivo medir causalidad entre factores de riesgo y la enfermedad a estudiar.
Los estudios de seguimiento son los estudios prospectivos clásicos. A pesar de que se trata de estudios muy costosos, al requerir grandes recursos económicos y de tiempo, y de gran solidez ya que la
probabilidad de que estén sesgados es menor, hay que cuidar extremadamente los aspectos del diseño y evitar sesgos, especialmente de clasificación y el sesgo de los trabajadores sanos.
Contenido
1 Técnicas de un estudio de cohorte
2 Ventajas de un estudio de cohorte
3 Inconvenientes de un estudio de cohorte
4 Ejemplos de estudios de cohorte
5 Véase también
Técnicas de un estudio de cohorte
Seleccionar una
muestra de población.
Medir
variables de exposición en la muestra, si el factor de riesgo está ausente o presente.
Seguir a la cohorte.
Medir las variables de resultado, es decir, la presencia o ausencia de enfermedad.
Tema 2: Plan muestral.-Muestreo.
En
estadística un muestreo es la técnica para la selección de una muestra a partir de una población. En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción
El muestreo: es una herramienta de la
investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población
El Muestreo es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las
estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.
Muestreo Estadístico: son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.
-Tipos de muestreo.
Muestreo probabilístico
Consiste en elegir una muestra de una población al azar
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra.
Muestreo aleatorio sistemático
Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra.
Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes elementos de la muestra.
-Muestreo por conglomerados.
Cuando en lugar de unidades últimas se eligen
grupos, bloques o conjuntos de esas unidades, se dice que el muestreo es por conglomerados. Si en lugar de seleccionar de forma aleatoria personas para medir su capacidad adquisitiva o de consumo se seleccionan, por ejemplo, familias, se dice que el muestreo es por conglomerados. Cuando el conglomerado se corresponde con un área geográfica o zona territorial concreta, como por ejemplo las familias de determinados barrios, el muestreo por conglomerados recibe el nombre de muestreo por áreas.
MÓDULO 2: Fundamentos de inferencia.
Tema 3: Distribuciones muéstrales.-Concepto de distribución muestral.
En
estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se puede estimar el error para un tamaño de muestra dado.
La fórmula para la distribución muestral dependerá de la distribución de la población, del estadístico y del tamaño de la muestra.
-Teorema central del límite.
El teorema del límite central o teorema central del límite indica que, en condiciones muy generales, la
distribución de la suma de variables aleatorias tiende a una distribución normal (también llamada distribución gaussiana o curva de Gauss o campana de Gauss) cuando la cantidad de variables es muy grande.[1]
Teorema: Sea X1, X2, ..., Xn una muestra aleatoria de una distribución con media μ y varianza σ2. Entonces, si n es suficientemente grande, la variable aleatoria
tiene aproximadamente una distribución normal con y .
También se cumple si
Tiene aproximadamente una distribución normal con y , cuanto más grande sea el valor de n, mejor será la aproximación.
El teorema del límite central garantiza una distribución normal cuando n es suficientemente grande.
Existen diferentes versiones del teorema, en función de las condiciones utilizadas para asegurar la convergencia. Una de las más simples establece que es suficiente que las variables que se suman sean
independientes, idénticamente distribuidas, con valor esperado y varianza finitas.
La aproximación entre las dos distribuciones es, en general, mayor en el centro de las mismas que en sus extremos o colas, motivo por el cual se prefiere el nombre "teorema del límite central" ("central" califica al límite, más que al teorema).
-Error estándar.
A la desviación estándar de una distribución muestral se le conoce como error estándar del estadístico.
La diferencia entre la desviación estándar y el error estándar es que la desviación estándar trabaja con datos originales y el error estándar con datos obtenidos de la distribución muestral.
Así se tienen, un error estándar de la media o desviación estándar de la distribución de medias o se tendrá también un error estándar de la proporción o desviación estándar de la distribución muestral de proporciones.

Tema 4: Estimación.
-Estimación puntual.
Puede decirse que la Estadística es la ciencia que se preocupa de la recogida de datos, su organización y análisis, así como de las predicciones que, a partir de estos datos, pueden hacerse. Los aspectos anteriores hacen que pueda hablarse de dos tipos de Estadística: Descriptiva e Inferencial.
La Estadísitica Descriptiva se ocupa de tomar los datos de un conjunto dado, organizarlos en tablas o representaciones gráficas y del cálculo de unos números que nos informen de manera global del conjunto estudiado.
La Estadística Inferencial estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra.
Existen dos formas de hacer Inferencia Estadística:
- La estimación de parámetros.
- Las pruebas de hipótesis.
En la Inferencia Estadística hay varios métodos, pero en cualquier caso es necesario utilizar una muestra que represente a la población, esto se consigue con las Técnicas de muestreo.
A partir de una muestra nos proponemos dos objetivos:
- Obtener valores aproximados de parámetros poblacionales: Estimación puntual.
- La estimación por intervalos de confianza tiene por objeto proporcionar, a partir de la información recogida en la muestra, un intervalo que contenga con alto nivel de confianza (probabilidad), al parámetro objeto de nuestro interés. A partir de dicho intervalo obtendremos una medida del error máximo cometido al aproximar puntualmente el parámetro.


-Estimación por intervalos.
ESTIMACIÓN POR INTERVALOS.
Nos proponemos determinar dos números entre los cuales se halla el parámetro estudiado con cierta certeza.
El procedimiento para obtener un intervalo (de confianza) para un parámetro, la media, por ejemplo, requiere de la determinación de un estimador del parámetro y de la distribución del estimador.
Ejemplo
Tratamos de obtener un intervalo de confianza para la media de una población normal.
Sabemos que si X sigue una normal de media y varianza entonces la media muestral sigue una normal de la misma media y de varianza la varianza poblacional partida por n, tamaño de la muestra.
Vamos a determinar a y b tales que P[a< población normal X con varianza desconocida , siendo el parámetro a estimar su valor medio μ . Para ello se deberá disponer de:
o Una muestra aleatoria X1, X2 ,..., Xn de tamaño n extraída de la población X.
o Un estimador Θ del parámetro poblacional μ , que en este caso es la media muestral pero que, debido al desconocimiento de la varianza de la población, tendremos que reemplazar este último parámetro por la varianza muestral. El
estadístico que emplearemos, relacionado con el parámetro μ , será :
Este estadístico sigue una
distribución T de Student con (n-1) grados de libertad.
o El nivel de confianza 1- α , establecido a priori por el experimentador (los usuales son 0.95, 0.90 y 0.99).
Dada la distribución del estadístico y el nivel de confianza , se tiene la siguiente igualdad probabilística:
La expresión anterior es equivalente a:
que hace referencia a que con una probabilidad 1- α el intervalo aleatorio
contendrá el valor medio μ . El intervalo es aleatorio ya que sus extremos se determinan a partir de los estimadores media muestral y desviación típica muestral, tratándose de variables aleatorias. La probabilidad a que se refiere dicho intervalo aleatorio, puede interpretarse de manera informal pero quizás más clara:
"Si consideramos todas las muestras distintas de tamaño n que puedan ser extraídas de la población X , y con las observaciones de cada una construimos los correspondientes intervalos, según la estructura anterior, el (1- α)% de estos intervalos contendrán el parámetro μ "
Por tanto, si extraemos una muestra de tamaño n y con los datos u observaciones, x1, x2 ,..., xn , calculamos los extremos del intervalo, dispondremos del concreto intervalo de confianza para el parámetro μ
que, en función de la interpretación informal anterior, contendrá dicho parámetro con una confianza (1- α).
Observación: el nivel de confianza establece en alguna medida la longitud del correspondiente intervalo de confianza. Aumentando el nivel de confianza (mayor certeza) , aumenta la longitud (menor precisión).
Tema 5: Contraste de hipótesis.-¿Que son las hipótesis?
Una hipótesis puede definirse como
proposición cuya veracidad es provisionalmente asumida, como solución provisional (tentativa) para un problema dado o con algún otro propósito investigativo. El nivel de verdad que se asume para una hipótesis dependerá de la medida en que los datos empíricos recogidos apoyen lo afirmado en la hipótesis. Esto es lo que se conoce como contrastación empírica de la hipótesis o bien proceso de validación de la hipótesis. Este proceso puede realizarse de uno o dos modos: mediante confirmación (para las hipótesis universales) o mediante verificación (para las hipótesis existenciales).
-Características del razonamiento hipotético.
Capacidad mental de realizar inferencias y predicciones de hechos a partir de los ya conocidos y de las leyes que los relacionan.
-Contraste de hipótesis.
El contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es una técnica de
inferencia estadística para juzgar si una propiedad que se supone cumple una población estadística es compatible con lo observado en una muestra de dicha población.
Si sospechamos que una moneda ha sido trucada para que se produzcan más caras que cruces al lanzarla al aire, podríamos realizar 30 lanzamientos, tomando nota del número de caras obtenidas. Si obtenemos un valor demasiado alto, por ejemplo 25 o más, consideraríamos que el resultado es poco compatible con la hipótesis de que la moneda no está trucada, y concluiríamos que las observaciones contradicen dicha hipótesis.
La aplicación de cálculos probabilísticos permite determinar a partir de qué valor debemos rechazar la hipótesis garantizando que la
probabilidad de cometer un error es un valor conocido a priori. Las hipótesis pueden clasificarse en dos grupos, según:
1. Especifiquen un valor concreto o un intervalo para los parámetros del modelo.
2. Determinen el tipo de
distribución de probabilidad que ha generado los datos.
Un ejemplo del primer grupo es la hipótesis de que la media de una variable es 10, y del segundo que la
distribución de probabilidad es la distribución normal.
Aunque la metodología para realizar el contraste de hipótesis es análoga en ambos casos, distinguir ambos tipos de hipótesis es importante puesto que muchos problemas de contraste de hipótesis respecto a un parámetro son, en realidad, problemas de estimación, que tienen una respuesta complementaria dando un intervalo de confianza (o conjunto de intervalos de confianza) para dicho parámetro. Sin embargo, las hipótesis respecto a la forma de la distribución se suelen utilizar para validar un modelo estadístico para un fenómeno aleatorio que se está estudiando.
-Tipos de hipótesis.
Hipótesis nula. Para todo tipo de investigación en la que tenemos dos o más grupos, se establecerá una hipótesis nula.
Hipótesis conceptual. Es la hipótesis que se formula como resultado de las explicaciones teóricas aplicables a nuestro problema. Nos ayuda a explicar desde el punto de vista teórico el fenómeno que estamos investigando.

Hipótesis de trabajo. Es aquella que le sirve al investigador como base de su investigación, o sea, trata de dar una explicación tentativa al fenómeno que se está investigando. Ésta es la hipótesis que el investigador tratará de aceptar como resultado de su investigación, rechazando la hipótesis nula.
Hipótesis alternativa. Al responder a un problema, es muy conveniente proponer otras hipótesis en que aparezcan variables independientes distintas de las primeras que formulamos. Por tanto, para no perder tiempo en búsquedas inútiles, es necesario hallar diferentes hipótesis alternativas como respuesta a un mismo problema y elegir entre ellas cuáles y en qué orden vamos a tratar su comprobación.
MÓDULO 3: Análisis de los datos de una investigación.
Tema 6: Especificación del problema de análisis.-Variables respuesta y variables explicativas.
Variable Explicativa y Variable Respuesta
A menudo nos encontramos con un papel en blanco y con unos deseos de realizar un estudio. Lo primero que tenemos que hacer es identificar en esos deseos cuáles son nuestras variables y de qué tipo son. Básicamente cualquier información que se recoge en un formulario es una variable. Las variables que con mayor frecuencia aparecen en esos formularios son el peso, edad, sexo, tratamiento, resultado, etc. Cuando estemos diseñando un formulario tenemos que pensar que la información que recojamos en ellos se tiene que poder disponer en una cuadrícula donde en las columnas aparezcan las variables y en las filas ellos individuos. En la intersección de las filas y columnas (celdas) aparecerá por tanto el resultado que toma una variable para un individuo en concreto. La práctica clínica tiene una óptica horizontal: se fija en los individuos, la estadística tiene una óptica vertical: se fija en las variables.
En la mayoría de los estudios se suele considerar una variable explicativa y una variable respuesta. La variable explicativa por excelencia en los estudios experimentales es el tratamiento y en los estudios observacionales el factor de exposición. La variable explicativa, también llamada variable independiente, intenta explicar, servir de posible explicación a la variable respuesta, también llamada resultado o variable dependiente. En los estudios donde es posible establecer una variable explicativa y una variable respuesta se está configurando un modelo.
Tipos de Variables
Los valores que puede tomar cualquier variable, ya sea explicativa o respuesta, constituyen los niveles de las variables. La naturaleza de estos niveles es lo que determina el tipo de las variables. Así se tiene los siguientes tipos de variables:
Dicotómica: aquella variable que sólo puede tomar dos posibles valores
Nominal: aquella variable que puede tomar varios valores
Ordinal: aquella variable que puede tomar varios valores y en los que se puede establecer un orden entre las categorías
Cuantitativa: aquella variable que puede tomar un rango numérico de valores
Censurada: aquella variable cuantitativa que puede tener información parcial o no completa (tiempo hasta que ocurre algo en Análisis de Supervivencia)
Pruebas no paramétricas:
Se denominan pruebas no paramétricas aquellas que no presuponen una distribución de probabilidad para los datos, por ello se conocen también como de distribución libre (distribution free). En la mayor parte de ellas los resultados estadísticos se derivan únicamente a partir de procedimientos de ordenación y recuento, por lo que su base
lógicas de fácil comprensión. Cuando trabajamos con muestras pequeñas (n <>centralización la mediana, que es aquel punto para el que el valor de X está el 50% de las veces por debajo y el 50% por encima.
Tema 7: Estudio de una variable respuesta en una población.-Determinación de tamaños muéstrales.
Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo (1-4). El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el número adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además no encontraremos diferencias significativas cuando en la realidad sí existen. La segunda situación es que podríamos estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.
Para determinar el tamaño muestral de un estudio, debemos considerar diferentes situaciones:
A. Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra.
B. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes.
-Prueba Ji-cuadrado.
Cuando las observaciones de una investigación corresponden a muestras independientes y las mediciones se tienen en escala nominal, la prueba de ji cuadrada es el procedimiento de elección para el contraste de hipótesis. Esta prueba estadística se emplea en el análisis de dos o más grupos y de dos o más variables.
La eficacia de la prueba no se ha determinado con exactitud; sin embargo, a medida que el tamaño de la muestra aumenta, el valor de probabilidad de error para aceptar hipótesis alternas (Ha o Ho) se acerca a 1. En sentido opuesto, cuando el número de la muestra es menor que 20, se pierde eficacia. En estas condiciones, es conveniente no aplicar la prueba de ji cuadrada, pero existen alternativas.
Si en el modelo experimental se tiene una tabla de contingencias de 2 X 2 y la muestra total es menor a 20 e incluye cero en alguna casilla, la prueba estadística aconsejable será la de probabilidad exacta de Fischer y Yates.
Con grupos múltiples, pero con frecuencias pequeñas, menores que cinco, se recomienda usar la prueba de ji cuadrada de proporciones.
Las dos alternativas propuestas aumentan notoriamente la eficacia con muestras de tamaño pequeño y se limita la probabilidad de cometer el error del tipo I.
La fórmula es:
Donde:X2 = valor estadístico de ji cuadrada.fo = frecuencia observada.fe = frecuencia esperada.
Pasos:
Arreglar las observaciones en una tabla de contingencias.
Determinar el valor teórico de las frecuencias para cada casilla.
Calcular las diferencias entre los valores observados con respecto a los teóricos de cada casilla.
Elevar al cuadrado las diferencias y dividirlas entre el valor teórico de la casilla correspondiente.
Obtener la sumatoria de los valores anteriores, que es el estadístico X2.
Calcular los grados de libertad (gl): gl = (K columnas -1) [H hileras -1].
El valor de X2 se compara con los valores críticos de ji cuadrada de la tabla de valores críticos de X2 y de acuerdo con los grados de libertad, y se determina la probabilidad.
Decidir si se acepta o rechaza la hipótesis X2c ³ X2t se rechaza Ho.
Tema 9: Precauciones en el análisis de los datos y guía abreviada para un protocolo de estudio.-análisis de los datos.
 El análisis de datos de la encuesta tiene como objetivo la detección de grupos variables altamente relacionados, para ello se utilizan los siguientes análisis :
 Análisis Descriptivo: ayudará a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos...
Los resultados recogidos en la muestra se resumen en una matriz de datos N x M , en la cual N es el número de unidades de análisis utilizadas ( número de casos ) y M es el número de características de dichas unidades , unidades de las que tenemos información.
 Análisis Exploratorio: un análisis exploratorio pretende partir de un conocimiento profundo y creciente de los datos para , trabajando inductivamente , llegar a un modelo ajustado de los datos. Los pasos en este tipo de análisis son los siguientes :
 Análisis de cada una de las variables incluidas en la matriz de datos. Los datos se agrupan de un modo rápido y a ser posible gráfico, las técnicas más utilizadas son:
· Tronco y hoja
· La caja
Ambas pretenden:
· Conocer la variable analizada para determinar si su distribución es simétrica o no.
· Poder descubrir valores extremos y analizarlos antes de poder pasar al análisis multivariante.
 Transformación de los datos: la transformación persigue la consecución de una distribución aproximada a la normal. Tipos de transformación:
· Lineales : suma , resta , división , multiplicación , cambia los valores brutos ( datos obtenidos ) de la variable sin alterar nada mas.
· No lineales monotónicas : cambian los valores originales y también sus distancias pero no el orden
· No lineales no monotónicas : similar a la anterior pero no altera el orden..
 Análisis Confirmatorio / Explicativo: la mayor parte de las técnicas tradicionales de análisis estadístico de los datos tienen un carácter deductivo confirmatorio. De todas las técnicas de análisis confirmatorio la más útil para el sociólogo es aquella que parte del análisis de variables , entre las que cabe distinguir : nominales y de intervalo o de razón . En la investigación sociológica las de tipo ordinal son muy frecuentes, pero las técnicas de análisis escasas , de modo que se tratan como variables de intervalo o razón , labor muy complicada o como nominales.
 Investigación con Variables Nominales
En la investigación con variables nominales se utilizan técnicas como el análisis de varianza o factorial.
Dentro de las técnicas multivariantes de análisis de variables nominales existen dos de carácter especial:
· Los coeficientes J. Davis ha perfeccionado un modelo que se basa en las diferencias porcentuales. Los coeficientes son diferencias entre proporciones y se utilizan como indicadores del impacto causal de unas variables sobre otras.
· Modela explican la probabilidad de que una persona elegida al azar presente una determinada combinación de categorías/ niveles del conjunto de variables de clasificación utilizados
6. Investigación con variables de intervalo o de razón : en estas se utiliza el análisis de regresión : puede utilizarse siempre que la variable dependiente sea una variable de intervalo.
2. Análisis de los Datos de Encuesta
El análisis de los datos de la encuesta, como cualquier otro tipo de datos de interés científico , ha de guardar relación con el problema de conocimiento que se trata de esclarecer y con la métrica de la información empírica que se tiene entre manos , es decir lo primero que se debe realizar en una encuesta no es ver que dicen los datos sino que dicen en relación con el problema que se plantea y las hipótesis que uno se había planteado previamente.
Una serie de conclusiones importantes sobre los datos de una encuesta son:
· La cantidad y calidad del conocimiento que se desea obtener sobre un problema no está necesariamente en función del tamaño de la muestra empleada para hacer una encuesta.
· Ni el margen global de error en los resultados de una encuesta disminuye necesariamente aumentando el tamaño de la muestra.
· Los datos de la encuesta son más útiles cuanto mayor sea la posibilidad de poderlos comparar con otros similares y anteriores en el tiempo o procedentes simultáneamente de otras poblaciones.

No hay comentarios:

Publicar un comentario