Hoy es: 24-07-2014 / Hora: 12:24:am

INVESTIGACIÓN / INFORMES

 

EL PAPEL DE LA ESTADISTICA EN LA INVESTIGACION.
EL PAPEL DE LA ESTADISTICA EN LA INVESTIGACION.
Otros | Reg. 6516
Visitas: 8515

Seguirnos en Twitter
Me fué de utilidad
y también este portal
 
 
Compartir

Antes de examinar la etapa descriptiva de la investigación, nos convendrá tener una idea general de la estadística y de cómo se emplea en la actividad científica, en la medida en que se trata de una herramienta fundamental que la matemática provee al investigador para poder resumir y analizar gran cantidad de información.

Tanto en las investigaciones exploratorias como en las descriptivas y explicativas, el científico no maneja un solo dato sino muchos, sea porque estudia muchos individuos (las edades de todos los argentinos, o el cociente intelectual de todos los adolescentes de un colegio), sea porque estudia un solo individuo sobre el cual se hacen muchas observaciones que proporcionarán, entonces, muchos datos (las calificaciones que obtiene Juancito en las distintas asignaturas y a través de varios años).

Cuando, como en tales casos, hay que considerar una gran cantidad de datos, necesitaremos una herramienta para poder organizarlos, analizarlos y finalmente sacar conclusiones sobre la población o el individuo de donde esos datos fueron extraídos, y este instrumento se llama estadística. La utilidad de la estadística, entonces, no apunta necesariamente al estudio de muchos individuos (población), sino fundamentalmente al estudio de muchos datos, sea porque provengan de un solo sujeto o de muchos. No obstante en lo que sigue explicaremos el trabajo más usual de la estadística en ciencias sociales: el estudio de poblaciones de individuos.

Todos sabemos la diferencia entre individuo y población: una cosa es un argentino determinado, y otra cosa el conjunto de los habitantes de ese país. O también: una cosa es la ciudad de París y otra el conjunto de todas las ciudades del mundo, lo que viene a mostrarnos que lo que llamamos individuo es simplemente un elemento dentro de un todo (población) y que, para evitar malos entendidos, llamaremos genéricamente unidades de análisis. En psicología las unidades de análisis pueden ser personas, en psicología social grupos pequeños, en sociología sociedades o clases sociales, en demografía ciudades, en química metales, en biología ratas, etc.

La distinción entre individuo población es importante porque a la estadística que aquí vemos no le interesa el individuo aislado sino el conjunto de la población. Si al estadístico le interesa que Juancito tiene cociente intelectual 110 es sólo para llegar a saber que el promedio de cocientes intelectuales de la población es de 115 y que, entonces, Juancito está por debajo de esa media.

La población o universo, definible como el conjunto de todas las unidades de análisis, puede ser finita o infinita, según tenga o no un número determinado de individuos: podemos considerar infinito al conjunto de todos los individuos posibles según su combinación genética. La población también puede ser real o potencial: una población real es el conjunto de todos los argentinos mayores de 18 años y menores de 20, y población potencial es por ejemplo el conjunto de todas las personas que podrían utilizar el servicio de psicopatología de un hospital.

a) Muestra y muestreo

Nos interesarán, entonces, las poblaciones. Pero aquí surge un problema: como habitualmente las poblaciones son muy grandes (cuando no infinitas), no podemos obtener los datos de todos los individuos, y entonces nos vemos obligados a seleccionar una parte de esa población, que se llama muestra. La muestra está así a mitad de camino entre el individuo y la población (aunque en ciertos casos una muestra puede estar constituída por un solo individuo)

Obviamente, deberemos asegurarnos de que la muestra sea representativa de la población: si queremos tomar una muestra de los habitantes de una ciudad y sólo seleccionamos veinte enfermos mentales de un hospicio, esta muestra no representará adecuadamente a la población. En cambio si seleccionamos la misma cantidad de sujetos tomando uno de cada 100 de la guía telefónica aquí ya puedo empezar a pensar más en la posibilidad de cierta representatividad, pues están tomados más al azar.

Aún así no hay un azar total, pues en la guía no figuran por ejemplo individuos de clase baja (no tienen teléfono), y si nos decidimos por una lista de empadronamiento para votar, allí no figurarán los extranjeros residentes. Un procedimiento bastante aleatorio, en cambio, consiste en elegir un individuo por cada manzana.

El tamaño elegido para la muestra es también importante, y variará de acuerdo a cada investigación pudiendo ser el 5%, el 20%, etc., de la población total. Suele ser difícil elegir el tamaño justo, ya que no se puede pecar por defecto (un solo individuo no representa a una ciudad, aún tomándolo al azar) o por exceso (una muestra que sea el 80% de la población es altamente confiable pero no económica, ya que con menos esfuerzo y dinero puede obtenerse una muestra considerablemente más pequeña sin que varíe en forma significativa su grado de representatividad).

El procedimiento por el cual seleccionamos una muestra se llama muestreo, y clásicamente se los divide en probabilísticos y no probabilísticos. Lo esencial del muestreo probabilístico es que cada individuo de la población total tiene la misma o aproximadamente la misma probabilidad de estar incluído en la muestra. Si tomamos una muestra de los habitantes de Londres considerando uno de cada 100 de un listado alfabético, la probabilidad que tiene de haber sido seleccionado el señor Smith es la misma que tiene el señor Brown o cualquier otro (en este caso, la probabilidad del uno por ciento).

Hay varias técnicas para realizar muestreos probabilísticos, y todas se basan en la selección de individuos al azar ya que es éste quien presuntamente garantiza la equiprobabilidad. El muestreo puede ser: a) simple: partiendo de toda la población se toman individuos al azar según diversos procedimientos; b) estratificado: previamente se seleccionan en la población estratos (por ejemplo clases sociales: alta, media y baja), y dentro de cada estrato se toman individuos al azar según el muestreo simple; c) por áreas o conglomerados: se delimitan previamente áreas geográficas (provincias, ciudades) y dentro de cada una de ellas se toman individuos al azar según el muestreo simple o estratificado.

En el muestreo no probabilístico los individuos de la población no tienen todos la misma probabilidad de aparecer en la muestra, ya que aquí no hacemos una estricta selección al azar sino que tomamos casos típicos (que suponemos representativos de la media poblacional) o casos en forma accidental (los que tenemos más a mano), etc.

Una vez obtenida la muestra (preferiblemente mediante muestreo probabilístico), procedemos ahora a hacer una descripción de la muestra, para lo cual usaremos ciertas medidas especiales diferentes a las medidas que usamos para medir individuos. Si queremos describir sujetos individuales usaremos una medida individual: Juancito tiene cociente intelectual 110, o Pedrito tiene poco interés en política, etc. Pero, si queremos describir una muestra usaremos lo que se llama una medida estadística. Por ejemplo, tal muestra se compone de sujetos cuyo promedio de cocientes intelectuales es 120, o tal otra muestra tiene un 70% de sujetos con poco interés en política, etc. Como vemos, estas medidas estadísticas son verdaderas síntesis o resúmenes de muchas medidas individuales, y un ejemplo típico es la media aritmética, o sea, un simple promedio.

Examinemos como ejemplo dos muestras diferentes, compuestas cada una por tres individuos, y donde nos interesará describirlas considerando el factor cociente intelectual:


Muestra 1) ----105------------110-------------115------------- (Promedio: 110)

Muestra 2) -----80--------------------110----------------------140---- (Promedio: 110)

Ambas muestras tienen el mismo promedio y sin embargo, son dos muestras diferentes! Por lo tanto, solamente un promedio no basta para describir e identificar adecuadamente una muestra, y deberemos usar una segunda medida estadística que nos permita conocer cuán lejos o cuán cerca están los individuos del promedio, o sea, su grado de dispersión. En el ejemplo vemos que la muestra 1 es menos dispersa ya que los diferentes valores obtenidos están muy próximos al promedio, mientras que la muestra 2 es más dispersa.

Recién cuando se han tomado ambas medidas podemos afirmar que hemos descripto adecuadamente las muestras, con lo cual no queda posibilidad de confundirlas con otras. Y aún cuando dos muestras puedan ser distintas porque las componen diferentes individuos, si tienen la misma media aritmética y la misma dispersión las consideraremos iguales a los efectos del análisis estadístico.

El primer tipo de medida estadística se llama medida de posición (o de tendencia central), y nos está indicando alrededor de qué valor (en el ejemplo 110) giran todos los valores individuales. El segundo tipo se llama medida de dispersión, y nos indica cuán próximos o alejados están los distintos valores del promedio, o sea de la medida de posición, de lo cual se desprende que no podremos tomar una medida de dispersión sin antes haber tomado la correspondiente medida de posición. Un ejemplo de medida de dispersión es el desvío standard, que conceptualmente es un promedio de las distancias de cada valor respecto de la media.

b) Pruebas de significación

Hasta aquí lo único que hicimos fue describir una muestra, pero lo que a la estadística le interesa en última instancia es la población, con lo cual debemos resolver una segunda cuestión: la representatividad de la muestra. Es decir, interesa saber hasta qué punto las medidas que describieron la muestra describen igualmente bien la población de donde la muestra fue extraída. Más concretamente: ¿el promedio 110 de la muestra podemos también adscribírselo con confianza a la población? ¿Pasa lo mismo con la medida de dispersión? Naturalmente que siempre habrá un margen de error, pues si nos animáramos a sacar el promedio de la población entera seguramente no sería exactamente igual al promedio de la muestra. La cuestión entonces no reside en eliminar esta diferencia, pues es imposible, sino en poder saber hasta qué punto dicha diferencia se debe solamente al azar. De comprobar realmente esto, entonces la diferencia no es importante y concluímos que la muestra sí es representativa. Para poder hacer estas determinaciones nos bastará aquí con saber que la estadística ha diseñado ciertas pruebas especiales, como por ejemplo las pruebas de significación. Son pruebas basadas en el cálculo de probabilidades, ya que aquí lo que debemos verificar es si lo concluído respecto de la muestra vale también para la población y con qué grado de probabilidad (pues hay grados de probabilidad aceptables y no aceptables).

Hay dos tipos de probabilidad: lógica e inductiva. a) Probabilidad lógica: si yo tengo un dado perfectamente balanceado (o sea que las seis caras tienen la misma probabilidad de salir), no necesitaré arrojarlo para saber qué probabilidad tiene de salir el número 3. Como ya sé que tiene seis caras equiprobables, su probabilidad será de uno sobre seis (p=1/6). b) Probabilidad inductiva: puede ocurrir, sin embargo, que el dado no esté balanceado, o que yo no sepa si el número 3 figura en dos caras y el 5 en ninguna, etc., y sólo sé que tiene 6 caras. A priori, o sea antes de arrojar los dados, en estos casos no puedo saber qué probabilidad tiene el 3 de salir, debido a mi desconocimiento del dado. No obstante tengo un medio de saberlo: arrojo el dado una gran cantidad de veces (cuantas más veces mejor) y voy anotando los números que aparecieron. Si constato que el 3 salió en un 50% de los casos, entonces puedo concluír que la probabilidad será de tres sobre seis (p=3/6=1/2). Este dato no me aclara definitivamente si el dado estaba desbalanceado o si en realidad en tres de sus caras estaba el número 3; sólo me sugiere la probabilidad de aparición del número en cuestión.

En suma: en la probabilidad lógica y debido a que conozco el dado, puedo calcular qué probabilidad tiene de salir determinado número sin necesidad de hacer ninguna prueba. Es una probabilidad deductiva, puesto que deduzco de los datos conocidos la probabilidad de cada alternativa. En cambio en la probabilidad inductiva no conozco la naturaleza del dado, y entonces sólo puedo concluír la probabilidad de aparición de un cierto número siguiendo un razonamiento inductivo, vale decir, a partir de los casos observados que fui anotando.

Las mismas consideraciones que hicimos con las caras de un dado también podemos hacerlas con los naipes de un mazo y con los individuos de una población. En estadística, puesto que generalmente desconocemos la naturaleza de la población, el tipo de probabilidad empleado es el inductivo.

En este contexto, ¿qué sería lo deseable? Sería que no hubiera diferencia significativa entre la muestra y la población, y esta situación deseable es lo que suele llamarse hipótesis nula(nula porque suponemos que no hay diferencia significativa entre ambas cosas, con lo cual la muestra pasa a ser representativa de la población) (24).

Naturalmente que, como toda hipótesis, es una mera suposición, y por lo tanto es algo que debemos verificar mediante las mencionadas pruebas de significación. Al aplicar estas pruebas podemos cometer dos tipos de errores, opuestos entre sí: a) Error Tipo I, o error del desconfiado, y que consiste en creer que la muestra no es representativa cuando sí lo es (o sea rechazar la hipótesis nula cuando en realidad es verdadera); y b) Error Tipo II, o error del ingenuo: creer que la muestra es representativa cuando en rigor no lo es (o sea aceptar la hipótesis nula cuando en realidad es falsa). Para evitar ambos errores tomamos las dos precauciones de las que habíamos hablado: considerar un tamaño adecuado de la muestra, y tomar los individuos al azar.

No sabemos si en realidad existe o no el azar, pero sí podemos afirmar con bastante seguridad que el hombre no puede producir azar absoluto. Si quisiéramos colocar en una serie números al azar, tarde o temprano aparecería alguna regularidad que hemos incluido inadvertidamente. Si pedimos a una persona que escriba una secuencia al azar de unos y ceros, casi todos elegirán una secuencia que alterna con demasiada regularidad. Aunque parezca paradójico, si los ceros y los unos se mezclan con excesiva uniformidad, deja de ser azar (1). Además, cuando pretendemos armar una serie al azar generalmente partimos del prejuicio de que el azar tiene memoria, y consideramos que si salió tres veces un cero, la probabilidad de que salga cero la cuarta vez disminuye mucho (y entonces ponemos un uno). Pero esto es falso: una serie al azar puede incluir muchos ceros seguidos. Es el prejuicio del jugador de quinielas que le juega al 7 porque simplemente hace mucho que no sale, y no comprende que cualquier número en cualquier momento tiene la misma probabilidad de salir que cualquier otro.

Tampoco habría azar absoluto si quien arma la serie es una computadora, no sólo porque puede fallar el software (al fin y al cabo es el hombre quien la programa), sino también el hardware (los circuitos electrónicos pueden sufrir algún desgaste, con lo que empieza a aparecer alguna regularidad en la serie).

Si bien el azar absoluto no existe, ni menos aún en estadística, su empleo resulta necesario pues hace disminuir la probabilidad de la influencia de ciertas variables más que de otras, o sea, el azar procura que ninguna variable esté ejerciendo influencia mucho más que cualquier otra. Si tomamos una muestra de la población procuraremos siempre aleatoria, es decir, que los individuos sean lo más heterogéneos en cuanto a edad, sexo, condición social, salud mental, etc. No podría tomar una muestra de la población argentina si está constituida por 1000 mujeres solteras entre 40 y 50 años y pretender, al mismo tiempo, que esa muestra sea representativa de toda la población (salvo que la única población que nos interese sea el conjunto de todas las mujeres argentinas solteras entre 40 y 50 años). El azar nos permite asegurar, entonces, hasta cierto punto confiable, la equidad de los estudios estadísticos.

Por último, no siempre debemos oponer casualidad con causalidad: la casualidad (o azar) no implica necesariamente la ausencia de causas (corrientemente, la expresión ocurrió por casualidad suele significar ocurrió sin ninguna causa o motivo). Si partimos de una cosmovisión causalista, cosmovisión en la cual se basa habitualmente la ciencia, cuando decimos que un determinado acontecimiento ocurrió por azar queremos solamente decir que está influenciado por una gran cantidad de factores causales, muchos de los cuales son desconocidos para nosotros y sin que prevalezca ninguno en especial.

c) Etapas de la estadística

Podemos resumir todo lo dicho indicando cuáles son las dos etapas de la investigación estadística: a) la estadística descriptiva, que busca seleccionar una muestra y luego describirla adecuadamente mediante medidas de posición y dispersión; b) la estadística inductiva o inferencial, que busca extender lícitamente nuestras conclusiones sobre la muestra a toda la población. Obviamente, el problema central de esta segunda etapa será saber hasta qué punto las medidas de la muestra describen también a la población. Si sabemos que la media de una muestra es 110, ¿hasta qué punto esta media será también aplicable a la población?

La estadística descriptiva debe preocuparse de si la muestra está o no bien descripta a partir de los datos de los individuos, mientras que la estadística inductiva se preocupará de establecer la representatividad de la muestra respecto de la población. Más generalmente, la primera es eminentemente descriptiva y no amplía mayormente nuestro conocimiento: mas bien lo resume mediante las medidas estadísticas. En cambio la segunda sí amplía nuestro conocimiento pues lo extiende (con cierto margen de error) a toda la población. De aquí que tenga un carácter predictivo, pues conociendo la muestra, puedo predecir hasta cierto punto confiable cómo habrá de ser la población.

Fuente - Autor: / Publicado en mercadeoypublicidad.com


Paute AQUÍ

Anuncios de Publicidad



Reg No.
6516 / 28 - Abr - 2007
No Visitas.
8515
   
QUIERO...
 
 
Adjuntos:
Ninguno


COMENTARIOS SOBRE: EL PAPEL DE LA ESTADISTICA EN LA INVESTIGACION.

 
Ustedes Recomiendan
Inicio de sesión - Usuarios - mercadeoypublicidad.com

Facebook - mercadeoypublicidad.com
twitter - mercadeoypublicidad.com
Gracias por compartirnos...
youtube - mercadeoypublicidad.com

 

   
SECCIONES SOBRE MERCADEO Y PUBLICIDAD:
Biblioteca
Multimedia / Comerciales / Spots
Eventos
Gente y opinión
Gráfica
Investigación
Legislación
Noticias
Artículos
HERRAMIENTAS PARA PUBLICISTAS Y MARKETERS:
Directorio especializado
Pauta
Presupuestos en linea / Cotice Online
Empleo
Publicar noticias, artículos, etc...
 
TIENDA DE PRODUCTOS  Y ARTÍCULOS PUBLICITARIOS:
Tiendamyp.com
 
 
ACERCA DE MERCADEOYPUBLICIDAD.COM:
Quiénes somos
Otros servicios
Políticas de privacidad
Términos de servicio
Políticas de pago
-----
FAQ - Preguntas Frecuentes
 
USUARIOS:
Actualizar datos
Renovar suscripción
 
-------
Contáctenos
Inicio
 
 
 
¿TE GUSTA ÉSTE PORTAL?
----
SÍGUENOS TAMBIEN EN...

MERCADEOYPUBLICIDAD.COM® es un portal de SRM Group E.U. Todos los derechos reservados. | Diseño: Doble Click / SRM Group - 2.000