22.11.06

La importancia de ser significativo: estadistica para Dummys

Decía Mark Twain que habian tres tipos de mentiras: las mentiras, las malditas mentiras y la estadistica. Sin duda esto puede ser cierto porque estamos acostumbrados a una avalancha de datos que los distintos grupos de poder se lanzan unos a otros. Una intención de voto, por ejemplo, puede ser entendida de igual forma por vencedores y vencidos. Sin embargo, eso no es verdadera ”Estadistica”, mas bien interpretaciones y valoraciones realizadas a partir de una encuesta (que puede haber estado mejor o peor diseñada).

Quizás por ello la estadistica ha tenido siempre muy mala aceptación pública. Recuerdo que mi profesor de filosofia decir que la estadística era como el bikini, muestra mucho pero oculta lo mas importante. Sin duda, el que como psicólogo no sepa la verdadera naturaleza de la campana de Gauss aplicada al Cociente Intelectual no lo hace lo suficientemente válido para emitir juicios respecto a la estadística, pero eso es tema aparte (cuántos profesionales habrá a los que un mal conocimiento de la estadistica les hace cometer numerosos errores).

Pero nos estamos desviando del tema. Empecemos por lo básico en cualquier materia del conocimiento, por la definición.

A la hora de medir algo, lo que sea, siempre encontramos variaciones. Estas variaciones hacen que sea difícil sacar conclusiones. Son lo bastante diferentes para que dos grupos de algo sean distintos o lo podemos considerar iguales? Cuál es el verdadero valor de esa medida si es que son lo mismo? Como medir muchas veces es caro, o ese algo es muy numeroso, cuántos algos tenemos que medir para que sea cierto? Así puede parecer un poco lioso. Pongamos nombres:

Tenemos un conjunto de “algos”, que puede ser, por ejemplo, pájaros. A eso lo vamos a llamar Población. La población de pájaros constituye la totalidad de pájaros que hay. Esto es la primera cosa que necesitamos, definir nuestra población, lo cual no suele ser demasiado difícil. También necesitamos algo que varíe en esa población, como la longitud del ala, color de plumaje, edad… eso son las variables.

Después tenemos que definir una pregunta, que es el motivo de nuestro experimento. Este es el punto mas importante, ya que si no sabemos lo que preguntamos, jamás sabremos lo que queremos, y consecuentemente no obtendremos nada concluyente. Parece obvio, pero muchas veces por no saber lo que se quiere se pierde mucho esfuerzo. Otra cosa que lo hace importante es que va a determinar el tipo de técnicas que vamos a emplear y cómo vamos a planificar nuestro estudio. Y sobre todo, cuál va a ser la naturaleza de nuestros resultados (qué es lo que esperamos de ellos). Así nos encontramos con distintos tipos de preguntas básicas, aplicando a nuestro pajarito:

  • Cual es la longitud del ala de nuestro pájaro? Aquí lo que nos interesa es saber propiedades de la población de pájaros. Este tipo de estadística es muy útil, conocida y aplicada. De hecho, muchas veces se aplica por defecto a los datos.
  • Hay diferencias entre la longitud del ala entre los pájaros de dos islas? Es decir, aquí tenemos dos conjuntos de pájaros y queremos saber si existe una diferencia significativa entre ellos en la longitud del ala.
  • Hay alguna relación entre la longitud del ala y la edad del pájaro? Aquí lo que buscamos es una relación entre dos variables, una la longitud y la edad.
  • No tenemos ni idea de lo que buscamos, pero queremos tener una idea de cómo están nuestros datos. Esto suele pasar cuando tenemos muchas variables y no sabemos como coger los datos. Suelen ser herramientas muy potentes pero requieren ciertos conocimientos previos de la materia para interpretar los resultados.


Con la pregunta lo que nos hacemos es una Hipótesis de trabajo. La Hipótesis es lo que queremos demostrar. En el caso del primer tipo de pregunta y la cuarta no suele ser tan importante decidirla, ya que no sabemos nada de los datos, y por lo tanto no tenemos nada que demostrar (cómo demuestras tu algo la media del ala del pájaro si no la conoces antes de hacer la medida).

A lo opuesto de nuestra Hipótesis es lo que se conoce como Hipótesis Nula. Si queremos saber si hay diferencias en el ala, pues la hipótesis nula será que no existen tales diferencias. La hipótesis nula suele coincidir con lo preestablecido, o con lo asumido. En la mayor parte de los casos suele ser del tipo: “aquí no ha pasado nada”.

Vale, tenemos población, tenemos pregunta y tenemos hipótesis de trabajo. Nos queda planificar nuestro experimento. Aquí no estoy exactamente hablando de qué cacharros nos tenemos que llevar.

Una cosa importante son las muestras. Una muestra es un conjunto de individuos dentro de la población. Como no podemos capturar a todos los pájaros pues seleccionamos unos cuantos para que nos de información de toda la población. Esta muestra ha de ser representativa, es decir, tiene que ser como la población pero en pequeño. Para ello debe de ser aleatoria. Es decir, no podemos capturar únicamente a las aves mas tontas que caen en la trampa, porque corremos el error de estar sesgando la población. (el sesgo es como se conoce a esa discriminación)

Ya, con nuestros datos bajo el brazo, escogemos que tipo de test queremos hacer. Este será en función del tipo de datos que tengamos y del tipo de respuesta que queramos. Pero eso ya lo dejaremos para otra entrada.

Atte:


El Gato Cuántico

3 comentarios:

Genesis dijo...

Mmmm, acabo de llegar a tu página a través de CPI,.. no la conocía pero suena muy interesante. La leeré a fondo en los próximos días.

Respecto a éste artículo la estadística es sumamente importante... ¿Recuerdas la frase de Rutherford?:

"Si tu experimento necesita estadística, deberías haber hecho uno mejor."

El mismo más tarde descubrió la estructura atómica con un modelo estadístico...
Lástima que se enseñe tan mal en las facultades...

Un Saludo

M dijo...

Muy buen post!

La estadística sin duda es de mucha ayuda pero cuando se la utiliza entendiéndola!

Doy clases de estadística y con mi colega nos esmeramos bastante para que los chicos le tomen el gusto (no es fácil!). También blogueamos sobre el tema para nuestros alumnos y para el que quiera, si quieren pasar a vistarnos estamos en: http://estadisticaestasahi.blogspot.com

Florencia

Anónimo dijo...

###### diseñador web - diseñador web
######