14.9.07

Variables aleatorias y distribuciones: Estadística Para Dummies 7

Queridos lectores de la Caja. Antes que nada disculparme por haber estado un poco perdido últimamente, y más aún haber tenido tan descuidada esta sección. Pero volvamos a ella y con un apasionado tema: las leyes de probabilidad.

Vamos a definir un par de conceptos. Ya habíamos hablado de lo que era una variable, una característica de un determinado fenómeno. Hoy vamos a concretar un poco más.

Imaginaos una población, como puede ser la población de un país. Y ahora definamos un conjunto de sucesos, como por ejemplo que el color de pelo sea xi. Como todo el mundo tendrá el pelo de un color determinado, habrá una frecuencia determinada para cada color, ¿no?
Es decir, que en esa población, la probabilidad total se repartirá entre los distintos colores (o xi), o lo que es lo mismo, el color de pelo tiene una distribución de probabilidad determinada para esa población. Además, puede que esa distribución sea característica de esa población, por ejemplo habitantes de España, frente a la de otro país, como habitantes de Suecia. Son poblaciones distintas con distribuciones de probabilidad distintas.

En cambio puede ocurrir que la distribución de probabilidad del color de pelo de una población sea la misma que la de otra población, por ejemplo entre Suecia y Noruega (por poner un ejemplo). Es decir, ambas poblaciones siguen la misma distribución de probabilidad.

Claro que no podemos ir a todas las personas de un país para mirarle el color de pelo. Lo que hacemos es coger una muestra, un conjunto de personas para mirarle el color de pelo, y así intentar conocer la distribución de la población. Pero si lo cogemos una muestra del Sur puede que nos de unos resultados distintos que si la cogemos en el norte (ya hablamos del Sesgo). Aún así, si conseguimos una muestra lo suficientemente significativa, podemos llegar a una aproximación razonable de lo que pasa con la población. Conclusión: la verdadera distribución de probabilidad es algo que casi nunca conocemos con completa y absoluta precisión.

Matemáticamente es difícil trabajar con colores en vez de números, por eso, para poder trabajar matemáticamente con la distribución de probabilidad (ya que la estadística es, a fin de cuentas una rama de las matemáticas) necesitamos introducir otro concepto: variable aleatoria.

Imaginemos otra población, los resultados de tiradas sucesivas de un dado. En una tirada determinada pueden darse 6 sucesos elementales, que salga un 1, un 2, un 3... así hasta 6. Una variable aleatoria no es otra cosa que asignarle un número a cada suceso, así lo fácil es que cuando sale un 1, x=1, cuando sale un 2, x=2.... para los seis sucesos elementales. Pero no tiene por qué ser tan sencillo como esto. Hay sucesos que no son elementales, que son compuestos. Por ejemplo que salga par o impar (si es impar y=1, y si es par y=0). O si solo nos interesan los 6, el numero de veces que nos salen en tiradas sucesivas (z=número de 6 que salen cuando tiras un dado n veces). Es decir, cuando ocurre algo, darle un número (el que quieras)

Las variables aleatorias, como buenas variables que son, pueden ser contínuas o discretas, cuantitativas o cualitativas... Por ejemplo, en una encuesta que realizamos al alumnado de una clase, pueden estar muy satisfechos, satisfechos, normal, poco satisfechos y nada satisfechos. Una variable aleatoria puede ser que a muy satisfechos le damos un 4 y a nada satisfechos un 0, y el resto de grados sus valores correspondientes. Se trata de una variable Discreta, sólo puede tomar determinados números (no hay, por ejemplo, 4,3456324), cualitativa, ya que numéricamente no significa nada, y ordinal, porque aunque los números no significan nada, su orden sí.

Otro ejemplo sería la variable aleatoria longitud de la cola de los gatos. Así, cuando la cola mide 32,5134 cm, x=32,5134. Se trata de una variable continua cuantitativa.

Y todo lo que queráis inventar. Es así de sencillo, un posible suceso, un valor numérico. Veamos ahora como lo encajamos en la distribución de probabilidad.

Decíamos que en una distribución de probabilidad, a cada suceso se le asignaba una probabilidad. Es decir, a cada variable aleatoria le damos un valor entre 0 y 1. O lo que es lo mismo, la función de probabilidad es Función de la variable aleatoria. Pero no todas las funciones sirven. Sólo pueden dar valores positivos, ya que la probabilidad nunca es negativa, y el área total bajo la curva vale 1 (vamos, la integral desde menos infinito a infinito)

Ese área es la probabilidad de que se de un valor para la variable aleatoria entre los dos valores que determinan el área. Matemáticamente se usa una integral, que es una operación de cálculo infinitesimal que te da precisamente áreas entre dos extremos.

Se llama Función de Distribución a la función que te dice la probabilidad de que salga un valor menor a x. Y esta ecuación siempre es creciente (ya que sólo pueden añadirse probabilidades) y converge a 1. Pero bueno, esto es algo bastante abstracto...

Otra función es la de cuantía. Te dice la probabilidad de que salga justo x, cuando x es una variable aleatoria Discreta. Como ejemplo, los dados, la probabilidad de que salga un determinado valor es de 1/6, así que, matemáticamente

f(x)=1/6 cuando x=1, 2 ,3 ,4 ,5 ,6
f(x)=0 para el resto de valores de x

Eso es una función de cuantía (bastante sencillita).

Pero las variables continuas son un poco más latosas, ya que la probabilidad de un determinado suceso vale 0. ¿pero cómo es posible esto?: sencillo, cuando es continua, aunque sea finita, tendrá infinitos valores, (entre 0 y 1 hay infinitos números, ponte a jugar con los decimales...). Como la probabilidad total tiene que ser 1, y se tiene que repartir entre esos infinitos valores 1 entre infinito es 0.

Pero no os preocupéis que no nos quedamos con el c*** al aire, para las continuas tenemos funciones de densidad. que nos da una idea bastante exacta de cual puede ser la probabilidad de un determinado suceso.

Así que ya sabéis, el conjunto de probabilidades de unos sucesos podemos representarlos como funciones. Y aunque funciones hay de muchos tipos, la naturaleza podrá ser maravillosa, pero poco original, y por eso siempre se repiten unas funciones determinadas y bien estudiadas, que son las Leyes de Distribución. La más importante: la distribución normal o gaussiana, pero hay unas cuantas más, y esas serán objeto de futuras entradas.

Si ha quedado alguna duda, estaré encantado en satisfacerla. Puede que el post haya quedado más áspero de lo que hubiera querido... pero lo que viene a continuación es más entretenido.

20 comentarios:

rmcantin dijo...

Me dejas meter baza??

el gato cuantico dijo...

por supuesto, todo lo que digas será bien recibido.

Ya he dicho que esta sección ha sido mi exorcismo ante la estadística, así que todo lo que pueda significar aprender un poco más, pues mucho mejor

Anónimo dijo...

La función de cuantía no es tan sencillita, es la derivada Radon - Nikodym con respecto a la medida del conteo... A veces, cuesta calcularla...

el gato cuantico dijo...

Claro, todo puede ser tan complicado como quieras, e incluso más. Sin embargo, aquí intentamos quitarnos de encima tantas complicaciones para dar una visión un poco más elemental del asunto

Anónimo dijo...

restaurante san marcelino

consumibles informatica

Directorio de Blogs

posicionamiento web

juegos gratis wii

Portal Mascotas

accesorios movil

tienda informatica

posicionamiento seo

peliculas divx

empresa informatica

fotos de coches

trabajar en china

Anónimo dijo...

MASTER MBA

ESGUINCES MADRID

INMOBILIARIAS EN PLAYA SAN JUAN

Yoly dijo...

ABOGADOS - Despacho de abogados Asejuris, S.L.,

Yoly dijo...

###### diseñador web - diseñador web
######

Yoly dijo...

###### calderas de gas - calderas de gas
######

Anónimo dijo...

###### diseñador web - diseñador web
######

Anónimo dijo...

de verdad soy muy dummy y no sabiendo nada de est sigo sin entender ni p

f3rch0plyr dijo...
Este comentario ha sido eliminado por el autor.
f3rch0plyr dijo...
Este comentario ha sido eliminado por el autor.
f3rch0plyr dijo...
Este comentario ha sido eliminado por el autor.
f3rch0plyr dijo...
Este comentario ha sido eliminado por el autor.
f3rch0plyr dijo...
Este comentario ha sido eliminado por el autor.
Unknown dijo...

interesante:Fontaneros

Wendy - calderas de gas dijo...

que buen blog

Malules dijo...

muy buen artículo!

Anónimo dijo...

yo tengo una duda es un problema en si mira si existe una rifa donde solo puedes escojer 3 num del 1 al 9 y no se pueden repetir kuantas combinaciones existen en total? gracias