¡Bienvenidos!
pitagoras Tresfonsitas

El dado

Al lanzar un dado bien construído las 6 caras son igualmente probables. Tenemos pues la siguiente distribución de probabilidad.

A la variable aleatoria X se la califica de discreta ya que el conjunto de valores C={1,2,3,4,5,6} es finito.

Propiedad. La suma de los valores de la Función de cuantía P(x) de probabilidad debe ser igual a la unidad.

Se conoce como Función de distribución F(x) a la función de probabilidad de los intervalos infinitos a la izquierda. Se trata de una probabilidad acumulada. Para el conjunto C={k}={1,2,3,4,5,6} se cumple: F(k)=P(k)+F(k-1).

Abriremos un libro de nombre "distribuciones de probabilidad" y en él, una hoja de nombre "dado". En el rango A3:A8 escribiremos los valores 1,2,...6. En la columna B (B3:B8) pondremos la función de cuantía de probabilidad:


=1/6

En la columna C construiremos la función de distribución. En C3 escribiremos:


=B3

En C4 pondremos:


=B4+C3

Esta última fórmula la copiaremos en la columna C.

Así quedará la hoja .

La media de una variable discreta es la suma de sus valores ponderados por las probabilidades.

La puntuación media del dado será pues: m=(1+2+3+4+5+6)*(1/6)=3,5

En la hoja de cálculo pondremos en D3:


=A3*B3

Luego copiaremos la fórmula en la columna D y, por último en D9 escribiremos:


=suma(D3:D8)

Así veremos la hoja .

Propiedades de la media

Propiedad1 Si multiplicamos una variable aleatoria por un valor a la media queda igualmente multiplicada.

Propiedad2 Si sumamos a una v. a. un valor b la media se incrementa en ese mismo valor.

La varianza de una variable discreta se obtiene restando la media al cuadrado de la suma del cuadrado de sus valores ponderados por las probabilidades.

En el caso del dado: (1+4+9+16+25+36)*(1/6)-12,25=2,92.

En la hoja escribiremos en E3:


=A3^2*B3

Despues copiaremos la fórmula en la columna E y la varianza aparecerá en E9 mediante:


=suma (E3:E8)-D9^2

Propiedades de la varianza

Propiedad1 Si multiplicamos una variable aleatoria por un valor a la varianza queda multiplicada por el cuadrado de a.

Propiedad2 Si sumamos a una v. a. un valor b la varianza no se modifica.

Llamaremos desviación típica a la raíz cuadrada positiva de la varianza.

La variable transformada al restar la media y, posteriormente, dividir por la desviación, se conoce como tipificada.

Propiedad La variable tipificada tiene media cero y varianza uno.

Ejemplo Vamos a considerar ahora un dado manipulado de modo que el seis tenga probabilidad 0,95; en tanto que las restantes caras sólo tienen probabilidad 0,01.

La hoja nos dará la función de distribución, así como la media (5,85) y la varianza(0,5275).

Variables continuas

Llamamos v.a. continuas a aquellas en las que el conjunto de valores es infinito no numerable. Esta variables no pueden tener probabilidad en un punto, es decir, la probabilidad es nula en cualquier punto.

En estas variables existe una Función de distribución definida de igual modo que en las v.a. discretas. Pero también se define una función de densidad f(x) relacionada con la Función de distribución.

Ejemplo. El resultado en euros de una operación comercial es una v.a. continua cuya función de densidad vale f(x)=1/4 en el intervalo (0,4).

La función de distribución F(x) será (x/4) en el intervalo (0,4).

La función de distribución permite calcular en las v.a. continuas la probabilidad de cualquier intervalo (a,b) mediante:


P(a,b)=F(b)-F(a)

Vamos a calcular la probabilidad de que el resultado de una operación esté por debajo de un euro:


P(0,1)=F(1)=1/4

Calculemos ahora la probabilidad de que el resultado de una operación esté comprendido entre uno y treseuros:


P(1,3)=F(3)-F(1)=3/4-1/4=1/2

La media será 2 euros.

La varianza valdrá 1,333.

La desviación típica será 1,15 euros. El resultado promedio de una operación comercial es pues igual a 2 euros, con una desviación típica de (mas menos) 1,15 euros.

La tarea que hemos realizado con herramientas del Análisis Matemático se puede realizar también de modo aproximado mediante una hoja de cálculo. Dividiremos el intervalo global de la v.a. en 10 intervalos, cuyos extremos situaremos en las columnas A y B. En la columna D calcularemos las "marcas de clase", es decir los puntos medios de los intervalos, y en la columna E los valores de la función de densidad para esas marcas de clase.

Las probabilidades de los intervalos se obtienen multiplicando la densidad por la amplitud del intervalo (es un cálculo del área de un rectángulo). La media y la varianza se obtienen por las fórmulas para v.a. discretas usando las marcas de clase como valores de la variable. Así quedará la hoja .

Para juzgar la calidad de la aproximación hay que tener en cuenta la suma de las probabilidades. Si esta se alejará del valor (uno) que debe tener habría que trabajar con un número mayor de intervalos (15, 20...). En nuestro caso la aproximación parece buena. Además conocemos la media exacta (2) y vemos que la media de la hoja coincide con ella. En cuanto a la varianza ( 1,32) es muy cercana al verdadero valor (1,33).

Ejemplo 2. Ahora vamos a suponer que el resultado en euros de una operación comercial es una v.a. continua cuya función de densidad vale f(x)=(4-x)/8 en el intervalo (0,4). La media vale 1,333 y la varianza 0,888

Colocando la nueva densidad en la hoja se obtienen unos resultados bastante aproximados a los teóricos.

Suma de v.a. independientes

Consideremos la v.a. suma de n v.a. independientes.

Propiedades.

Propiedad 1. La media de la v.a. suma de otras n v.a. independientes es la suma de las medias.

Propiedad 2. La varianza de la v.a. suma de otras n v.a. independientes es la suma de las varianzas.

Ejemplo. Vamos a considerar el lanzamiento de 3 dados y la v.a. suma de las puntuaciones.

En primer lugar hay que decir que se cumple la condición de independencia: en efecto, ninguno de los lanzamientos influye en los otros.

El conjunto de valores posibles es C={3,4,5.....16,17,18}.

Recordemos que la media y la varianza de la puntuación de un dado correcto eran 3,5 y 2,92. Así pues, la media será:


3,5+3,5+3,5=10,5 puntos

Y la varianza:


2,92+2,92+2,92=8,75

El conocimiento de la distribución de probabilidades lo vamos a hacer simulando lanzamientos de 3 dados mediante una macro.

La subrutina lee el nº de simulaciones a realizar e inicia un bucle. Luego otro bucle para los 3 lanzamientos basándose en un nº aleatorio comprendido en (0,1). Un tercer bucle asignará la puntuación en base a la función de distribución. Y luego se escribe la suma en la columna A, a partir de la 5ª celda. Si, por ejemplo, son 1000 lanzamientos tendríamos las sumas en el rango (A5:A1004).

La hoja puede calcularnos la distribución de frecuencias de estas 1000 puntuaciones. En el rango (B5:B20) escribimos las puntuaciones posibles: 3,4,...17,18. Como vamos a utilizar una fórmula matricial seleccionamos previamente el rango (C5:C20) que van a ocupar las frecuencias. Luego escribimos la fórmula:


=frecuencia(A5:A1004;B5:B19)

El segundo rango de la fórmula contiene los valores posibles, salvo el 18, es decir el último.

El operador irá obteniendo la frecuencia de valores "menor o igual que 3" (el 3); luego los que cumplen "mayor que 3 y menor igual que 4" (el 4); y así hasta los que cumplen "mayor que 17" (el 18). No hay que olvidar al pulsar ENTER, que deben mantenerse pulsadas SHIFT y CONTROL.

Luego en la hoja se pueden calcular las frecuencias relativas, que se pueden tomar como probabilidades y la media y la varianza.

La media obtenida mediante simulación (10,6) no difiere mucho de la que es teóricamente verdadera (10,5). Igual ocurre con la varianza: 8,9 frente a 8,75 que es la verdadera. Esto nos avala para decir que la simulación ha sido aceptablemente buena.

En cuanto al gráfico nos dice que la distribución tiene una forma acampanada.

Ejemplo 2. Vamos a simular ahora el lanzamiento de un dado manipulado de modo que el seis tenga probabilidad 0,95; en tanto que las restantes caras sólo tienen probabilidad 0,01. Recordemos que la media valía 5,85 y la varianza 0,5275.

Tendremos que cambiar nuestra macro de modo que se ajuste a la nueva función de distribución.

Si ejecutamos la macro "suma3dadoscargados" sobre la hoja podemos ver que el resultado dominante es el de suma 18 (3 seises). La media vale 17,673 (17,55 teóricamente) y la varianza 1,09 (1,58 es el verdadero valor).

Ejemplo 3. Ahora vamos a simular el lanzamiento de 50 dados. El conjunto de valores posibles es C={50,51,.....299,300}. Para mayor sencillez vamos a reagruparlo en intervalos de amplitud 10:


50 ≤ suma ≤60
60 < suma ≤70
.....................
280 < suma ≤290
290 < suma ≤300

La simulación se realiza con una macro que resulta de efectuar pequeñas modificaciones en la usada para 3 lanzamientos. Obviamente, cambiaremos 3 por 50. Además calcularemos media y varianza en la subrutina. Crearemos dos depósitos vacios: MEDIA Y VARIANZA. Después de cada tirada echaremos la suma obtenida a "MEDIA" y la suma al cuadrado a "VARIANZA". Al terminar divideremos "MEDIA" por el número de tiradas N. Para obtener la varianza habra que dividir "VARIANZA" por N y restarle la media al cuadrado.

Si ejecutamos la macro "suma50dados" sobre la hoja obtenemos una distribución acampanada.

La media obtenida por simulación (174,56) y la varianza(152,53) no están muy lejos de las teóricamente verdaderas (175 ; 145,83). Se puede decir que la "suma de 50 dados" se encuentra, por término medio, en 174,56 puntos, con una desviación típica de (mas menos) 12,35.

Ejemplo 4. Recordemos la operación comercial cuya función de densidad valía (1/4) en el intervalo (0;4). La función de distribución era F(x)=x/4 en el intervalo (0;4). La media valía 2 y la varianza 1,333.

Vamos a considerar 50 operaciones y la v.a. suma de los 50 resultados.

Hay que comenzar por precisar que la condición de independencia puede cumplirse o no. Si las decisiones se adoptan por 50 individuos en base a circunstancias personales, se puede asumir que los resultados serán independientes entre sí, pero si las decisiones se adoptan en función de circunstancias sociales (culturales, climáticas...) se puede entender que no serán independientes. Nosotros supondremos que son independientes.

El conjunto de valores posibles es C=(0;200).Vamos a reagruparlo en intervalos de amplitud 10:


0 ≤ suma ≤10
10 < suma ≤20
.....................
180 < suma ≤190
190 < suma ≤200

La macro que va a realizar las simulaciones es análoga a la que ha servido para el lanzamiento de los 50 dados, salvo en lo que se refiere a la simulación del resultado de cada operación. El nº aleatorio perteneciente al intervalo (0;1) se transforma en el resultado de la operación en euros, mediante la función inversa de la función de distribución.

Acabamos de ver que la función de distribución es y=x/4. La función inversa será x=4y. El resultado entonces será 4y siendo y el valor aleatorio del intervalo (0;1)

Si ejecutamos la macro "suma50rectangulares", en la hoja obtenemos una distribución con forma de campana.

La media obtenida por simulación (100,1) y la varianza(68,6) no están muy lejos de las teóricamente verdaderas (100 euros ; 66,666). Se puede decir que el resultado global para las 50 operaciones independientes se encuentra, en 100,1 euros por término medio, con una desviación típica de (mas menos) 8,3 euros.

Distribución normal

La distribución normal se caracteriza por sus parámetros media y varianza. La función de densidad tiene forma campaniforme. El máximo de la función de densidad se encuentra en x=m; es una función simétrica y presenta 2 puntos de inflexión a una desviación típica de la media.

Se conoce como distribución normal tipificada a aquella que tiene media cero y varianza uno.

En Excel es posible dibujar campanas de diferentes normales y así poder hacer comparaciones visuales. Comenzaremos por una de ellas, que servirá de referencia y cuyas media y varianza pondremos en las celdas A4 y A6 de la hoja.

En la columna A situaremos la escala horizontal: en A9 situaremos un valor a menos 5 desviaciones típicas de la media (cuya densidad será prácticamente nula). Luego con un salto igual a la décima parte de la desviación típica iremos hasta un punto situado a más 5 desviaciones típicas de la media (también con densidad nula). En la columna B calcularemos los correspondientes valores de la función de densidad.

En las columnas C y D pondremos otras 2 normales y calcularemos las densidades para la escala de referencia (conviene que las medias no se alejen demasiado de la media de referencia porque las densidades serían nulas).

Como vemos en el gráfico la N(0;1), es decir la campana de referencia está centrada en cero; la densidad máxima (para x=0) vale 0,4 y fuera del intervalo (-3; 3) las densidades son casi nulas.

La segunda campana, es decir la N(2;1) es igual que la de referencia, pero desplazada hasta centrarse en su media (2).

La tercera, es decir la N(0;3) esta centrada en 0, igual que la de referencia, pero su máximo es más bajo (0,133); en compensación es más abierta.

Cálculo de Probabilidades. Excel nos proporciona el valor de F(x), es decir de la función de distribución para cualquier normal.

Supongamos que el gasto semanal de una familia sigue la distribución Normal de media 200 y desviación típica 50. ¿Cuál es la probabilidad de que una familia gaste entre 150 y 300 euros?

En una hoja dedicada al "cálculo de probabilidades en normal" colocaremos en B4 la media y en C4 la des. típica. En B7 pondremos el extremo inferior del intervalo "a" y en C7 el superior "b".

En B10 obtendremos el valor F(a), mediante:


=DISTR.NORM(B7;B4;C4;verdadero)

El argumento "verdadero" se opone a "falso"; si hubieramos escrito "falso" en lugar de la función de distribución F(x) la hoja nos hubiera devuelto la función de densidad f(x).

En C10 obtendremos el valor F(b) y en C13 la probabilidad buscada P(a,b)=F(b)-F(a)= 0'9772-0'1587= 0'8185.

Cálculo de Cotas. Excel nos permite hacer la ruta inversa, es decir, nos proporciona un valor de la variable x, teniendo en cuenta la condición impuesta por un valor dado de F(x).

Continuamos con nuestro gasto familiar Normal de media 200 y desviación típica 50.

Distinguiremos 3 casos:

Caso 1. Hallar k de modo que se cumpla un valor F(k).

Caso 2. Hallar k de modo que se cumpla un valor 1-F(k).

Caso 3. Hallar k de modo que se cumpla un valor P(m-k ; m+k).

¿Cuál es la cota superior de gasto tal que la probabilidad de que no sea superada valga 0'95?

En una hoja dedicada al "cálculo de cotas en normal" colocaremos en B4 la media y en C4 la desv. típica. En B7 pondremos el valor de F(k). En B10 escribiremos:


=DISTR.NORM.INV(B7;B4;C4)

El resultado es 282,24 euros. La celda C13 nos ofrece simplemente una comprobación.

¿Cuál es la cota inferior de gasto tal que la probabilidad de que sea superada valga 0'95?

En nuestra hoja pondremos en B17 el valor de 1-F(k). En C17 obtendremos F(k):


=1-B17

En B20 tendremos el resultado: 117,76 euros.

¿Cuáles son las cotas que cumplan P(m-k;m+k)=0´9?

En nuestra hoja pondremos en B26 el valor de P(m-k;m+k). En C26 obtendremos F(m+k):


=B26+(1-B26)/2

En C29 obtendremos (m+k): 282,24 euros. En B29 escribiremos el valor de m-k:


=B4-C29+B4

Así llegamos al intervalo de 117,76 a 282,24 euros.

Propiedad. Sean x e y 2 v.a. normales e independientes. Se cumple que la diferencia también es normal de media igual a la diferencia de medias y de varianza igual a la suma de varianzas.

Una empresa hace de mediadora en el mercado del transporte. Vamos a suponer que la demanda diaria Y es normal de media 220 Tm con una desv. típica de 30 Tm. Por otra parte vamos a suponer que la oferta X es independiente de la demanda y normal de media 280 Tm y desv. típica de 3 Tm.

¿Cuál es la probabilidad de que un día cualquiera la demanda no pueda ser atendida?

La respuesta será:


P(X<Y)=P(X-Y < 0)

La diferencia X-Y también es normal de media 60 Tm y de varianza 909, es decir desv. típica 30,15 Tm. Por lo tanto, la probabilidad buscada es 0,023.

Teorema Central del Límite. La suma de n v.a. independientes y de igual media y varianza se puede aproximar por una normal de media la suma de las media y de varianza la suma de las varianzas.

El Teorema Central del Límite exige un mínimo de sumandos para poder utilizar la aproximación: este nivel podría ser n ≥30

Ejemplo. Consideremos la suma de 50 dados. Como hemos visto, cada dado tiene una media igual a 3,5 puntos y una varianza igual a 2,917. Por tanto la puntuación suma se puede aproximar por una normal de media 175 y de varianza 145,83.

Distribución binomial

Sea un "ensayo" en el que la probabilidad de obtener "éxito" es igual a p.

Sea una muestra de n ensayos (supondremos que hay independencia entre los ensayos) .

La v.a. z "nº de éxitos en n ensayos" tiene la distribución binomial de parámetros p (probabilidad de éxito) y n (nº de ensayos).

El conjunto de valores posibles es C={0,1,2.........n-1, n}

La función de cuantía de probabilidad expresada en forma recurrente es:


P(1)=P(0) (p/q) n
P(2)=P(1) (p/q) (n-1)/2

En general:


P(k)=P(k-1) (p/q)(n-k+1) /k

Un ejemplo básico de binomial lo encontramos en el lanzamiento de monedas: la probabilidad de "cara" (éxito) es p=0,5=q ; el nº de ensayos es el nº de monedas lanzadas y existe independencia entre las diferentes monedas. Así pues: la v.a z "nº de caras en 10 lanzamientos" es una binomial de parametros p=0,5 y n=10.

Vamos a trabajar este modelo de distribución en una hoja. En A4 escribiremos el nº de monedas. A partir de A6 pondremos los valores posibles. En B6 situaremos la probabilidad:


=DISTR.BINOM(A6;A$4;0,5;FALSO)

Luego copiaremos esta fórmula en la columna B. Como se puede observar la distribución presenta forma acampanada; la media vale 5 y la varianza 2,5.

Ejemplo. Vamos a suponer que en una empresa el 10% de las anotaciones contables tienen algún error; tendríamos pues que la probabilidad de "exito" (error contable) es p= 0,10.

Vamos a imaginar que un auditor selecciona una muestra de n=20 anotaciones; se entiende que se ha usado un procedimiento aleatorio que salvaguarda la independencia (no se ha cogido, por ejemplo, una serie de 20 anotaciones seguidas). Entonces, el nº de ensayos es n=20 y, por tanto, la v.a z, "nº de anotaciones erróneas" seguirá una binomial de parámetros p=0,5 y n=20.

En una hoja escribiremos en A4 el valor de "n" y en B4 el valor de "p". En el rango A6:A26 situaremos los valores posibles 0,1,......19,20.

En la columna B escribiremos las probabilidades según la fórmula recurrente. Así en B6 escribiremos:


=(1-B4)^A4

Y en B7:


=B6*(B$4/(1-B$4))*(A$4-A6)/A7

Luego copiaremos esta fórmula en la columna B. La distribución presenta una clara asimetría hacia la derecha y la media vale 2 en tanto que la varianza es 1,8.

Propiedad. Cuando en un fenómeno que sigue la distribución binomial b(p,n), p es muy pequeño y n es muy grande, se puede aproximar por la distribución de Poisson de media "np". El conjunto de valores posibles es infinito numerable: C={0,1,2...............}

Supongamos que una Compañía de Seguros tiene contratados un millón de pólizas de incendios en el hogar; la probabilidad de que un día cualquiera ocurra un incendio en un hogar es: 0,000003. Tenemos que la v.a z "nº de incendios día" se puede aproximar por la distribución de Poisson de media np=3.

En una hoja escribiremos en A4 el valor de la media y a partir de A6 escribiremos los valores posibles. En B6 escribiremos P(0):


=exp(-A4)

En B7 pondremos P(1):


=B6*A$4/A7

Luego copiaremos esa fórmula en la columna B. La distribución presenta una asimetría hacia la derecha.

¡Hola!
¡Un saludo!