ESCUELA SUPERIOR DE INGENIERIA Y ARQUITECTURA

ACADEMIA DE MATEMATICAS TURNO MATUTINO

Ing. Carlos Alberto Macias Cordero




ESTADISTICA DESCRIPTIVA    

       ELEMENTOS DE PROBABILIDAD    

       VARIABLE ALEATORIA     

          DISTRIBUCIONES Y MUESTREO     




























ESTADÍSTICA


La parte mas antigua de la estadística está integrada por un conjunto de técnicas para la organización presentación gráfica y cálculo de cantidades "representativas" de un grupo de datos. Esta parte de la estadística recibe el nombre de estadística descriptiva.

Se pueden diferenciar dos definiciones de estadística

  1. La estadística es comunmente considerada como una colección de hechos numéricos expresados en terminos de una relación resumida, y que han sido recopilados a través de varias observaciones, o a partir de otros datos numéricos.

    Ejemplo
    "El coeficiente intelectual promedio de los niños de 5º de primaria es ....."

  2. La estadística puede ser igualmente considerada como un método para tratar datos numéricos

A menudo se desea analizar solo una parte de los datos y no el conjunto completo por lo que se toma solo una parte de ellos.

Población: conjunto completo de individuos, objetos, o medidas que poseen alguna característica común observable.

Muestra: es un subconjunto de la población que contiene las mediciones obtenidas mediante un experimento

El conjunto de observaciones que se toma de alguna fuente de observación con el objeto de obtener información respecto a ella se llama muestra, mientras que la fuente de estas observaciones se llama población

Tablas de Frecuencia

Un conjunto de observaciones puede hacerse más comprensible y adquirir mayor significado. Por medio de un arreglo ordenado puede lograrse una mayor sintesis, agrupando los datos. Para agrupar a un conjunto de observaciones, se selecciona un conjunto de intervalos contiguos, que no se traslapen, tales que cada valor en el conjunto de observaciones pueda colocarse en uno, y sólo uno, de los intervalos. Estos intervalos comúnmente se conocen con el nombre de intervalos de clase.
Una forma aproximada para obtener el número de intervalos de clase esta dada por la fórmula de Sturges
                                                   k=1+3.322(log10n)

Donde:
                   k=número de intervalos de clase
                   n=número de valores en el conjunto de datos bajo consideración

El número obtenido por la fórmula debe aumentarse o disminuirse segun convenga.

Otra cuestión que debe decidirse se refiere a la amplitud de los intervalos de clase. Aunque a veces es imposible, por lo general, los intervalos de clase deben de ser de amplitudes iguales.
Puede determinarse esta amplitud, dividiendo el recorrido entre k, el número de intervalos de clase. Simbólicamente, la amplitud del intervalo de clase está dada por:

                                                 W=R/k

Una vez mas, debe aplicarse el buen juicio y seleccionar una amplitud(por lo común, próxima a la dada por la ecuación anterior) que sea más conveniente.



HISTOGRAMA

La distribución de frecuencia agrupada se puede representar por medio de diagramas de diversas formas. El más común de ellos es el histograma, en el cual los intervalos de clase se marcan en el eje horizontal, y la frecuencia en un intervalo dado se mide en dirección vertical y se indica mediante una linea horizontal que abarca la amplitud del intervalo de clase.





POLIGONO DE FRECUENCIAS


Este polígono se puede obtener conectandopor medio de lineas rectas los puntos medios de la parte superior de los rectángulos expuestos en los histogramas(uniendo las marcas de clase)




CURVA DE FRECUENCIA ACUMULADA

La frecuencia acumulada también se puede representar graficamente. Los intervalos de clase se marcan en el eje horizontal como antes, y la frecuencia acumulada se representa como ordenada. La frecuencia acumulada también recibe el nombre de ojiva.




MEDIDAS DE TENDENCIA CENTRAL



Aunque la distribución de frecuencias tiene varias aplicaciones, hay muchos casos que requieren otros tipos de resúmenes de datos. Lo que se necesita en muchos casos es la habilidad para resumir los datos por medio de sólo unas cuantas medidas descriptivas. Las medidas descriptivas pueden calcularse a partir de los datos de una muestra o de una población.

Hay varios tipos de medidas descriptivas que pueden calcularse a partir de un conjunto de datos. Existen dos aspectos evidentes de los datos que se pueden caracterizar de manera simple, pero que proporcionan una descripción muy significativa de un conjunto de observaciones: la tendencia central y la dispersión.

La primera se mide por promedios, que sirven para describir el punto alrededor del cual se agrupan o caen los diversos valores observados. La medida de la dispersión evalúa la separación o apartamiento respecto al promedio.

Las tres medidas de tendencia central que más se utilizan son la media, la mediana y la moda.


MEDIA ARITMÉTICA

Este es el tipo de promedio más común, el cual a menudo se denomina simplemente, promedio o media.

La media es un valor tal que la suma de las desviaciones o diferencias entre las observaciones y dicho valor es cero; por tanto, equivale a la suma de las observaciones dividida entre el número de ellas.


Al calcular la media a partir de datos agrupados, se supone que todos los valores que caen en un intervalo de clase particular están localizados en el punto medio del intervalo. Para encontrar la media, se multiplica cada punto medio por la frecuencia correspondiente, se suman estos productos y se divide entre la suma de frecuencias.



MEDIANA

La mediana de una serie o conjunto de observaciones es la observación central(o de en medio)cuando aquellas se ordenan o jerarquizan segun su magnitud. El termino observación central se refiere a la distancia desde los extremos y no a los valores numéricos.

Ejemplo

       17,21,22,22,26,31,31,34

Siendo sus valores centrales 22 y 26. En este caso, la mediana es (22+26)/2=24.
Si no existiera el ultimo valor la mediana seria 22.
El primer paso para calcular la mediana a partir de datos agrupados es localizar el intervalo de clase en el que se encuentra. Esto se hace encontrando el intervalo de clase que contenga el valor n/2. En general, la mediana puede calcularse a partir de datos agrupados mediante la siguiente fórmula:

                                               mediana=Li+(j*(Ui-Li)/fi)

MODA

La moda de un conjunto de valores es aquel valor que ocurre con mas frecuencia. Si todos los valores son distintos, no hay moda; por otra parte, un conjunto de valores puede tener más de una moda.

Se ha definido la moda como el valor que ocurre con mas frecuencia. Cuando se designa la moda de datos agrupados, se refiere por lo general a la clase modal, donde la clase modal es el intervalo de clase con la frecuencia mas alta.



MEDIDAS DE DISPERSION

La dispersión de un conjunto de observaciones se refiere a la variedad que exhiben los valores de las observaciones.

   El recorrido o rango

Una manera de medir la variación en un conjunto de valores es calcular el recorrido. El recorrido es la diferencia entre el valor menor y el mayor en un conjunto de observaciones. Si se denota el recorrido por R, el valor mayor por XL y el menor Xs el recorrido sew calcula como sigue:

                                                             R=XL-Xs


   La varianza

Para calcular la varianza, se resta la media de cada uno de los valores, se elevan al cuadrado las diferencias y a continuación, se suman. Esta suma de las desviaciones de los valores respecto a su media(elevados al cuadrado), se divide entre el tamaño de la muestra , menos 1.

   Desviación estandar

La varianza representa unidades cuadradas y, por lo tanto, no es una medida de dispersión apropiada cuando se desea expresar este concepto en términos de las unidades originales. Para obtener una medida de dispersión en las unidades originales, simplemente se toma la raiz cuadrada de la varianza. El resultado se llama desviación estandar.

   Coeficiente de variación

Para diversos fines es conveniente expresar la dispersión de los resultados en forma porcentual, es decir, en terminos relativos y no absolutos. Para lograr lo anterior, calculamos la relación de la desviación estándar con respecto a la media, y se definirá el coeficiente de variación como:


                                                             C.V.=(desviación estandar*100)/media




MINIMOS CUADRADOS

Dada una muestra de n parejas (x,y) un primer paso es graficar los puntos en el plano xy, en algunos casos podemos ver que dichos puntos se encuentran muy cercanos a una recta y podemos ajustar a ojo esa recta y se llama la recta de regresión de la muestra y se puede utilizar para predecir los valores de Y para alguna X dada que nos interese.

No es muy conveniente trazar una recta a ojo, por lo tanto debemos tener un método matemático para ajustar rectas. Un procedimiento de este tipo que es muy usado es el método de "mínimos cuadrados"(Gauss), el cual puede formularse de la siguiente manera.

La recta debe ajustarse a los puntos dados de manera que la suma de los cuadrados de las distancias de estos puntos hasta la recta sea mínima, en donde la distancia se mide en dirección vertical.

La distancia de un punto (Xj,Yj) hasta la recta y=a+bx es |Yj-a-bXj| por lo tanto los cuadrados de las distancias de los n puntos tienen la sumatoria desde j=1 hasta n
q=(Yj-a-bXj)2 para que tenga un valor mínimo, la derivada parcial de q con respecto de a es cero y la parcial de q con respecto de b es cero. Derivando e igualando con cero y resolviendo el sistema de ecuaciones se obtiene:

ordenada al origen
pendiente de la recta




INDICE                             indice











ELEMENTOS DE PROBABILIDAD

Para hacer conclusiones acerca de una población a partir de una muestra, se deben desarrollar modelos matemáticos de las poblaciones. Para esto es necesaria la teoria de probabilidades. Un experimento aleatorio tendra las siguientes propiedades:

  1. El proceso se efectua a un conjunto bien definido de reglas
  2. Es de naturaleza tal que se repite o puede concebirse la repetición del mismo
  3. El resultado de cada ejecución depende de la casualidad y por lo tanto no puede predecirse un resultado único
Algunos ejemplos de experimentos aleatorios son los juegos de azar, tales como tirar un dado, lanzar una moneda, etc. Asi como experimentos técnicos tales como la selección aleatoria, inspección de tornillos tomados de una caja, medir la resistencia de probetas de concreto etc.

Al conjunto de todos los posibles resultados de un experimento se le llama el espacio muetral o de la muestra y se denota por S, a cada resultado se le llama elemento o punto de S.
Cuando se hacen mediciones el espacio muestral resulta infinito, por ejemplo la estatura de las personas, peso de los animales.

Un evento es una o mas de los resultados posibles del espacio muestral S y se denota por E. Un evento que no contiene elementos se denomina evento imposible o evento vacio, y se representa por la letra griega (fi).

Supongase que efectuamos un experimento n veces que en esta serie de n pruebas ocurre precisamente k veces un evento E. Entonces k se llama "frecuencia absoluta" o "frecuencia" y k/n es la frecuencia relativa de E en esa serie y se representa por f(E)=k/n y 0 < f(E) < 1, la frecuencia relativa de un evento es un número no negativo que no puede exceder a 1.

CONJUNTOS

Entenderemos por conjunto cualquier colección de conceptos o de objetos perfectamente especificada. Para identificar a un conjunto usaremos letras mayusculas.

Dos maneras de describir un conjunto:

La primera, útil si el conjunto tiene pocos elementos, consiste en listarlos dentro de un parentesis. La segunda consiste en escribir dentro del parentesis una regla que describa los elementos del conjunto.

Supongase que un curso tiene 8 alumnos:

A={Daniel, Mauricio, Fermin, Carlos, Guillermo, Antonia, Francisco, Veronica}

Usando la segunda opción se escribiria:

A={x|x es alumno del curso de estadística}

Lo que debe leerse como:"A es el conjunto de x, tales que x es alumno del curso de estadística". La barra vertical quiere decir "tal que".

En los casos anteriores los conjuntos tienen pocos elementos y es fácil listarlos. En algunas situaciones esto es imposible.

Considerese por ejemplo el conjunto de todos los numeros en el intervalo (0,1). Este conjunto es fácil representarlo con la segunda opción como sigue: A={x|0 < x < 1}.

Definición
Dos conjuntos A y B son iguales si y solo si tienen los mismos elementos.

Definición
Sean A y B dos conjuntos. Si todo elemento de A es también elemento de B, diremos que A es un subconjunto de B

Definición
Si A es subconjunto de B, pero A es diferente de B, diremos que A es un subconjunto propio de B.

DIAGRAMAS DE VENN

Los conjuntos, sus relaciones y las operaciones algebraicas que con ellos se realizan pueden representarse graficamente mediante lo que llamamos fiagramas de Vrnn-Euler, o simplemente diagramas de Venn.

En un diagrama de Venn el conjunto universal se representa por un rectangulo y los conjuntos dde interes por circulos (o figuras irregulares) dentro del rectángulo).



AXIOMAS DE PROBABILIDAD

Los axiomas aseguran que las probabilidades asignadas en un experimento pueden interpretarse como frecuencias relativas y que las asignaciones son consistentes con la comprensión intuitiva de las relaciones entre las frecuencias relativas.
Por ejemplo, si el evento A está contenido en el evento B, entonces se tendra que P(A)
Los axiomas no determinan las probabilidades, las probabilidades se asignan con base en nuestro conocimiento del sistema estudiado. Los axiomas permiten calcular con facilidad las probabilidades de algunos eventos a partir del conocimiento de las probabilidades de otros eventos.

La probabilidad es un número que se asigna a cada miembro de una colección de eventos a partir de un experimento aleatorio que satisface las siguientes propiedades.

Si S es el espacio muestral y E es cualquier evento en un exparimento aleatorio.

  1. La probabilidad del espacio muestral es igual a uno P(S)=1
  2. La probabilidad de un evento siempre esta entre cero y uno 0<=P(E)<=1
  3. Para dos eventos E1 y E2 con intersección igual a cero, P(E1 U E2)=P(E1)+P(E2)

Los axiomas y sus consecuencias se restringen a la asignación de probabilidades en una manera que permite interpretar las probabilidades como frecuencias relativas sin inconsistencias.


TECNICAS DE CONTEO

Estas técnicas son utiles al calcular la probabilidad de un evento, cuando es grande el número total de eventos posibles.

Factoriales.- Dado el entero positivo n, el producto de todos los número enteros desde n hasta 1 se llama factorial de n y se escribe n!

Los siguientes son algunos ejemplos factoriales:

                                                                                 10! = 10*9*8*7*6*5*4*3*2*1
                                                                                   5! = 5*4*3*2*1
                                                                                   2! = 2*1
y en general, n!=n(n-1)(n-2)(n-3)...1

Por definición 0!=1

Permutaciones

una permutación es un arreglo ordenado de objetos. Designemos por n el número de objetos distintos de los cuales se va a obtener un arreglo ordenado y por r el numero de objetos en el arreglo. El número de tales arreglos ordenados posibles se conoce como el número de permutaciones de n cosas tomadas r a la vez y puede escribirse como nPr. En general, nPr=n(n-1)(n-2)...(n-r+1).

También puede evaluarse nPr por medio de una fracción que contiene factoriales, como sigue:

                      nPr=n!/(n-r)!

Combinaciones

Una combinación es un arreglo de objetos sin tomar en cuenta el orden. El número de combinaciones de n cosas tomadas r a la vez se escribe como nCr

En general, se tendran r! permutaciones por cada combinación de n cosas tomadas r a la vez, o poniendolo de otra manera, en general, se tendran r! veces mas permutaciones que combinaciones. Es decir nPr=r!nCr

El número de combinaciones de n cosas tomadas r a la vez nCr=n!/r!(n-r)!

Supongamos que tenemos n objetos tales que hay n1 de una clase n2 de una segunda clase, ..., nk de una k-esima clase, en donde n1+n2+...+nk=n. Entonces el número de permutaciones de esos objetos está dada por n! / (n1!n2!...nk!)

PROBABILIDAD CONDICIONAL

A veces necesitamos encontrar la probabilidad de un evento B si se sabe que ha ocurrido un evento A. Esta probabilidad se llama probabilidad condicional de B dado A, y se representa por P(B/A). En este caso A sirve como espacio muestral nuevo(reducido) y la probabilidad es la fracción de P(A) que corresponde a la intersección de A y B.

Muestreo con reemplazo.- significa que el objeto que se extrajo al azar se coloca de nuevo en el conjunto dado, se mezcla completamente, y se procede a extraer al azar el siguiente objeto.

Muestreo sin reemplazo.- significa que el objeto que se extrajo se deja aparte.


REGLA DE BAYES


P(AK/B) = P(AK)*P(B/AK) / P(AJ)*P(B/AJ)

AJ se llaman "causas" y la regla de bayes puede considerarse como la formula para la probabilidad del evento B, que ha ocurrido, sea el resultado de la causa Ak. Esto es la probabilidad de que la causa Ak este actuando, bajo la hipotesis de que hemos observado B.


SOLO PARA MASOQUISTAS

Resistencia a la compresión de 80 ejemplares de prueba de una aleación aluminio-litio


105, 221, 183, 186, 121, 181, 180, 143, 97, 154, 153, 174, 120, 168, 167, 141, 245, 228, 174, 199, 181, 158, 176, 110, 163, 131, 154, 115, 160, 208, 158, 133, 207, 180, 190, 193, 194, 133, 156, 123, 134, 178, 76, 167, 184, 135, 229, 146, 218, 157, 101, 171, 165, 172, 158, 169, 199, 151, 142, 163, 145, 171, 148, 158, 160, 175, 149, 87, 160, 237, 150, 135, 196, 201, 200, 176, 150, 170, 118, 149.
1.-Resolver los siguientes puntos:

  1. Elaborar una tabla de distribución de frecuencias
  2. Dibujar su histograma
  3. Dibujar su polígono de frecuencias
  4. Trazar la curva de frecuencia acumulada
2.-Calcular la media, mediana, moda, la desviación estándar, el rango y el coeficiente de variación. A partir de los datos agrupados(a partir de la tabla de distribución de frecuencias) y a partir de los datos originales.Compara los resultados


3.-Calcular la media, mediana y la desviación estándar para los siguientes datos:

                     Intervalo de clase        frecuencia
                         10-19                            5
                         20-29                            19
                         30-39                            10
                         40-49                            13
                         50-59                            4
                         60-69                            4
                         70-79                            4

4.- Para determinar la relación que existe entre el esfuerzo normal y la resistencia al esfuerzo cortante del suelo, se llevo acabo un experimento con una caja de esfuerzo cortante, obteniéndose los siguientes resultados:

Esfuerzo normal x, KN/m2 11 13 15 17 19 21
Resistencia al cortante y,KN/m2 15.2 17.7 19.3 21.5 23.9 25.4

Encontrar y trazar la recta de regresión



5.-En el diagrama de Venn de la figura se muestran 3 eventos. Copie la figura y sombree la región que corresponda a cada uno de los eventos siguientes:

  1. Ac
  2. A intersección B
  3. (A intersección B) Union C
  4. (A intersección B)c Union C
  5. B Union C

6.-Se selecciona una muestra de tres calculadoras de una línea de fabricación y cada una de ellas se clasifica como defectuosa o aceptable. Sea que A, B y C denoten los eventos de que la primera, lasegunda y la tercera calculadora esté defectuosa, respectivamente.Describa el espacio muestral para este experimento con un diagrama de árbol.


    Describa cada uno de los eventos siguientes:
  1. A
  2. B
  3. A intersección B
  4. B Union C

7.-¿Cuántos números de 3 dígitos se pueden formar con los seis dígitos 2, 3, 5, 6, 7 y 9? Si no se permiten repeticiones
  1. ¿Cuántos de estos son menores de 400?
  2. ¿Cuántos son pares?
  3. ¿Cuántos son impares?
  4. ¿Cuántos son múltiplos de 5?

8.-¿De cuantas maneras se puede acomodar una reunión de 7 personas?
  1. En una fila de 7 sillas
  2. Alrededor de una mesa redonda

9.-¿De cuantas maneras 3 niños y 2 niñas pueden sentarse en una fila?
  1. ¿De cuantas maneras pueden sentarse si los niños se sientan juntos y las niñas también?
  2. ¿De cuántas maneras pueden sentarse en fila si justamente las niñas se sientan juntas?
10.-¿Cuántas señales diferentes, cada una de 6 banderas colgadas en una linea vertical, pueden formarse con 4 banderas rojas idénticas y 2 azules idénticas?

11.-¿De cuántas maneras puede escogerse un comité, compuesto de tres hombres y 2 mujeres, de un grupo de 7 hombres y 5 mujeres?

12.-¿De cuántas maneras puede un profesor escoger uno o más estudiantes de seis elegibles?

13.-¿De cuántas maneras diferentes pueden sacarse cuatro cartas de un paquete de 52?

14.-En una fundidora, se identifica un lote de 20 bloques de motor, de los cuales cinco contienen defectos internos. El comprador selecciona tres bloques al azar y prueba su dureza. Se aceptará el lote si no se identifican defectos. ¿Cuál es la probabilidad de que se acepte el lote?

15.-Se tiene una computadora con 16 puertos y supongase que en un momento dado cada puerto esta en uso, no se usa aunque su estado sea funcional o no funciona. ¿Cuántas configuraciones son posibles, en las que 10 puertos estén en uso, cuatro no se usen pese a que funcionan y dos más no funcionen?

16.-Un ingeniero de transito debe ajustar el tiempo de cambio de la luz en una serie de 10 semáforos de la calle principal de un pequeño poblado. En un momento dado, le semáforo puede estar con las luces roja, verde o ambar encendidas. ¿Cuántas variantes de colores de la serie de semáforos son posibles al principio? Si las luces se encienden aleatoriamente al inicio, ¿Cuál es la probabilidad de que inicialmente se tengan tres semáforos con luz roja, cinco con luz ambar y dos con verde?

17.-¿ En el coupé de un vagón de ferrocarril hay dos divanes opuestos, de 5 lugares cada uno. De 10 pasajeros, 4 desean sentarse cara a la locomotora , y tres de espaldas a ella; a los tres restantes les es indiferente cómo sentarse. ¿De cuantas maneras se pueden ubicar los pasajeros?

18.-En un comité sindical se han escogido 9 personas. De entre ellas hay que elegir al presidente, al vicepresidente, al secretario y al organizador cultural. ¿De cuantos modos se puede efectuar esto?

19.- La probabilidad de que una maquina produzca una pieza defectuosa es de 0.01 si el obrero que la maneja sigue con exactitud las instrucciones para operarla, y de 0.03 si no es así. Si el obrero sigue las instrucciones el 90% de las veces, ¿que porcentaje de las piezas producidas por la máquina serán defectuosas?

20.- En cierta universidad 20% de los hombres y 1% de las mujeres miden mas de dos metros de altura. Asimismo, 40% de los estudiantes son mujeres. Si se selecciona un estudiante al azar y se observa que mide mas de dos metros de altura, ¿Cuál es la probabilidad de que sea mujer?





INDICE                             indice

























VARIABLE ALEATORIA



Definición 1.- Cada vez que se determina alguna caracteristica de un grupo de individuos u objetos y esta toma diferentes valores, los cuales son resultado de la casualidad, se dice que la variable es una "variable aleatoria" o "variable estocastica" y se denota por X.

Definición 2.- Una distribución de probabilidades es una fórmula tabla o grafica mediante la cual se expresan todos los posibles valores de una variable aleatoria y sus probabilidades correspondientes.

Discretas.- Una variable aleatoria x y la distribución correspondiente son discretas si el número de valores para los cuales X tiene una probabilidad positiva es finito, o a lo mas numerable.

Si X es una variable aleatoria, entonces para cualquier número real existe la posibilidad P(X<=x) del evento. La probabilidad P(X<=x) depende del valor de x o sea es función de x, esta función se llama "Función de distribución" de X y se representa por F(x)=P(X<=x)

Si f(x) es la función de probabilidades de una variable aleatoria discreta entonces


Se dice que una variable aleatoria x y la distribución correspondiente son de tipo continuo o, mas brevemente continuas si la función de distribución correspondiente se puede representar segun la integral de la forma:



al integrando se le llama la densidad de probabilidades o mas brevemente densidad de las distribuciones en consideración.


SOLO PARA MASOQUISTAS



21.- Sea X=número de caras que aparecen cuando se arroja dos veces una moneda legal. Encontrar las probabilidades:
P(x=1), P(x=2), P(1=1), P(x>1) y P(0.5 < x < 10)


22.-Una caja contiene cuatro tornillos de cuerda derecha y 6 de cuerda izquierda. Se extraen aleatoriamente sin reemplazo dos tornillos. Sea X el número de tornillos de cuerda izquierda que se extraen. Encontrar las probabilidades: P(x=0), P(x=1)

23.- Encontrar y graficar la función de probabilidades de la variable aleatoria X=suma de los tres números que se obtienen al arojar tres dados legales.

24.- En cada caso dibuje la función de probabilidades y la función de distribución correspondiente.

      a) f(x)=1/n cuando x=1,2,...,n   y   f(x)=0 si no cumple lo anterior
      b) f(x)=0.1 cuando x=1,2,3 y 4   y   f(x)=0 otro caso
      c) f(x)=1/2x cuando x=1,2,...,y   y   f(x)=0 para x que no cumple lo anterior

25.- Sea la variable aleatoria X= número de pruebas Bernoulli hasta lograr éxito. Obtenga la media para su función de probabilidades

26.- La función de distribución para una variable aleatoria X es:

                                                        1-e-2x  x>=0
                                             F(x)=
                                                        0         x<0

a) Hallar la función de densidad
b) Hallar la probabilidad de que x > 2
c) Hallar la probabilidad de que -3 < x ≤ 4


27.- Se dibujan dos círculos concéntricos de radios uno y tres pulgadas dentro de un blanco circular de cinco pulgadas de radio. Un hombre recibe 10,5 o 3 puntos según pegue en el blanco dentro del círculo menor, en el anillo intermedio o en el anillo exterior respectivamente. Supongamos que el hombre da en el blanco con probabilidad de ½ (0.5) y, por tanto, es lo mismo de posible que pegue en un punto del blanco como en otro. Hallar el valor esperado E de los puntos que marca cada vez que dispara.

INDICE                            indice

























DISTRIBUCIONES DE PROBABILIDAD



Distribución binomial

Sea la variable aleatoria X igual al número de exitos que se obtienen al realizar n ensayos de bernoulli.

Consideremos A=éxito y B=fracaso

La probabilidad de éxito en un solo ensayo P(A)=p

La probabilidad de fracaso en un solo ensayo P(A)=1-p=q

La distribución definida por esta función de probabilidades se llama distribución binomial o de bernoulli


Distribución de Pascal

La distribución de Pascal es también conocida comúnmente como la distribución binomial negativa. Si en repetidos intentos independientes pueden resultar en un éxito con una probabilidad p y en un fracaso con una probabilidad q=1-p, entonces la distribución de probabilidad de la variable aleatoria X, es el número del intento en el cual ocurre el k-esimo éxito.

Distribución Geométrica

Supóngase que efectuamos un experimento ε y estamos interesados sólo en la ocurrencia o no ocurrencia de algún caso o suceso A. Supóngase que repetidamente efectuamos ε, que las repeticiones son independientes, y que en cada una de las repeticiones P(A)=p y P(B)=q permanecen constantes. Supóngase que repetimos el experimento hasta que A ocurre por primera vez. Definamos la variable aleatoria X como el número de repeticiones necesarias hasta incluir la primera ocurrencia de A.
Se dice que una variable aleatoria con una distribución de probabilidades:


tiene una distribución geométrica.


Distribución hipergeométrica

Para la distribución hipergeométrica el interés se centra en el cálculo de las probabilidades para el número de observaciones que caen en una categoría particular. Por otro lado, dicha distribución no requiere independencia y se basa en el muestreo llevado a cabo sin reemplazo. Las aplicaciones de la distribución hipergeométrica se encuentran en muchas áreas, con un uso considerable en el muestreo de aceptación, las pruebas electrónicas y el aseguramiento de la calidad. Es obvio que en muchos de estos campos la prueba se realiza a expensas de la pieza que se esta probando. Ésta se destruye y por lo tanto no puede reemplazarse en la muestra (muestreo sin reemplazo).



La distribución con función de probabilidades dada por la función anterior se llama distribución hipergeométrica.


Distribución de Poisson

Si x es el número de ocurrencias de algún evento al azar en un intervalo de tiempo o espacio(o algún volumen de materia) la probabilidad de que ocurra x está dada por la expresión:



Lambda es el parámetro de la distribución, es el número promedio (media) de ocurrencias del evento aleatorio en el intervalo(o volumen). El simbolo e es la constante 2.7183


Distribución exponencial

Se dice que una variable aleatoria continua x que toma todos los valores no negativos tiene una distribución exponencial con parámetro alfa positivo si su función de Probabilidades esta dada por:





Distribución normal

La curva que representa a f(x) se denomina "Curva Acampanada" y tiene las siguientes Características:

- Es simétrica respecto a la media f( µ + c) = f ( µ - c)
- La moda, media y mediana son iguales
- El área total bajo la curva por encima del eje x es una unidad cuadrada.






TECNICAS DE MUESTREO

En términos generales, existen dos tipos de muestreo, muestreo probabilístico y muestreo no probabilístico pero sólo para el muestreo probabilístico existen procedimientos estadisticamente seguros que nos permiten inferir, a partir de la muestra extraída, a la población de interes.

Definición: Una muestra probabilistica es una muestra extraida de una población, de tal manera que todo miembro de la población tenga una probabilidad conocida de ser incluido en la muestra.

De cualquier población finita de tamaño N, pueden extraerse cierto número de muestras diferentes de tamaño n. (Se hace esta afirmación bajo la hipotesis de que N es lo suficientemente grande como para requerir el muestreo. Como regla, por razones obvias las poblaciones pequeñas no se muestrean)

Definición: Si se extrae una muestra de tamaño n de una población de tamaño N, de tal manera que toda muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, la muestra recibe el nombre de muestreo aleatorio simple.

Una manera de seleccionar una muestra aleatoria simple es usar una tabla de números aleatorios.

ESTIMACION

Algunas cantidades que aparecen en las funciones de distribución, como p en la distribución binomial, mu y sigma en la distribución normal, se llaman parametros. Son de uso comun dos clases de estimaciones. Una se llama estimación puntual, ya que es un número(un punto en la escala numérica) que se calcula a partir de una muestra dada y sirve como una aproximación del valor exacto desconocido del parametro. La otra clase se llama intervalo de estimación, debido a que se trata de un intervalo.

Estimación puntual

Es natural considerar la media de una muestra como una aproximación de la media de la población correspondiente. De esta manera se tiene la estimación:



De la misma manera, la varianza de una muestra se puede considerar como una aproximación de la varianza de la población. En ciertas distribuciones mu aparece explicitamente como parámetro, y es, entonces, una restimación de un parámetro. Como ejemplos tenemos la distribución Normal y de Poisson.

Estimación de intervalo

Un estimador de intervalo es una regla para calcular dos numeros que crean un intervalo de que se está seguro que contiene el parametro de interes. El concepto de "bastante seguro" se puede cuantificar por medio de un concepto estadistico que se conoce como coeficiente de confianza

Definición: La probabilidad de que un intervalo de confianza contenga el parámetro estimado se llama coeficiente de confianza

HIPOTESIS Y PRUEBA DE HIPOTESIS

Hipótesis es una aseveración de una población elaborada con el propósito de poner a prueba para verificar si la afirmación es razonable (se usan datos).
En el análisis estadístico se hace una aseveración, es decirr, se plantea una hipotesis, despues se hacen las pruebas para verificar la aseveración









Errores de tipo I y de tipo II.

Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I.

Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se cometió un error de tipo II.

En ambos casos, se ha producido un juicio erróneo.

Para que las reglas de decisión (o no contraste de hipótesis) sean buenos, deben diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica, un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya el error más grave.

La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra que no siempre es posible.

SOLO PARA MASOQUISTAS



28.-Las ratas albinas utilizadas en estudios de la regulación hormonal de una vía metabólica reciben la inyección de un medicamento que inhibe la síntesis corporal de proteínas. La probabilidad de que la rata muera a causa del medicamento antes de que termine el experimento es de 0.2. Si se trata a 10 animales con el fármaco
a)¿Cuántos se espera que fallezcan antes del final del experimento?
b)¿ Cual es la probabilidad de que sobrevivan por lo menos ocho?
c)¿Te sorprendería que al menos cinco murieran durante el experimento? Explica tu respuesta, con base en la probabilidad de que ello ocurra

29.- Suelen requerirse estructuras de apoyo de peso en las minas subterráneas para soportar cargas adicionales durante las operaciones de extracción. A medida que las estructuras se ajustan al nuevo peso, ocurren desplazamientos de pequeña escala que llevan a la liberación de energía sísmica y acústica, el llamado ruido de roca. Esa energía es detectable con equipo geofísico especial. Suponga que en una mina específica el número promedio de ruidos de roca que se registran durante la actividad normal es de tres por hora. ¿Consideraría inusual que se detectaran más de 10 en un periodo de dos horas? Explique su respuesta a partir de la probabilidad correspondiente.

30.- La cantidad diaria en litros de café despachado por una maquina ubicada en la sala de espera de un aeropuerto es una variable aleatoria con una distribución uniforme con α=7 y β=10 encuentre la probabilidad de que en un determinado día la cantidad de café despachado por esta maquina sea:

a) cuando mucho 8.5 litros
b) mas de 7.3 litros pero menos de 9.6 litros
c) al menos 8.5 litros

31.- Supóngase que se sabe que en cierta colonia de la ciudad, el número de casas promedio que quedaron afectadas por el sismo de 1985 es de diez. Encontrar la probabilidad de que al elegir una colonia al azar:

a) Se tenga exactamente 10 casas afectadas
b) Se tenga más de cinco casas afectadas
c) Se tenga menos de diez casas afectadas
d) Se tenga entre ocho y doce casas afectadas, inclusive.

32.- Con 19 ejecuciones, ¿Cuánto debe valer p para tener una probabilidad de 0.10 de obtener por lo menos 3 éxitos?

33.- Si la probabilidad de que una viga de concreto falle por compresión es de 0.05. Obtener la probabilidad de que en una muestra de 50 vigas:

a) por lo menos tres fallen por compresión
b) ninguna falle por compresión
c) cuando más fallen cuatro por compresión

34.-El número de colonias de bacterias en determinado tipo de muestras de agua contaminada tiene una distribución de Poisson cuyo promedio es 2cm3

a) Si se seleccionan en forma independiente 4 muestras de 1cm3 de agua calcular la probabilidad de que por lo menos 1 muestra contenga 1 o mas colonias de bacterias
b) Cuantas muestras de 1cm3 de agua deben seleccionarse para alcanzar una probabilidad aproximada de 0.95 de ver por lo menos 1 colonia de bacterias

35.-Una caja de caramelos contiene 24 barras. El tiempo entre pedidos por barra se distribuye exponencialmente con media de 10 minutos. ¿Cuál es la probabilidad de que una caja abierta a las 8:00am se haya terminado al medio día?.

36.- Encuentre la probabilidad de que una variable aleatoria normalmente distribuida caiga en estos rangos:
     1.Una desviación estandar de su media
     2.Dos desviación estandar de su media


37.- Sea X una variable aleatoria distribuida normalmente con media de 10 y desviación estándar de 2, encuentre la probabilidad de que X esté entre 11 y 13.6

38.- Los estudios muestran que el uso de gasolina para automóviles compactos vendidos en Estados Unidos tiene una distribución normal, con una media de 25.5 millas por galón (mpg) y una desviación estandar de 4.5 mpg. ¿Qué porcentaje de automóviles compactos consigue 30 mpg o más?







INDICE                            indice







" LA TÉCNICA AL SERVICIO DE LA PATRIA "