CURSO DE MATEMÁTICAS BÁSICAS ONLINE (ÁLGEBRA, GEOMETRÍA) |
Estadística |
Buscar : |
|
OBJETO E IMPORTANCIA DE LA ESTADISTICA
La estadística trata de interpretar los datos obtenidos de la observación de un fenómeno que se produce en los numerosos elementos de un conjunto, de modo de dar una apreciación correcta de dicho fenómeno. Desde la más remota antigüedad los pueblos hicieron uso de una estadística rudimentaria, pues en todos ellos se hicieron censos, de población, de propiedades, recopilación de datos para establecer la situación financiera del Estado, inventarios de bienes, controles de nacimientos y defunciones, recuento de minas, etc.
Pero sólo a fines del siglo XVII se organiza la estadística como una rama de la matemática aplicada y alcanza su verdadero desarrollo en el siglo XVIII, cuando se une al cálculo de probabilidad que le sirve de base y permite su aplicación en los estudios demográficos, en ciencias económicas, en biología, en astronomía, meteorología, psicología, problemas de comercio y de la industria. Entre los que contribuyeron al desarrollo de la estadística se pueden mencionar: Graunt, Fermat, Pascal, Bernouilli, en el siglo XVII; Achenwall, Laplace, en el XVIII; Poisson, Gauss, Quetelet, en el XIX; y Pearson, Galton y Charlier, en el siglo xx. En estas páginas, los temas de estadística que se estudian son: frecuencia, distribución de frecuencias, gráficas, parámetros de posición y de dispersión; selección de muestras.
Así, por ejemplo, si se trata de hacer una estadística sobre la estatura de los alumnos del 4º curso de una escuela, la población es el conjunto de todas las alturas de los alumnos del 4º curso de esa escuela. Si hay una división de 4º curso con un total de 30 alumnos, la población es el conjunto de las 30 alturas de esos alumnos. Las observaciones pueden referirse a un atributo cualitativo, corno por ejemplo, color, sexo, estado civil, etc., o a un atributo cuantitativo, que son aquellos en que cada observación tiene un valor expresado por un número, como por ejemplo: volumen; peso; altura; temperatura; etc. En el ejemplo anterior las observaciones son de tipo cuantitativo, pues cada observación está expresada por un número.
Así, en el ejemplo dado, si entre los 30 alumnos hay: 2 alumnos que tienen una altura de 1,62 m; 3 de 1,64 m; 7 de 1,66 m; 6 de 1,67m; 5 de 1,69m; 3 de 1,71m; 1 de 1,72m; 2 de 1,74 m y 1 de 1,77 m, la variable es el conjunto de valores: 1,62 m; 1,64 m; 1,66 m; 1,67 m; 1,69 m; 1,71 m; 1,72 m; 1,74 m y 1,77 m. Tabla de valores. Es cómodo, por lo sencillo que resulta su presentación, distribuir las observaciones en cuadros o tablas que permiten una rápida apreciación de los datos reunidos.
Así, los datos del ejemplo anterior pueden disponerse en una tabla donde a cada alumno se le asigna, en vez de su nombre, un número de 1 a 30 y a la derecha su estatura correspondiente. Disponiendo las estaturas de menor a mayor, la tabla es la siguiente: Al observar la tabla se ve inmediatamente cuál es la mayor estatura; cuál es la menor; cuál es la más común; etc.
Se puede hacer también una tabla reducida, donde se destaque el número de alumnos que tienen una misma estatura. . Así:
Así, la frecuencia de la estatura 1,69 m es 5.
En el ejemplo relativo a la estatura de los alumnos, la amplitud es: 1,77m-1,62m=15cm.
En el ejemplo relativo a la estatura de los alumnos, los intervalos de clase pueden ser tomados de 3 en 3 cm y, en ese caso, los intervalos de clase son: 1,62 -1,65; 1,65 -1,68; 1,68 - 1,71; 1,71 -1,74; 1,74 -1,77. Si en el ejemplo anterior, en lugar de considerar las alturas de los 30 alumnos de una división de 4º curso se consideran las estaturas de los 1835 alumnos de una escuela normal, incluyendo el curso de aplicación, el número de observaciones y la amplitud son mucho mayores. Así, por ejemplo, el alumno más bajo del curso de aplicación tiene una estatura de 1,08 m y el más alto del curso normal una estatura de 1,80 m . La amplitud de 1,08 m a 1,80 m se subdivide en intervalos de 3 en 3 cm, resultando 24 intervalos. Las observaciones figuran en la tabla siguiente: En este ejemplo la amplitud de cada intervalo es: 0,03m= 3cm Los extremos de cada intervalo de clase se llaman límite inferior y superior de la clase. En el intervalo 1,74 a 1,77 del ejemplo anterior, el límite inferior es 1,74 y el superior 1,77. Se entiende que en cada intervalo de clase están comprendidos todos los valores de la variable, mayores o iguales que el límite inferior y menores que el límite superior, excepto para el último intervalo, donde los valores son mayores o iguales que el límite inferior y menores o iguales que el límite superior. Así, en el ejemplo anterior, en el primer intervalo se destaca que hay 21 alumnos cuya altura es mayor o igual que 1,08 m y menor que 1,11 m y en el último intervalo se observa que hay 2 alumnos cuya estatura es mayor o igual que 1,77 m y menor o igual que 1,80m.
Así, la frecuencia del primer intervalo de clase es 21; la del segundo es 28; etc.
Así en el ejemplo anterior, como el número total de observaciones es 1835, la frecuencia relativa del intervalo 1,41 -1,44 es Esto significa que el 6 % del total de alumnos tiene una estatura comprendida entre 1,41 y 1,44 m .
El histograma consiste en considerar rectángulos que tienen por base el intervalo de clase y por altura la frecuencia en dicho intervalo. Así, para el ejemplo anterior, se tiene:
Así, para el ejemplo anterior se determinan: el punto A, que tiene por abscisa el punto medio del intervalo 1,08 -1,11 y por ordenada la frecuencia 21 de ese intervalo; el punto B, que tiene por abscisa el punto medio del intervalo 1,11 -1,14 y por ordenada la frecuencia 28 de ese intervalo; y así siguiendo para los demás intervalos. Además, se determina el punto P, que es el punto medio del intervalo anterior al primero de la tabla, y el punto Q, que es el punto medio del intervalo que sigue al último de la tabla. Obsérvese que los vértices de la poligonal, excepto los puntos P y Q, son los puntos medios de los lados superiores de los rectángulos del histograma, como se advierte claramente en la figura siguiente.
Esta curva puede adoptar distintas formas como se detalla gráficamente a continuación: 1º La llamada curva normal o de Gauss, en forma de campana, que es simétrica.
2º Conservando formas aproximadas a la anterior, pero asimétricas hacia la derecha y hacia la izquierda. 3º La forma llamada en J 4º La llamada en forma de U Medidas o parámetros característicos de un conjunto de observaciones o de una distribución de frecuencias. En general, en los trabajos de Estadística se tiene un cierto número de observaciones que figuran tanto en los cuadros como en las tablas pero que es difícil considerar en su totalidad, pues resulta confuso sacar una conclusión que caracterice el fenómeno. Por ello, es necesario reemplazar todos estos datos por un número o una cantidad que los representa y que suelen llamarse medidas o parámetros característicos. Estos parámetros característicos se clasifican en dos grupos: medidas o parámetros de posición y medidas o parámetros de dispersión. Medidas o parámetros de posición. Los más comunes son: el promedio o media aritmética; la mediana y la moda.
Así, si las temperaturas mínimas medias en la ciudad de Santiago de Chile durante los 12 meses de un año han sido: el promedio o media aritmética es: En general, si se tienen las N observaciones: x1; x2 ; x1 ... xN el promedio se designa por Mx o por x. Luego: La suma de los datos suele indicarse abreviadamente utilizando un signo llamado sumatoria, que es la letra sigma mayúscula del alfabeto griego: ∑ Para indicar la suma:x1+ x2 + x1 ...+ xN mediante este signo, se escribe: que significa la suma de todos los términos que resultan cuando toma todos los valores de 1 hasta N. Cuando no haya lugar a dudas, la suma de todas las observaciones puede indicarse abreviadamente: 2º Si las observaciones están condensadas en una tabla de frecuencias, el promedio o media aritmética se obtiene así: Se suman los productos del valor medio del intervalo de clase por la frecuencia correspondiente y se divide por la suma de las frecuencias o sea el número de observaciones. Sea la siguiente tabla de frecuencia que se refiere a las calificaciones obtenidas en un examen por los alumnos de una división. El promedio o media aritmética se obtiene así: el valor medio del 1er. intervalo 0-2 es 1 y su frecuencia 2; luego, su producto es: 1 X 2 el valor medio del 2º intervalo 2 -4 es 3 y su frecuencia 5; luego, su producto es: 3 X 5 el valor medio del 3er. intervalo 4 -6 es 5 y su frecuencia 14; luego, su producto es: 5 X 14 el valor medio del 4º intervalo 6 -8 es 7 y su frecuencia 8; luego, su producto es: 7 X 8 el valor medio del 5º intervalo 8 -10 es 9 y su frecuencia 6; luego, su producto es: 9 X6 Además, como la suma de las frecuencias o sea el número total de observaciones, es: 2 +5 +14 +8 +6, el promedio o media aritmética es: En general, si los valores medios de los n intervalos son z1; z2; ... ; zn y sus frecuencias correspondientes: f1; f2; ... ; fn, es: Aplicando sumatoria, la expresión anterior puede escribirse: Dado que la sumatoria es el número total N de observaciones, la fórmula anterior puede escribirse: .En la práctica el cálculo del promedio o media aritmética cuando se tiene una tabla de frecuencias se dispone así: El promedio o media aritmética es uno de los parámetros mas utilizados en estadística por ser muy fácil calcularlo.
Así, por ejemplo, si se hacen 11 observaciones y se ordenan los valores de la variable de menor a mayor, la mediana es el valor de la variable que corresponde al 6º lugar. Si los valores de la variable x son: Si el número de valores de la variable es par, la mediana es el valor de la variable, promedio entre los dos valores centrales. Así, si se hacen 8 observaciones y se ordenan de menor a mayor los valores de la variable, la mediana es el valor de la variable, promedio entre el 4º y 5º valor. Si los valores de la variable x son: A diferencia de la media aritmética, la mediana tiene la ventaja de no estar influida por un valor extremo de la variable. Así, en el primer ejemplo, mientras la mediana es 8, su promedio es 110/11 = 10 Gráficamente: Sobre el promedio se ve que incide notablemente el valor alejado de la variable. Se observa que si se reemplaza el valor 28 de la variable, por un valor más alejado, por ejemplo 39, la mediana sigue siendo 8, pero el promedio es ahora 11. Es de hacer notar que en algunos casos la mediana y el promedio o media aritmética son coincidentes. 2º Si las observaciones están condensadas en tablas de frecuencia, para determinar la mediana se procede en dos pasos: 1. Se determina el intervalo de clase en el cual está la mediana, es decir, el primer intervalo para el cual la frecuencia acumulada es mayor o igual a la mitad del número de observaciones; 2. Se determina el punto de ese intervalo que corresponde a la mepiana, aplicando la fórmula: donde: le es el límite inferior del intervalo de clase a que pertenece la mediana; N/2 es la mitad del número total de observaciones; Fle es la frecuencia acumulada hasta el intervalo de la clase mediana; h es la amplitud de ese intervalo EJEMPLO: Si se completa con las frecuencias acumuladas la tabla las calificaciones obtenidas en un examen por los alumnos de una división, se tiene: La mediana está en el intervalo 4 -6, pues es el primer intervalo cuya frecuencia supera la mitad del número de observaciones: 35/2 = 17,5 Para determinar exactamente la mediana se aplica la fórmula dada anteriormente, teniendo en cuenta que en este caso:
Es decir: el primer cuartil Q1 es el valor de la variable, mayor que la primera cuarta parte de los valores de la variable y menor que las tres cuartas partes restantes. El segundo cuartil Q2 coincide con la mediana. El tercer cuartil Q3, es un valor de la variable mayor que los de las primeras tres cuartas partes y menor que la cuarta parte restante. Así, para los siguientes valores de la variable x, se tiene que:
Así, recordando la tabla de estaturas de los alumnos de 4º curso de una división la moda es pues a ese valor de la variable corresponde el mayor número de casos, en este ejemplo: 7. 2º Cuando las observaciones están condensadas en intervalos de clase, se puede deducir inmediatamente en qué intervalo está la moda; para hacerlo exactamente se requiere una fórmula especial. Si se tiene la curva de distribución, la moda está dada por el valor de la variable al que corresponde mayor ordenada. Si la curva de distribución es simétrica, la media aritmética, la mediana y la moda coinciden. Por ejemplo: En cambio si no es simétrica no son coincidentes.
Así, en el ejemplo anterior, la observación que corresponde al valor 15 de la variable tiene una desviación 15 - 10 = 5. Del mismo modo, la observación que corresponde al valor 4 de la variable tiene una desviación 4 - 10 = -6. Considerando el conjunto de todos los valores de la variable, las medidas de dispersión más comunes son: la desviación media o desviación promedio; la varianza y la desviación standard.
Para calcularla, se suman los valores absolutos de las desviaciones o dispersiones y se divide por el número de observaciones. En general, la desviación media se designa por Md y de acuerdo con la definición es: EJEMPLO: Sea el ya estudiado problema de la temperatura mínima en la ciudad de Santiago de Chile, cuyo promedio o media aritmética es, según se calculó, 11,4° C . La suma de los valores absolutos de las desviaciones es: 2º Cuando las observaciones están agrupadas en clases, la fórmula de la desviación media es: donde fi es la frecuencia correspondiente a cada intervalo y ti el valor medio de ese intervalo. EJEMPLO: Sea, por ejemplo, el ya citado referente a las calificaciones obtenidas por los alumnos de una división cuyo promedio, es, según se calculó: 5,6≈ 6.
EJEMPLO: Sea el ya mencionado problema de la temperatura mínima en la ciudad de Santiago de Chile
Al designar con σx la desviación standard se comprende que a la varianza se la designe por σ2 . Si las observaciones están condensadas en clases la fórmula de la varianza es: y en consecuencia la desviación standard, es: EJEMPLO: Sea, por ejemplo, el ya citado referente a las calificaciones obtenidas en un examen por los alumnos de una division donde el promedio o media aritmetica es 6. la varianza es: la desviacion standard es: De todas las medidas de dispersion la mas usada es la desviacion standard. Una desviación standard pequeña significa que los datos estan concentrados muy cerca del promedio o media aritmetica.
El promedio o media aritmetica es el valor de un elemento representativo del conjunto de elementos, es decir que caracteriza ese conjunto de elementos; la adopcion de esta media aritmetica como tal es aproximada; la aproximacion es mayor cuanto mas pequeña es la desviacion standard. Por lo tanto, cuanto menor es la desviacion standard tanto mayor es la confianza que se puede tener en la media aritmetica.
Si la curva representativa del fenomeno que se estudia es simetrica y se considera un intervalo que tiene por extremos la media aritmetica menos 1 desviacion standard y la media aritmetica mas 1 desviacion standard, dentro de ese intervalo esta comprendido el 68 % de las observaciones. Si el intervalo tiene por extremos: Mx - 2 σx y Mx+ 2 σx es decir, se consideran 2 σx a la izquierda y a la derecha del promedio, dentro de ese intervalo esta comprendido el 95 % de las observaciones. Si el intervalo es:Mx - 3 σx y Mx+ 3 σx dentro de ese intervalo esta comprendido el 99 % de las observaciones. Muestras. Cuando el numero de elementos en los que hay que hacer una observacion es muy grande, es dificil hacer intervenir a todos ellos para un calculo estadistico, y entonces se utiliza solamente una parte o subgrupo.
Ahora bien, estas muestras deben ser representativas del total, es decir, las medidas de posicion y dispersion que se obtengan para ella deben aproximarse suficientemente a los correspondientes promedios del total. Se comprende que estas muestras deben estar bien elegidas porque sino se puede llegar a resultados contradictorios. Las indicaciones para la eleccion de las muestras son complicadas y no se tratan aqui pues superan el nivel de estas páginas .
|
Connection failed: php_network_getaddresses: getaddrinfo failed: Name or service not known |