CURSO DE MATEMÁTICAS BÁSICAS ONLINE (ÁLGEBRA, GEOMETRÍA)

 


**

Estadística


 

www.sapiensman.com


Curso de Matemáticas

 

 

 


  • ¿Qué buscas? :
Búsqueda personalizada

 

 

OBJETO E IMPORTANCIA DE LA ESTADISTICA

La estadística trata de interpretar los datos obtenidos de la observación de un fenómeno que se produce en los numerosos elementos de un conjunto, de modo de dar una apreciación correcta de dicho fenómeno.

Desde la más remota antigüedad los pueblos hicieron uso de una estadística rudimentaria, pues en todos ellos se hicieron censos, de población, de propiedades, recopilación de datos para establecer la situación financiera del Estado, inventarios de bienes, controles de nacimientos y defunciones, recuento de minas, etc.

De ahí el nombre de Estadística, que tiene la misma acepción que en el lenguaje corriente, tanto que estadística significa "disciplina que estudia todo lo perteneciente al Estado".

Pero sólo a fines del siglo XVII se organiza la estadística como una rama de la matemática aplicada y alcanza su verdadero desarrollo en el siglo XVIII, cuando se une al cálculo de probabilidad que le sirve de base y permite su aplicación en los estudios demográficos, en ciencias económicas, en biología, en astronomía, meteorología, psicología, problemas de comercio y de la industria.

Entre los que contribuyeron al desarrollo de la estadística se pueden mencionar: Graunt, Fermat, Pascal, Bernouilli, en el siglo XVII; Achenwall, Laplace, en el XVIII; Poisson, Gauss, Quetelet, en el XIX; y Pearson, Galton y Charlier, en el siglo xx.

En estas páginas, los temas de estadística que se estudian son: frecuencia, distribución de frecuencias, gráficas, parámetros de posición y de dispersión; selección de muestras.

Población o universo. Dado que la finalidad de la estadística es el estudio de las observaciones de los fenómenos que se refieren a un conjunto, ya sea de individuos, de animales, de objetos, de medidas, de producciones, de cosechas, de acontecimientos, o de sucesos, a cada uno de los conjuntos de las observaciones de esos fenómenos, en estadística se le da el nombre de población, porque las primeras estadísticas se establecieron para grupos de personas que constituyen una población.

Así, por ejemplo, si se trata de hacer una estadística sobre la estatura de los alumnos del 4º curso de una escuela, la población es el conjunto de todas las alturas de los alumnos del 4º curso de esa escuela.

Si hay una división de 4º curso con un total de 30 alumnos, la población es el conjunto de las 30 alturas de esos alumnos.

Las observaciones pueden referirse a un atributo cualitativo, corno por ejemplo, color, sexo, estado civil, etc., o a un atributo cuantitativo, que son aquellos en que cada observación tiene un valor expresado por un número, como por ejemplo: volumen; peso; altura; temperatura; etc.

En el ejemplo anterior las observaciones son de tipo cuantitativo, pues cada observación está expresada por un número.

Variable. Cuando una observación es cuantitativa, el conjunto de todos los valores que puede tornar la característica o fenómeno observado se llama variable.

Así, en el ejemplo dado, si entre los 30 alumnos hay: 2 alumnos que tienen una altura de 1,62 m; 3 de 1,64 m; 7 de 1,66 m; 6 de 1,67m; 5 de 1,69m; 3 de 1,71m; 1 de 1,72m; 2 de 1,74 m y 1 de 1,77 m, la variable es el conjunto de valores: 1,62 m; 1,64 m; 1,66 m; 1,67 m; 1,69 m; 1,71 m; 1,72 m; 1,74 m y 1,77 m.

Tabla de valores. Es cómodo,  por lo sencillo que resulta su presentación, distribuir las observaciones en cuadros o tablas que permiten una rápida apreciación de los datos reunidos.

Así, los datos del ejemplo anterior pueden disponerse en una tabla donde a cada alumno se le asigna, en vez de su nombre,  un número de 1 a 30 y a la derecha su estatura correspondiente.

Disponiendo las estaturas de menor a mayor, la tabla es la siguiente:

Al observar la tabla se ve inmediatamente cuál es la mayor estatura; cuál es la menor; cuál es la más común; etc.

Se puede hacer también una tabla reducida, donde se destaque el número de alumnos que tienen una misma estatura. . Así:

Frecuencia. El número de veces que se repite cada estatura se llama frecuencia de la misma.

Así, la frecuencia de la estatura 1,69 m es 5.

Amplitud de la variable, La diferencia entre el valor mayor de la variable y el valor menor se llama amplitud de la variable.

En el ejemplo relativo a la estatura de los alumnos, la amplitud es: 1,77m-1,62m=15cm.

Intervalo de clase. Cuando el número de observaciones es muy grande, tabular todos los datos resulta largo y poco claro; por ello se condensan, subdividiendo la amplitud de la serie de observaciones en intervalos iguales, cada uno de los cuales se llama intervalo de clase.

En el ejemplo relativo a la estatura de los alumnos, los intervalos de clase pueden ser tomados de 3 en 3 cm y, en ese caso, los intervalos de clase son: 1,62 -1,65; 1,65 -1,68; 1,68 - 1,71; 1,71 -1,74; 1,74 -1,77.

Si en el ejemplo anterior, en lugar de considerar las alturas de los 30 alumnos de una división de 4º curso se consideran las estaturas de los 1835 alumnos de una escuela normal,  incluyendo el curso de aplicación, el número de observaciones y la amplitud son mucho mayores. Así, por ejemplo, el alumno más bajo del curso de aplicación tiene una estatura de 1,08 m y el más alto del curso normal una estatura de 1,80 m .

La amplitud de 1,08 m a 1,80 m se subdivide en intervalos de 3 en 3 cm, resultando 24 intervalos.

Las observaciones figuran en la tabla siguiente:

En este ejemplo la amplitud de cada intervalo es:

0,03m= 3cm

Los extremos de cada intervalo de clase se llaman límite inferior y superior de la clase.

En el intervalo 1,74 a 1,77 del ejemplo anterior, el límite inferior es 1,74 y el superior 1,77. Se entiende que en cada intervalo de clase están comprendidos todos los valores de la variable, mayores o iguales que el límite inferior y menores que el límite superior, excepto para el último intervalo, donde los valores son mayores o iguales que el límite inferior y menores o iguales que el límite superior.

Así, en el ejemplo anterior, en el primer intervalo se destaca que hay 21 alumnos cuya altura es mayor o igual que 1,08 m y menor que 1,11 m y en el último intervalo se observa que hay 2 alumnos cuya estatura es mayor o igual que 1,77 m y menor o igual que 1,80m.

Frecuencia de un intervalo de clase. Se llama frecuencia de un intervalo de clase al número de veces que la variable toma valores comprendidos en ese intervalo de clase.

Así, la frecuencia del primer intervalo de clase es 21; la del segundo es 28; etc.

Frecuencia relativa. Se llama frecuencia de un intervalo al cociente entre la frecuencia de ese intervalo y el número total de observaciones.

Así en el ejemplo anterior, como el número total de observaciones es 1835, la frecuencia relativa del intervalo 1,41 -1,44 es

Esto significa que el 6 % del total de alumnos tiene una estatura comprendida entre 1,41 y 1,44 m .

Histograma.· Cuando las observaciones figuran condensadas en intervalos de clase, las gráficas que se utilizan para representarlas son los histogramas y los polígonos de frecuencia.

El histograma consiste en considerar rectángulos que tienen por base el intervalo de clase y por altura la frecuencia en dicho intervalo. Así, para el ejemplo anterior, se tiene:

Polígono de frecuencia. El polígono de frecuencia es la gráfica lineal que se obtiene así: se determinan los puntos que tienen por abscisa el punto medio de cada intervalo de clase y por ordenada la frecuencia correspondiente al mismo y, además, el punto medio del intervalo que antecede al primero y el que sigue al último. Se unen ordenadamente los puntos así obtenidos y resulta una poligonal que se llama polígono de frecuencia.

Así, para el ejemplo anterior se determinan: el punto A, que tiene por abscisa el punto medio del intervalo 1,08 -1,11 y por ordenada la frecuencia 21 de ese intervalo; el punto B, que tiene por abscisa el punto medio del intervalo 1,11 -1,14 y por ordenada la frecuencia 28 de ese intervalo; y así siguiendo para los demás intervalos.

Además, se determina el punto P, que es el punto medio del intervalo anterior al primero de la tabla, y el punto Q, que es el punto medio del intervalo que sigue al último de la tabla.

Obsérvese que los vértices de la poligonal, excepto los puntos P y Q, son los puntos medios de los lados superiores de los rectángulos del histograma, como se advierte claramente en la figura siguiente.

Si el número de observaciones es muy grande y la amplitud de los intervalos de clase muy pequeños, el polígono de frecuencia se aproxima a una curva que recibe el nombre de curva de distribución de frecuencia.

Esta curva puede adoptar distintas formas como se detalla gráficamente a continuación:

1º La llamada curva normal o de Gauss, en forma de campana, que es simétrica.

2º Conservando formas aproximadas a la anterior, pero asimétricas hacia la derecha y hacia la izquierda.

3º La forma llamada en J

4º La llamada en forma de U

Medidas o parámetros característicos de un conjunto de observaciones o de una distribución de frecuencias. En general, en los trabajos de Estadística se tiene un cierto número de observaciones que figuran tanto en los cuadros como en las tablas pero que es difícil considerar en su totalidad, pues resulta confuso sacar una conclusión que caracterice el fenómeno. Por ello, es necesario reemplazar todos estos datos por un número o una cantidad que los representa y que suelen llamarse medidas o parámetros característicos.

Estos parámetros característicos se clasifican en dos grupos: medidas o parámetros de posición y medidas o parámetros de dispersión.

Medidas o parámetros de posición. Los más comunes son: el promedio o media aritmética; la mediana y la moda.

PROMEDIO O MEDIA ARITMÉTICA. 1º Se llama promedio o media aritmética al cociente entre la suma de las observaciones y el número de observaciones.

Así, si las temperaturas mínimas medias en la ciudad de Santiago de Chile durante los 12 meses de un año han sido:

el promedio o media aritmética es:

En general, si se tienen las N observaciones: x1; x2 ; x1 ... xN el promedio se designa por Mx o por x.

Luego:

La suma de los datos suele indicarse abreviadamente utilizando un signo llamado sumatoria, que es la letra sigma mayúscula del alfabeto griego:

Para indicar la suma:x1+ x2 + x1 ...+ xN mediante este signo, se escribe:

que significa la suma de todos los términos que resultan cuando toma todos los valores de 1 hasta N.

Cuando no haya lugar a dudas, la suma de todas las observaciones puede indicarse abreviadamente:

2º Si las observaciones están condensadas en una tabla de frecuencias, el promedio o media aritmética se obtiene así: Se suman los productos del  valor medio del intervalo de clase por  la frecuencia correspondiente y se divide por la suma de las frecuencias o sea el número de observaciones.

Sea la siguiente tabla de frecuencia que se refiere a las calificaciones obtenidas en un examen por los alumnos de una división.

El promedio o media aritmética se obtiene así:

el valor medio del 1er. intervalo 0-2 es 1 y su frecuencia 2; luego, su producto es: 1 X 2

el valor medio del 2º intervalo 2 -4 es 3 y su frecuencia 5; luego, su producto es: 3 X 5

el valor medio del 3er. intervalo 4 -6 es 5 y su frecuencia 14; luego, su producto es: 5 X 14

el valor medio del 4º intervalo 6 -8 es 7 y su frecuencia 8; luego, su producto es: 7 X 8

el valor medio del 5º intervalo 8 -10 es 9 y su frecuencia 6; luego, su producto es: 9 X6

Además, como la suma de las frecuencias o sea el número total de observaciones, es: 2 +5 +14 +8 +6, el promedio o media aritmética es:

En general, si los valores medios de los n intervalos son z1; z2; ... ; zn y sus frecuencias correspondientes: f1; f2; ... ; fn, es:

Aplicando sumatoria, la expresión anterior puede escribirse:

Dado que la sumatoria

es el número total N de observaciones, la fórmula anterior puede escribirse:

.En la práctica el cálculo del promedio o media aritmética cuando se tiene una tabla de frecuencias se dispone así:

El promedio o media aritmética es uno de los parámetros mas utilizados en estadística por ser muy fácil calcularlo.

MEDIANA. 1º En una sucesión de observaciones y dispuestos de menor a mayor los valores de la variable, se llama mediana al valor medio o central de dichas variables, es decir que el número de variables menor que ella es igual al número de variables mayor que ella.

Así, por ejemplo, si se hacen 11 observaciones y se ordenan los valores de la variable de menor a mayor, la mediana es el valor de la variable que corresponde al 6º lugar.

Si los valores de la variable x son:

Si el número de valores de la variable es par, la mediana es el valor de la variable, promedio entre los dos valores centrales.

Así, si se hacen 8 observaciones y se ordenan de menor a mayor los valores de la variable, la mediana es el valor de la variable, promedio entre el 4º y 5º valor.

Si los valores de la variable x son:

A diferencia de la media aritmética, la mediana tiene la ventaja de no estar influida por un valor extremo de la variable.

Así, en el primer ejemplo, mientras la mediana es 8, su promedio es 110/11 = 10

Gráficamente:

Sobre el promedio se ve que incide notablemente el valor alejado de la variable. Se observa que si se reemplaza el valor 28 de la variable, por un valor más alejado, por ejemplo 39, la mediana sigue siendo 8, pero el promedio es ahora 11.

Es de hacer notar que en algunos casos la mediana y el promedio o media aritmética son coincidentes.

2º Si las observaciones están condensadas en tablas de frecuencia, para determinar la mediana se procede en dos pasos:

1. Se determina el intervalo de clase en el cual está la mediana, es decir, el primer intervalo para el cual la frecuencia acumulada es mayor o igual a la mitad del número de observaciones;

2. Se determina el punto de ese intervalo que corresponde a la mepiana, aplicando la fórmula:

donde:

le es el límite inferior del intervalo de clase a que pertenece la mediana;

N/2 es la mitad del número total de observaciones;

Fle es la frecuencia acumulada hasta el intervalo de la clase mediana;

h es la amplitud de ese intervalo

EJEMPLO: Si se completa con las frecuencias acumuladas la tabla las calificaciones obtenidas en un examen por los alumnos de una división, se tiene:

La mediana está en el intervalo 4 -6, pues es el primer intervalo cuya frecuencia supera la mitad del número de observaciones: 35/2 = 17,5

Para determinar exactamente la mediana se aplica la fórmula dada anteriormente, teniendo en cuenta que en este caso:

CUARTILES. Si en una sucesión de observaciones se ordenan de menor a mayor los valores de la variable, se llaman cuartiles a los tres valores de la variable, que divide esa sucesión en cuatro partes tales que cada una de ellas contiene el mismo número de observaciones.

Es decir: el primer cuartil Q1 es el valor de la variable, mayor que la primera cuarta parte de los valores de la variable y menor que las tres cuartas partes restantes.

El segundo cuartil Q2 coincide con la mediana.

El tercer cuartil Q3, es un valor de la variable mayor que los de las primeras tres cuartas partes y menor que la cuarta parte restante.

Así, para los siguientes valores de la variable x, se tiene que:

MODA. Se llama moda al valor de la variable al que le corresponde la mayor frecuencia.

Así, recordando la tabla de estaturas de los alumnos de 4º curso de una división la moda es

pues a ese valor de la variable corresponde el mayor número de casos, en este ejemplo: 7.

2º Cuando las observaciones están condensadas en intervalos de clase, se puede deducir inmediatamente en qué intervalo está la moda; para hacerlo exactamente se requiere una fórmula especial.

Si se tiene la curva de distribución, la moda está dada por el valor de la variable al que corresponde mayor ordenada.

Si la curva de distribución es simétrica, la media aritmética, la mediana y la moda coinciden. Por ejemplo:

En cambio si no es simétrica no son coincidentes.

DESVIACIÓN O DISPERSIÓN. La diferencia o distancia entre el valor de la variable para una observación y el promedio o media aritmética de las observaciones se llama desviación o dispersión de esa observación.

Así, en el ejemplo anterior, la observación que corresponde al valor 15 de la variable tiene una desviación

15 - 10 = 5.

Del mismo modo, la observación que corresponde al valor 4 de la variable tiene una desviación

4 - 10 = -6.

Considerando el conjunto de todos los valores de la variable, las medidas de dispersión más comunes son: la desviación media o desviación promedio; la varianza y la desviación standard.

DESVIACIÓN MEDIA O DESVIACIÓN PROMEDIO. Es el promedio de los valores absolutos de todas las desviaciones.

Para calcularla, se suman los valores absolutos de las desviaciones o dispersiones y se divide por el número de observaciones.

En general, la desviación media se designa por

Md

y de acuerdo con la definición es:

EJEMPLO: Sea el ya estudiado problema de la temperatura mínima en la ciudad de Santiago de Chile, cuyo promedio o media aritmética es, según se calculó, 11,4° C .

La suma de los valores absolutos de las desviaciones es:

2º Cuando las observaciones están agrupadas en clases, la fórmula de la desviación media es:

donde fi es la frecuencia correspondiente a cada intervalo y ti el valor medio de ese intervalo.

EJEMPLO: Sea, por ejemplo, el ya citado referente a las calificaciones obtenidas por los alumnos de una división cuyo promedio, es, según se calculó: 5,6≈ 6.

VARIANZA y DESVIACIÓN STANDARD. Se llama varianza al promedio de los cuadrados de las desviaciones medias, es decir que la varianza es:

EJEMPLO: Sea el ya mencionado problema de la temperatura mínima en la ciudad de Santiago de Chile

La raíz cuadrada positiva de la varíanza se llama desviación standard o desviación típica y se designa por la letra σ sigma minúscula del alfabeto griego, con el subíndice x si se refiere a la variable x.

Al designar con σx la desviación standard se comprende que a la varianza se la designe por σ2 .

Si las observaciones están condensadas en clases la fórmula de la varianza es:

y en consecuencia la desviación standard, es:

EJEMPLO: Sea, por ejemplo, el ya citado referente a las calificaciones obtenidas en un examen por los alumnos de una division donde el promedio o media aritmetica es 6.

la varianza es:

la desviacion standard es:

De todas las medidas de dispersion la mas usada es la desviacion standard.

Una desviación standard pequeña significa que los datos estan concentrados muy cerca del promedio o media aritmetica.

desviación standard grande: gran dispersion; poca confianza en el promedio o media aritmetica el desviación standard pequeña: poca dispersion; gran confianza en promedio o media aritmetica

El promedio o media aritmetica es el valor de un elemento representativo del conjunto de elementos, es decir que caracteriza ese conjunto de elementos; la adopcion de esta media aritmetica como tal es aproximada; la aproximacion es mayor cuanto mas pequeña es la desviacion standard. Por lo tanto, cuanto menor es la desviacion standard tanto mayor es la confianza que se puede tener en la media aritmetica.

Si la curva representativa del fenomeno que se estudia es simetrica y se considera un intervalo que tiene por extremos la media aritmetica menos 1 desviacion standard y la media aritmetica mas 1 desviacion standard, dentro de ese intervalo esta comprendido el 68 % de las observaciones. Si el intervalo tiene por extremos: Mx - 2 σx y Mx+ 2 σx es decir, se consideran 2 σx a la izquierda y a la derecha del promedio, dentro de ese intervalo esta comprendido el 95 % de las observaciones.

Si el intervalo es:Mx - 3 σx y Mx+ 3 σx dentro de ese intervalo esta comprendido el 99 % de las observaciones.

Muestras. Cuando el numero de elementos en los que hay que hacer una observacion es muy grande, es dificil hacer intervenir a todos ellos para un calculo estadistico, y entonces se utiliza solamente una parte o subgrupo.

El conjunto de las observaciones de este subgrupo es una subpoblacion y se llama muestra de la poblacion total.

Ahora bien, estas muestras deben ser representativas del total, es decir, las medidas de posicion y dispersion que se obtengan para ella deben aproximarse suficientemente a los correspondientes promedios del total.

Se comprende que estas muestras deben estar bien elegidas porque sino se puede llegar a resultados contradictorios. Las indicaciones para la eleccion de las muestras son complicadas y no se tratan aqui pues superan el nivel de estas páginas .

Siguiente >> 1

 

 

 


Un poco de todo lo que buscas, variedad de productos. Compara precios aquí.


 

 


 


Si esta información te resulta útil, compártela :

 

 

INICIO : Curso de Matemáticas. Elementos Básicos. Álgebra. Geometría.


 

 

 


 

Volver arriba