Anda di halaman 1dari 15

UNIDAD 2: REPRESENTACIN NUMRICA Y GRFICA DE DATOS Presentacin de la unidad En la unidad anterior, conociste las dos grandes divisiones de la estadstica:

la que se dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva y la que se dedica a realizar hiptesis con base en dichos datos, la inferencial. Tambin aprendiste a determinar el espacio de estudio (es decir, la poblacin) y las variables que se van a estudiar de acuerdo al problema planteado. En esta unidad estudiars la estadstica descriptiva y aprenders cmo organizar y presentar los datos obtenidos mediante el muestreo en poblaciones. Cuando se realiza un trabajo que requiere a la estadstica, se disean instrumentos para obtener los datos deseados. Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:

Otra de las tcnicas ms recurridas en estadstica para recolectar informacin son los experimentos, revisa en qu consisten. Un experimento es una prueba que se realiza para determinar las caractersticas o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qu alimentos te parecen ms salados. Tambin, experimento se define como el proceso que se realiza para verificar una serie de hiptesis relacionadas con un determinado fenmeno , en el cual se determinan las caractersticas o comportamientos del fenmeno que se analiza.

Por ejemplo, un experimento para determinar la velocidad de la luz en el vaco. La diferencia entre la primera y la segunda definicin es que en la segunda se parte de una hiptesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cul ser ms salado. En el segundo ejemplo, la hiptesis, a partir de estudios anteriores, es que la velocidad de la luz en el vaco es de 300 000 km/seg. Por lo tanto, el experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de error experimental. Los datos que se recopilan, usando alguna tcnica de las que acabamos de describir u otra, son organizados de acuerdo a los parmetros de la estadstica descriptiva que estudiars en esta unidad. En esta unidad:

Identificars algunos conceptos que se utilizan en estadstica descriptiva. Organizars datos en diferentes tipos de tablas y elaborars varios tipos de grficas.

Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travs de la organizacin de los datos obtenidos de una muestra o poblacin. 2.1 Organizacin De Datos y Distribucin De Frecuencias. Introduccin La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Esta rea slo describe, resume, organiza y representa los datos obtenidos de una poblacin o muestra de la poblacin, sin elaborar inferencias ni obtener conclusiones. La organizacin de datos se realiza a travs de tablas que se utilizan para simplificar la presentacin y distribucin de estos datos. A continuacin, conocers que existen diferentes tipos de presentacin de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta. 2.1.1 Frecuencias. Antes de comenzar con el tema, es importante que consideres lo siguiente:

Ejemplo de organizacin de frecuencias En la siguiente pantalla observars una tabla con la organizacin de frecuencias, los datos presentados son los siguientes: 18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

2.1.2 Intervalos.

Intervalo de Clase.- la expresin que denota un intervalo. Amplitud del Intervalo.- es la distancia que hay entre los lmites superior e inferior del intervalo. Se calcula restando el valor del lmite inferior al valor del lmite superior. Fronteras de Clase.- Son los puntos medios entre los lmites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un intervalo y el lmite inferior del siguiente. Marca de clase.- Tambin conocida como punto medio de clase, es el resultado de la suma de los lmites inferior y superior del intervalo dividido entre 2. EJEMPLOS DE INTERVALOS DADOS LOS NUMEROS 15 Y 25 Intervalo. Corresponde a todos los nmeros que se encuentran entre el 15 y el 25. Intervalo de Clase. El intervalo de clase seria: 15-25. Limites del Intervalo. Son los nmeros entre los que se encuentran el intervalo, en este caso 15 y 25. Lmite Inferior. Es el nmero que marca el inicio del intervalo, y es el de menor valor; se denota como Li. En el ejemplo Li=15. Limite Superior. Es el ltimo nmero del intervalo, marca el final del mismo y es el nmero ms alto; se representa como Ls. En el ejemplo Ls=25. Amplitud del Intervalo. Es la diferencia del lmite superior menos el lmite inferior (Ls-Li).Siguiendo con el ejemplo, la amplitud del intervalo es 10, que es el resultado de restar 25 menos 15.

Frontera de Clase. Son puntos medios entre los lmites de intervalos consecutivos. Sigamos con el ejemplo, supongamos que tenemos los siguientes intervalos: 4-14, 15-25 y 26-36, las fronteras de clase seran: 3.5 y 14.5 para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo. La frontera de clase no debe coincidir con los datos lmites del intervalo. Si esta coincidencia sucede deber moverse el intervalo. Siguiendo con el ejemplo, moviendo un punto a la izquierda tendramos los intervalos 2.5-13.5, 13.5-24.5 y 24.5-35.5. Marca de Clase. Es el punto medio del intervalo, se obtiene sumando los lmites del intervalo y dividiendo el resultado entre 2. En nuestro ejemplo es igual a: 15+25= 40/2=20. Es recomendable que la marca del intervalo coincida con algn de los datos. Esto no es necesario y no siempre se logra, sobre todo cuando los intervalos tienen la misma amplitud. 2.1.3 Construccin de Intervalos de Clase. La formacin de clases o intervalos de clase, que se representa con (k), dependen, generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente: Paso 1: Calcular el Rango. Se identifica el numero mayor (Xn) y el nmero menor (X1) en los datos. El rengo es el resultado de restar el nmero menor al nmero mayor; esto es: R=Xn-X1 Por ejemplo: Para una serie de datos que van desde el 18 hasta el 56, se tiene lo siguiente: Xn=56 X1=18 Por lo tanto R= Xn-X1=56-18=38 Paso 2: Determinar el nmero de intervalos que se desea tener. No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisin la toma el investigador.

Siguiendo con el ejemplo, se van a countruir 7 intervalos. Entonces. K=7 Paso 3: Dividir El Rango Entre El Numero De Intervalos Que Se Desea Tener. Recuerda que es recomendable elegir un numero entre 5y 20 para los intervalos y dividir el rango entre el numero deseado de intervalos. Siguiendo con el ejemplo: Si son 7 intervalos 38/7=5.428 Esta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero sin decimales. Pas 4: Formacin De Intervalos: Los intervalos Se Forman Comenzando En Nmero Antes Del Primer Dato. Intervalos 17 a 22 (se cuenta 5 desde 18 hasta 22) 23 a 28 ( el siguiente intervalo comienza a partir del lmite superior del intervalos anterior) 29 a 34 35 a 40 41 a 46 47 a 52 53 a 58 Nota: No importa que el ltimo intervalo exceda el ltimo dato. Ejemplo de construccin de intervalos El director de una consultora en desarrollo de software desea conocer el nmero de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos: 35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20.

Observa cada paso: 1. 2. 3. 4. Calcular el rango: R=XnX1=60-20=40 Determinar el nmero de intervalos entre 5 y 20: Elegir 8 intervalos. Dividir el rango entre el nmero de intervalos: 40/8=5 Se forman los intervalos: Comenzar por un nmero anterior al lmite inferior: 19-24, 25-30, 31-36, 37-42, 43-48, 49-54, 55-60

Revisa el video Construccin de intervalos que se encuentra en la seccin Material de apoyo. 2.1.4 Tablas De Datos. Existen diferentes tipos de tablas para presentar datos, las ms utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qu consiste cada una: Tablas de datos Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utiliza cuando la informacin que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos. Ejemplo: Imagina que la medicin de temperatura a lo largo del da da como resultado los siguientes valores (en grados Celsius): 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7 A partir de estos valores construyes la siguiente tabla:

2.1.5 Tablas De Frecuencias. Las tablas de frecuencia aportan mayor informacin que las tablas de datos, ya que estn construidas con las categoras de la variable que se est midiendo y su frecuencia. Ejemplo: Un experimento da como resultado los siguientes valores: 1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2 Si agrupas los datos por categoras, segn la frecuencia o nmero de veces que aparece cada dato, tendras la siguiente tabla:

Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada. 2.1.6 Tablas Por Intervalos De Clase. En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable. Ejemplo: En una encuesta sobre el desempleo en el rea metropolitana de la ciudad de Mxico, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7 Tablas De Doble Entrada. Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entre s. La informacin se distribuye poniendo en los renglones de la tabla la informacin de una de las variables y en las columnas la informacin de la otra variable. Ejemplo: Se cuenta el nmero de cirugas realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

En el ejemplo las variables relacionadas son la edad y el nmero de cirugas. Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un lquido con respecto al tiempo de calentamiento. En el rengln colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.2 Representacin Grafica De Los Datos. Introduccin: El tema anterior present diferentes formas de organizar o de tabular datos y la distribucin de frecuencias. Ahora estudiars la representacin grfica de los datos. Las grficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de grficas, cada una de ellas se elabora con base en el tipo de informacin que se quiere representar. 2.2.1 Histograma. El histograma es la representacin grfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medicin o

fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern proporcionales a las frecuencias. El histograma permite apreciar visualmente la distribucin y dispersin de las mediciones.

2.2.2 Grafica De Barras. Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En stas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras. La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Un histograma y una grafica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separacin entre las barras.

2.2.4 Graficas De Lneas. Una grfica de lneas tambin se construye en un sistema coordenado rectangular y muestra la relacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia de cada valor medido es representada por la altura del punto. En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grfica de lnea.

2.2.4 Grfica De reas o De Pastel. Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (o pastel) en sectores (o rebanadas). Tambin, se utilizan para representar la distribucin de frecuencias, pero es el rea de cada sector la proporcional a los valores medidos. Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categora.

Anda mungkin juga menyukai