Anda di halaman 1dari 0

Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 1

VARIABLES Y DISTRIBUCIONES DE FRECUENCIA

Ahora nos ocuparemos de la descripcin y la reduccin de los datos estadsticos. Para llegar a eso vamos
a definir a la unidad estadstica y la variable. Las unidades estadsticas son los elementos que componen la
poblacin objeto de estudio. A estos elementos se les estudia, mediante la medicin u observacin, una o ms
caractersticas que reciben el nombre de variables estadsticas.

Variable : Es la caracterstica que se le estudia u observa a los individuos (o elementos) que conforman
la poblacin (o muestra) .Dicha variable puede tomar cualquier valor dentro de un conjunto determinado llamado
dominio o campo de variacin de la variable. Ej.: peso, dimensiones, n de defectuosos, n de ausentes.

Cada caracterstica puede presentar dos o ms modalidades, que son incompatibles y exhaustivas a la vez, es decir
que cada individuo de la poblacin ( unidad estadstica) presenta una y slo una de estas modalidades y el campo
de variacin contempla todos los casos susceptibles de presentacin. Debemos hacer una diferencia entre los
valores posibles y los valores observados, que generan dos campos de variacin distintos: los primeros son los que
puede asumir la variable y los segundos son los valores que realmente se observan o se obtuvieron en la
recopilacin.

De acuerdo a su naturaleza se las clasifica en cualitativas y cuantitativas.

.Cualitativas : asumen modalidades o atributos .
.Cuantitativas : asumen valores numricos . Las variables cuantitativas, segn como se originen, pueden
clasificarse en discretas y continuas.

En general las mediciones dan origen a datos continuos y las enumeraciones o conteos originan datos discretos. En
realidad, la distincin entre discretas y continuas se refiere a la poblacin, ya que en la muestra toda medicin es
discreta ya que se efecta con algn tipo de instrumento que tiene un grado de precisin limitado.

Discretas: surgen de un conteo y asumen valores enteros no negativos (naturales) . Ej.: n de hijos, n de
hoteles, n de autos.
Continuas: surgen de una medicin y asumen valores reales.. Ej.: velocidad de un automvil, altura de
las personas.

Otras formas de clasificar a las variables cuantitativas es en temporales y atemporales.

.Temporales o cronolgicas: cuando se toma en cuenta el orden de las observaciones.
.Atemporales: cuando el orden de las observaciones no es de importancia.

Segn la cantidad de caractersticas que simultneamente se observan (o miden) a los elementos de la poblacin,
podemos clasificar a las variables en: unidimensionales, bidimensionales y multidimensionales.
VARIABLES CUANTITATIVAS
Unidimensionales
Serie Simple de Datos ( o de observaciones) x
1
, x
2
, x
3
, ........, x
n

Donde x
1
representa el valor de la variable que corresponde a la primera observacin, es decir, el primer valor
observado (de la variable X ) .
En general , x
i
es el i-simo valor observado y x
n
es el ltimo valor observado ( o el n-simo) simbolizamos con
"n" a la cantidad de observaciones.
Si se est estudiando una variable atemporal, entonces puede drsele a esta serie un orden distinto, en particular se
puede ordenar a estos valores de menor a mayor, lo cual permite visualizar mejor cual es el mnimo valor
observado , cual es el mximo , cual es la amplitud del recorrido de la variable y donde est ubicado el "valor
medio de la variable".
Si la cantidad de observaciones ( n ) es muy grande, se hace necesario organizar los datos construyendo tablas de
frecuencia. La construccin de dichas tablas (es decir, la organizacin de los datos) depende del origen de la
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 2

variable: si la variable se origina mediante un conteo entonces es discreta ,y en la tabla se colocan , de menor a
mayor, los valores que toma la variable. Si la variable se origina mediante una medicin, entonces es continua , y
es necesario agrupar los valores observados en intervalos o clases .
Por lo tanto, distinguiremos las tablas de frecuencia para datos sin agrupar (que corresponden a variables
discretas) y para datos agrupados ( que corresponden a variables continuas ).
Distribuciones de Frecuencia
Datos no Agrupados - (Variable Discreta)
Se ordenan de menor a mayor los valores observados (sin repetir) en la primera columna . En la segunda columna
se indica cuantas veces se observ dicho valor donde

x
y
f
i

x
1
f
1

x
2
f
2

x
3

.
.
f
3

.
.

x
i
.
.
.
f
i

.
.
.
x
m
f
m

x
1
indica el menor valor que asume la
variable
x
m
indica el mayor valor que asume la
variable
m indica la cantidad de valores distintos
observados
f
1
indica la cantidad de veces que se observ
el menor valor de la variable (x
1
)
f
m
indica la cantidad de veces que se
observ el mayor valor de la variable (x
m
)
En general f
i
indica la cantidad de veces que se observ el valor x
i
, es decir, representa la frecuencia absoluta
simple del i-simo valor de la variable.
n indica la cantidad total de observaciones. n = f
i

Por su gran utilidad, definiremos tambin las frecuencias absolutas acumuladas F
i
, que indican la cantidad de
veces que se observ un valor menor o igual al i-simo valor de la variable (x
i
).
Por lo tanto F
i
= f
1
+f
2
+..... +f
i
= f
j
j
i
=

1

Por su propia definicin tenemos que F
1
= f
1

F
m
= n
y en general 0 F
i
n
REPRESENTACIN GRFICA
Frecuencias Absolutas Grfico de Bastones Frecuencias Acumuladas Grfico Escalonado



En la mayora de los casos ( y principalmente cuando se trabaja con muestras ) es ms importante tener
informacin sobre las frecuencias relativas (simples y acumuladas) que sobre las absolutas.
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 3

Definimos entonces a la frecuencia relativa simple h
i
como el cociente entre la frecuencia absoluta simple
f
i
y la cantidad de observaciones n , que indica la proporcin de veces que se observ el i-simo valor de
la variable, x
i
.
Y definimos a la frecuencia relativa acumulada H
i
como el cociente entre la frecuencia absoluta acumulada
F
i
y la cantidad de observaciones n, que indica la proporcin de veces que se observ un valor menor o
igual que x
i
.
En smbolos, tenemos que; h
f
n
i
i
= i =1 .. n
y H
F
n
f
n
i
i
j
j
i
= =
=

1
i =1 .. n
Por su propia definicin tenemos que H
1
= h
1

H
m
= 1
y en general 0 H
i
1
La representacin grfica es similar a la de las frecuencias absolutas.
Para una mejor interpretacin de las frecuencias relativas se definen a continuacin las frecuencias relativas
porcentuales (simples y acumuladas), que se obtienen multiplicando por 100 las frecuencias relativas
correspondientes.
As: h
i
% = h
i
. 100 i =1 .. n , que indica el porcentaje de veces que se observ el valor x
i

y H
i
% = H
i
. 100 = h
j
j
i
%
=

1
i =1 .. n
Por su propia definicin tenemos que H
1
% = h
1
%; H
m
% = 100;
y en general 0 H
i
% 100

X
I


f
i
=frec.absoluta
h
f
n
i
i
=

h
i
%=h
i
*100
F f
i k
k
i
=
=

1
H
F
n
i
i
=

H H
i i
%= 100
X
1
X
2
X
3
.




0 f
i
n



0 h
i
1



0 h
i
% 100



F f f
i i
= + +
1
..

H
f
n
i
k
k
i
=
=

1



.
.
.
.

0 F n
i


0 1 H
i


0 100 H
i
%
.
X
m
F n
m
= H
m
= 1 H
m
%=100

f f f n
i
i
m
m
=

= + + =
1
1
...

h
i
i
m
=
=
1
1
h
i
i
m
=
=
1
100 %


Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 4

REPRESENTACIN GRFICA
Frecuencias Absolutas Frecuencias Acumuladas
Grfico de Bastones Grfico Escalonado



Datos Agrupados - (Variable Continua)
Se determina el recorrido de la variable o Rango ( R ) , tomando la diferencia entre el mximo valor
observado (x
M
) y el mnimo valor observado (x
m
) . O sea, R =x
M
- x
m
. Luego, se divide el rango en
una cantidad de intervalos (o clases) que puede variar entre 5 y 20 . Estos intervalos deben ser excluyentes
y exhaustivos, de manera que cualquier valor observado de la variable pertenezca a uno y slo un intervalo o
clase. Por lo tanto, los intervalos deben ser semiabiertos, es decir, deben incluir uno solo de los extremos.

x
i-1
'- x
i
' x
i
f
i

x
0
'- x
1
' x
1
f
1

x
1
'- x
2
' x
2
f
2

x
2
'- x
3
'
.
.
x
3

.
.
f
3

.
.
x
i-1
'- x
i
'

.
.
.
x
i

.
.
.
f
i

.
.
.
x
m-1
' - x
m
' x
m
f
m

donde x
0
' indica el menor valor que puede asumir la variable; normalmente es menor que el menor valor
observado de la variable .
x
m
' indica el mayor valor que puede asumir la variable; normalmente es mayor que el mayor valor
observado de la variable .
m indica la cantidad de intervalos .
x
1
indica el punto medio del primer intervalo .
x
i
indica el punto medio del i-simo intervalo .
x
m
indica el punto medio del ltimo intervalo .
f
1
indica la cantidad de veces que se observ un valor de la variable que est entre x
0
' y x
1
' , es decir,
la cantidad de observaciones que caen dentro del primer intervalo.
f
m
indica la cantidad de veces que se observ un valor de la variable que est entre x
m-1
' y x
m
' ,
es decir, la cantidad de observaciones que caen dentro del ltimo intervalo.
En general f
i
indica la cantidad de veces que se observ un valor que oscila entre x
i-1
' y x
i
' es decir ,
representa la frecuencia absoluta simple del i-simo intervalo o clase. Por su gran utilidad, definiremos
tambin las frecuencias absolutas acumuladas F
i
, que indican la cantidad de veces que se observ un valor
menor o igual al que el extremo superior del i-simo intervalo, es decir , un valor menor o igual que x
i
' .
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 5

Por lo tanto F
i
= f
1
+f
2
+..... +f
i
= f
j
j
i
=

1

Por su propia definicin tenemos que F
1
= f
1

F
m
= n
y en general 0 F
i
n


REPRESENTACIN GRFICA

Frecuencias Absolutas Frecuencias Acumuladas
Histograma Ojiva
X
fi

X
F i

>

<
=

=
m i si n
m i f
i si
F
i
k
k i
1
1 0
1

En la mayora de los casos ( y principalmente cuando se trabaja con muestras ) es ms importante tener
informacin sobre las frecuencias relativas (simples y acumuladas) que sobre las absolutas.
Definimos entonces a la frecuencia relativa simple h
i
como el cociente entre la frecuencia absoluta simple
f
i
y la cantidad de observaciones n , que indica la proporcin de veces que se observ un valor dentro del i-
simo intervalo de clase ( x
i-1
' - x
i
' ) .
Y definimos a la frecuencia relativa acumulada H
i
como el cociente entre la frecuencia absoluta acumulada
F
i
y la cantidad de observaciones n , que indica la proporcin de veces que se observ un valor menor o
igual que x
i
' .
En smbolos, tenemos que ; h
f
n
i
i
= i =1 .. n
y H
F
n
f
n
i
i
j
j
i
= =
=

1
i =1 .. n
Por su propia definicin tenemos que H
1
= h
1

H
m
= 1
y en general 0 H
i
1
La representacin grfica es similar a la de las frecuencias absolutas .

Para una mejor interpretacin de las frecuencias relativas se definen a continuacin las frecuencias
relativas porcentuales (simples y acumuladas), que se obtienen multiplicando por 100 las frecuencias
relativas correspondientes.
As : h
i
% = h
i
. 100 i =1 .. n, que indica el porcentaje de veces que se observ un valor
dentro del i-simo intervalo (x
i-1
- x
i
.)
y H
i
% = H
i
. 100 = h
j
j
i
%
=

1
i =1 .. n
Por su propia definicin tenemos que H
1
% = h
1
%
H
m
%= 100
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 6

y en general 0 H
i
% 100


x
i-1
'- x
i
'
X
I


f
i
=frec.
abs.
h
f
n
i
i
=

h
i
%=h
i
*100
F f
i k
k
i
=
=

1
H
F
n
i
i
=

H H
i i
%= 100
x
0
'- x
1
'
x
1
'- x
2
'
x
2
'- x
3
'
X
1
X
2
X
3
.


















H
f
n
i
k
k
i
=
=

1


'
.
.
.
x
i-1
'- x
i
'

.
.
.
.
X
i

.
.
.






x
m-1
' - x
m
' X
m
F n
m
= H
m
= 1 H
m
%=100

f n
i
i
m
=
=
1

h
i
i
m
=
=
1
1
h
i
i
m
=
=
1
100 %


0 f
i
n 0 h
i
1 0 h
i
% 100
0 F n
i
0 1 H
i
0 100 H
i
%

Histograma y Ojiva
Polgono de Frecuencias Frecuencias Acumuladas


Bidimensionales
Serie Simple de Datos ( o de observaciones)
(x
1
, y
1
) , (x
2
, y
2
) , (x
3
, y
3
) .,........, (x
n
,y
n
)
Donde ( x
1
, y
1
) representa el valor de la variable que corresponde a la primera observacin, es decir, el
primer valor observado de la variable bidimensional (X,Y).
En general, (x
i
, y
i
) es el i-simo valor observado y (x
n
, y
n
) es el ltimo valor observado (o el n-
simo).Simbolizamos con "n" a la cantidad de observaciones.
Distribuciones de Frecuencias
Si la cantidad de observaciones ( n ) es muy grande, se hace necesario organizar los datos construyendo tablas
de frecuencias bidimensionales. La construccin de dichas tablas (es decir, la organizacin de los datos)
depende del origen de las variables: si las variables se originan mediante un conteo, entonces son discretas,
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 7

y en la tabla se colocan , de menor a mayor, los valores que toman las variables; si las variables se originan
mediante una medicin, entonces son continuas , y es necesario agrupar los valores observados en intervalos
o clases .
Por lo tanto, distinguiremos las tablas de frecuencias bidimensionales para datos sin agrupar (que
corresponden a variables discretas) y para datos agrupados ( que corresponden a variables continuas ).
Datos no Agrupados
y
x
y
1
y
2
y
3
..... ......y
j
..... .................... ....y
p
f
i

x
1
f
11
f
12
f
13
.... ......f
1j
.... .................... .....f
1p
f
1

x
2
f
21
f
22
f
23
.... ......f
2j
.... .................... ......f
2p
f
2

x
3


.
f
31


.
f
32


f
33
....

.
......f
3j
....

.
....................

.
.....f
3p


.
f
3


.
x
i
f
i1
f
i2
f
i3
.... ......f
ij
.... .................... .....f
ip
f
i

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
m
f
m1
f
m2
f
m3
.... ......f
mj
.... .................... .....f
mp
f
m

f
j
f
1
f
2
f
3
.... .......f
j
. .................... ....f
p
n

donde x
1
indica el menor valor que asume la variable X .
x
m
indica el mayor valor que asume la variable X .
m indica la cantidad de valores distintos observados de la variable X .
y
1
indica el menor valor que asume la variable Y .
y
p
indica el mayor valor que asume la variable Y .
p indica la cantidad de valores distintos observados de la variable Y.
Las frecuencias conjuntas indican la cantidad de veces que se observ conjuntamente un valor de la variable
X con un valor de la variable Y.
As :
f
12
indica la cantidad de veces que se observ el valor ( x
1
, y
2
)
f
mp
indica la cantidad de veces que se observ el valor ( x
m
, y
p
)
En general f
ij
indica la cantidad de veces que se observ el valor ( x
i
, y
j
), i =1 .. m
j =1 .. p
n indica la cantidad total de observaciones n f
ij
j
p
i
m
=
= = 1 1

Por su gran utilidad, definiremos tambin las frecuencias marginales f
i
y f
j
, que indican la cantidad
de veces que se observ un valor de una variable sin interesar cual es el valor que asume la otra.
f
1
indica la cantidad de veces que se observ el menor valor de la variable X , ( x
1
)
f
m
indica la cantidad de veces que se observ el mayor valor de la variable X , ( x
m
)
En general f
i
indica la cantidad de veces que se observ el valor x
i
, es decir , representa la frecuencia
absoluta simple del i-simo valor de la variable X.
As ,
i ij
j
p
f f

=
=

1

n indica la cantidad total de observaciones n f
i
i
m
=

=

1

f
1
indica la cantidad de veces que se observ el menor valor de la variable Y , ( y
1
)
f
p
indica la cantidad de veces que se observ el mayor valor de la variable Y , ( y
p
)
en general f
j
indica la cantidad de veces que se observ el valor y
j
, es decir, representa la frecuencia absoluta
simple del j-simo valor de la variable Y.
As ,

=
=

j ij
i
m
f f
1

n indica la cantidad total de observaciones.
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 8


n f
j
j
p
=

=

1

Distribucin de Frecuencias Conjuntas
Variables Discretas
0
1
2
3
4
5
x
0
1
2
3
4
5
y
0
10
20
30
40
f i j

Datos Agrupados
(y
0
' - y
1
') (y
1
'- y
2
') (y
2
' - y
3
') .....(y
j-1
' - y
j
')......... .(y
p-1
' - y
p
') f
i

(x
0
' - x
1
') f
11
f
12
f
13
...........f
1j
................ ...........f
1p
f
1

(x
1
'- x
2
') f
21
f
22
f
23
...........f
2j
................ ...........f
2p
f
2

(x
2
' - x
3
')
.
.
f
31

.
.
f
32

.
.
f
33

.
.
...........f
3j
................
.
.
...........f
3p

.
.
f
3

.
.
(x
i-1
' - x
i
') f
i1
f
i2
f
i3
..........f
ij
.......... ...........f
ip
f
i

.
.
.
.
.
.
.
.
.
.
.
.
.
.
(x
m-1
' - x
m
') f
m1
f
m2
f
m3
..........f
mj
................ ...........f
mp
f
m

f
j
f
1
f
2
f
3
..........f
j
.................. ............f
p
n

donde x
0
' indica el menor valor que asume la variable X.
x
m
' indica el mayor valor que asume la variable X.
m indica la cantidad de intervalos de la variable X.
y
0
' indica el menor valor que asume la variable Y.
y
p
' indica el mayor valor que asume la variable Y.
p indica la cantidad de intervalos de la variable Y.
Las frecuencias conjuntas indican la cantidad de observaciones en las cuales la variable X asumi un valor dentro
de un intervalo y simultneamente la variable Y asumi un valor dentro de determinado intervalo.
As :
f
12
indica la cantidad de observaciones para las cuales x
o
' x <x
1
' y a la vez y
1
' y <y
2
'
f
mp
indica la cantidad de observaciones en las cuales x
m-1
' x <x
m
' y a la vez y
p-1
' y <y
p
'
En general fij indica la cantidad de observaciones para las cuales:
x
i-1
' <x <x
i
' y a la vez y
j-1
' <y <y
j
' , i =1 .. m
j =1 .. p
n indica la cantidad total de observaciones n f
ij
j
p
i
m
=
= = 1 1

Por su gran utilidad, definiremos tambin las frecuencias marginales f
i
y f
j
, que indican la cantidad de
observaciones dentro de un intervalo de una variable sin interesar cual es el valor que asume la otra.
f
1
indica la cantidad de observaciones para las cuales la variable X asume un valor dentro del primer
intervalo ( x
o
' x <x
1
' ).
Ctedra: Probabilidad y Estadstica

Distribuciones de Frecuencia 9

f
m
indica la cantidad de observaciones para las cuales la variable X asume un valor dentro del
ltimo intervalo (x
m-1
' x <x
m
' ); en general f
i
indica la cantidad de observaciones para las
cuales la variable X asume un valor dentro del i-simo intervalo ( x
i-1
' x <x
i
'), es decir,
representa la frecuencia absoluta simple del i-simo intervalo de la variable X.
As ,
i ij
j
p
f f

=
=

1

n indica la cantidad total de observaciones n f
i
i
m
=

=

1

f
1
indica la cantidad de observaciones para las cuales la variable Y asume un valor dentro del
primer intervalo ( y
0
' y <y
1
' )
f
p
indica la cantidad de observaciones para las cuales la variable Y asume un valor dentro del
ltimo intervalo ( y
p-1
' y <y
p
' )
En general f
j
indica la cantidad de observaciones para las cuales la variable Y asume un valor dentro del j-
simo intervalo ( y
j-1
' y <y
j
' ) , es decir , representa la frecuencia absoluta simple del j-simo intervalo de la
variable Y .
As ,

=
=

j ij
i
m
f f
1

n indica la cantidad total de observaciones n f
j
j
p
=

=

1

Estereograma
X
f i j


La representacin de esta distribucin de frecuencias se llama estereograma, y consiste en un conjunto de mx p
paraleleppedos cuyas bases estn sobre el plano XY. El volumen de cada paraleleppedo deber ser proporcional
a la frecuencia que le corresponde a dicha porcin del plano XY que constituye la base del mismo.

Anda mungkin juga menyukai