Anda di halaman 1dari 12

Probabilidad condicionada

Probabilidad condicional es la probabilidad de que ocurra un evento A, sabiendo que


tambin sucede otro evento B. La probabilidad condicional se escribe P(A|B), y se lee la
probabilidad de A dado B. No tiene por qu haber una relacin causal o temporal
entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir
simultneamente. A puede causar B, viceversa o pueden no tener relacin causal.

Estadstica
La estadstica es una ciencia formal y una herramienta que estudia usos y anlisis
provenientes de una muestra representativa de datos, busca explicar las correlaciones y
dependencias de un fenmeno fsico o natural, de ocurrencia en forma aleatoria o condicional.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad.

Muestreo (estadstica)
En la referencia estadstica se conoce como muestreo a la tcnica para la seleccin de
una muestra a partir de una poblacin estadstica.1 Al elegir una muestra aleatoria se espera
conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso permite
ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se
realizase un estudio de toda la poblacin.

Censo (estadstica)
Se denomina censo, en estadstica descriptiva, al recuento de individuos que conforman
una poblacin estadstica, definida como un conjunto de elementos de referencia sobre el que
se realizan las observaciones. El censo de una poblacin estadstica consiste bsicamente, en
obtener mediciones del nmero total de individuos mediante diversas tcnicas de recuento,
adems este se realiza cada determinado perodo.

Encuesta
Una encuesta es un procedimiento dentro de los diseos de una investigacin descriptiva en
el que el investigador recopila datos por medio de un cuestionario previamente diseado, sin
modificar el entorno ni el fenmeno donde se recoge la informacin ya sea para entregarlo en
forma de trptico, grfica o tabla. Los datos se obtienen realizando un conjunto de preguntas
normalizadas dirigidas a una muestra representativa o al conjunto total de la poblacin
estadstica en estudio, integrada a menudo por personas, empresas o entes institucionales,
con el fin de conocer estados de opinin, ideas, caractersticas o hechos especficos.
Parmetro estadstico
En estadstica, un parmetro es un nmero que resume la gran cantidad de datos que
pueden derivarse del estudio de una variable estadstica.1 El clculo de este nmero est bien
definido, usualmente mediante una frmula aritmtica obtenida a partir de datos de la
poblacin.2 3 Los parmetros estadsticos son una consecuencia inevitable del propsito
esencial de la estadstica: crear un modelo de la realidad.4

Muestreo aleatorio
En esta tcnica, cada miembro de la poblacin tiene la misma probabilidad de ser
seleccionado como sujeto. Todo el proceso de toma de muestras se realiza en un paso, en
donde cada sujeto es seleccionado independientemente de los otros miembros de
la poblacin. El muestreo aleatorio siemple se puede aplicar en muchos mtodos. El ms
primitivo y mecnico sera el de la lotera. A cada miembro de la poblacin se le asigna un
nmero

Muestreo simple

Una de las mejores cosas del muestreo simple es la facilidad para armar la muestra. Tambin
se considera una forma justa de seleccionar una muestra a partir de una poblacin, ya que
cada miembro tiene igualdad de oportunidades de ser seleccionado.

Otra caracterstica clave del muestreo aleatorio simple es la representatividad de la poblacin.


En teora, lo nico que puede poner en peligro su representatividad es la suerte.

Muestreo por conglomerados


El muestreo por conglomerados es una tcnica utilizada cuando hay agrupamientos
"naturales" relativamente homogneos en una poblacin estadstica. 1 A menudo se utiliza en
la investigacin de mercados. En esta tcnica, la poblacin total se divide en estos grupos (o
clusters) y una muestra aleatoria simple se selecciona de los grupos. A continuacin, la
informacin requerida se obtiene de una muestra aleatoria simple de los elementos dentro de
cada grupo seleccionado.
Muestreo estratificado
Es una forma de representacin estadstica que muestra cmo se comporta una caracterstica
o variable en una poblacin a travs de hacer evidente el cambio de dicha variable en sub-
poblaciones o estratos en los que se ha dividido. Consiste en la divisin previa de la poblacin
de estudio en grupos o clases que se suponen homogneos respecto a caracterstica a
estudiar y que no se solapen.

Valor
Un valor es una cualidad de un sujeto u objeto. Los valores son agregados a las
caractersticas fsicas o psicolgicas, tangibles del objeto; es decir, son atribuidos al objeto por
un individuo o un grupo social, modificando -a partir de esa atribucin- su comportamiento y
actitudes hacia el objeto en cuestin. El valor es una cualidad que confiere a las cosas,
hechos o personas una estimacin, ya sea negativa o positiva.

VARIABLE CUANTITATIVA
Las variables cuantitativas son aquellas que adoptan valores numricos (es
decir, cifras). De este modo se diferencian de las variables cualitativas, que
expresan cualidades, atributos, categoras o caractersticas. Una variable
cuantitativa es la que se expresa mediante un nmero, por tanto se pueden
realizar operaciones aritmticas con ella. Las variables adquieren valor cuando
se relacionan con otras variables, es decir, si forman parte de una hiptesis o
de una teora.

Variable cualitativa
Las variables cualitativas son aquellas variables que toman valores que son
nombres o etiquetas. El color de una pelota (por ejemplo, rojo, verde, azul) o la
raza de un perro (por ejemplo, collie, pastor, terrier) seran ejemplos de
variables cualitativas. Esto no supone que no puedan utilizarse en modelos
matemticos, econmicos o financieros. Para ello, estas se convierten en
nmeros asignando a cada posible valor un numero concreto. Poe ejemplo el
sexo es una variable cualitativa (hombre o Mujer) en un anlisis matemtico
esta variable se incluira por ejemplo dando a todos los hombres el valor 0 y a
todas mujeres el valor 1.

Variables independientes

Una variable independiente es aquella cuyo valor no depende de otra variable. Es aquella
caracterstica o propiedad que se supone es la causa del fenmeno estudiado. En
investigacin experimental se llama as a la variable que el investigador manipula. Las
variables independientes son las que el investigador escoge para establecer agrupaciones en
el estudio, clasificando intrnsecamente a los casos del mismo.

Tablas de frecuencias:

Una tabla de frecuencia est formada por las categoras o valores de una
variable y sus frecuencias correspondientes. Esta tabla es lo mismo que
una distribucin de frecuencias. Esta tabla se crea por medio de la tabulacin y
agrupacin, la cual es un mtodo sencillo como lo habamos empezado a ver
en la tabla de datos, Se realiza el mismo procedimiento de tabulacin
anteriormente descrito si el nmero de valores observados para la variable, se
trabaja con una sola variable, descontando los repetidos son pequeos.

Frecuencia absoluta

Frecuencia absoluta de un valor de la variable estadstica X, es el nmero de veces


que aparece ese valor en el estudio. Se suele denotar por Fi a la frecuencia absoluta del
valor X = xi de la variable X. Dada una muestra de N elementos, la suma de todas las
frecuencias absolutas debe dar el total de la muestra estudiada N. Para
indicar resumidamente estas sumas se utiliza la letra griega (sigma
mayscula) que se lee suma o sumatoria.
Frecuencia relativa acumulada: el resultado de
dividir la frecuencia acumulada entre el nmero total
de datos, se representa por.

Frecuencia relativa

L a fr ec uenc ia r ela t iva e s el c o c ient e e ntr e la f r ec uenc ia

a bso luta de un de te r minado valor y e l nm ero to ta l de dat o s .

L a fr ec uenc ia r ela t iva se pue de e xpre sar e n tan to s po r cie nto y

se re pre se nta po r n i .

FRECUENCIA RELATIVA ACUMULADA


La frecuencia relativa acumulada (F ) de un valor X como la proporcin de
i i

valores iguales o menores a X en el conjunto de datos (X , X ,, X ). Es decir, la


i 1 2 N
frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por el
nmero total de sujetos N: La frecuencia relativa acumulada de cada valor
siempre es mayor que la frecuencia relativa.

Marca de clase

L a ma r c a de c la s e e s e l punto m edio de cada int er va lo .

L a ma r c a de c la s e e s el va lo r que re pre se nta a to do

e l int er va lo para e l c lc ulo de alg uno s pa r m et r o s co mo

la m edia ar t m t ica o la desv ia c i n t pic a .

Rango (estadstica)
Rango es el intervalo entre el valor mximo y el valor mnimo; por ello, comparte unidades con
los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango,
ms dispersos estn los datos de un conjunto.

Intervalo
los intervalos de clase en estadisticas son las subdivisiones o intervalos en que se divide el
dominio o campo de variabilidad de la variable, de modo tal que cada intervalo est compuesto por
tramos del recorrido de la misma.

Medidas de tendencia central


Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir
la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia
el centro de la distribucin de datos se denomina medida o parmetro de tendencia
central o de centralizacin. Cuando se hace referencia nicamente a la posicin de
estos parmetros dentro de la distribucin, independientemente de que est ms o
menos centrada, se habla de estas medidas como medidas de posicin. En este caso
se incluyen tambin los cuantiles entre estas medidas.

Medidas de dispersin
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la
variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes
puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor,
mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si
todos los casos son parecidos o varan mucho entre ellos.

Medidas de Posicin

Son indicadores usados para sealar que porcentaje de datos dentro de una distribucin de frecuencias
superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la
distribucin de frecuencia, por lo que tambin se les llama " Medidas de Tendencia Central ".

Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir determinadas condiciones
para que lean verdaderamente representativas de la variable a la que resumen.

MEDIDAS DE FORMA

Las medidas de forma permiten comprobar si una distribucin de frecuencia tiene caractersticas
especiales como simetra, asimetra, nivel de concentracin de datos y nivel de apuntamiento que
la clasifiquen en un tipo particular de distribucin.

Las medidas de forma son necesarias para determinar el comportamiento de los datos y as, poder
adaptar herramientas para el anlisis probabilstico.

Media aritmtica
En matemticas y estadstica, la media aritmtica (tambin
llamada promedio o simplemente media) de un conjunto finito de nmeros es
el valor caracterstico de una serie de datos cuantitativos, objeto de estudio
que parte del principio de la esperanza matemtica o valor esperado, se
obtiene a partir de la suma de todos sus valores dividida entre el nmero de
sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre
de media muestral siendo uno de los principales estadsticos mustrales.

Media ponderada
La media ponderada es una medida de tendencia central, que es apropiada cuando en un
conjunto de datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los
dems datos. Se obtiene multiplicando cada uno de los datos por su ponderacin (peso) para
luego sumarlos, obteniendo as una suma ponderada; despus se divide esta entre la suma
de los pesos, dando como resultado la media ponderada.1

Media aritmtica
L a m edia a r it m t ic a e s e l va lo r o bte ni do al sum a r to do s
lo s dat o s y dividir e l re sulta do entr e e l nm er o to tal de da to s . es e l
smbo lo de la m edia a r it m t ic a .

Mediana (estadstica)
En el mbito de la estadstica, la mediana representa el valor de la variable de posicin
central en un conjunto de datos ordenados.

Moda (estadstica)
En estadstica, la moda es el valor con mayor frecuencia en una distribucin de datos. Se
hablar de una distribucin bimodal de los datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta
mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas
las variables tienen la misma frecuencia diremos que hay moda.

Decil (estadstica)
En estadstica descriptiva, el concepto decil se refiere a cada uno de los 9 valores que dividen
un grupo de datos (clasificados con una relacin de orden) en diez partes iguales, y de
manera que cada parte representa un dcimo de la poblacin. En resumen, los deciles son
cada uno de los nueve valores que dividen un conjunto de datos en diez grupos con iguales
efectivos. Son los nueve valores que dividen la serie de datos en diez partes.

Cuartil
Los cuartiles son los tres valores que dividen un conjunto de datos ordenados en cuatro
partes porcentualmente iguales. Aparecen citados en la literatura cientfica por primera vez en
1879 por D. McAlister.

Percentil
El percentil es una medida de posicin usada en estadstica que indica, una vez ordenados los
datos de menor a mayor, el valor de la variable por debajo del cual se encuentra
un porcentaje dado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20
es el valor bajo el cual se encuentran el 20 por ciento de las observaciones. Se representan con la
letra P. Para el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son
valores menores que l y el 100-i % restante son mayores.
Quintil (unidad)
El quintil de ingreso se calcula ordenando la poblacin (de una regin, pas, etc.) desde el
individuo ms pobre al ms adinerado, para luego dividirla en 5 partes de igual nmero de
individuos; con esto se obtienen 5 quintiles ordenados por sus ingresos, donde el primer quintil
(o Q1, I quintil) representa la porcin de la poblacin ms pobre; el segundo quintil (Q2, II
quintil), el siguiente nivel y as sucesivamente hasta el quinto quintil (Q5, V quintil),
representante de la poblacin ms rica.

Varianza
En teora de probabilidad, la varianza o variancia (que suele representarse como de
una variable aleatoria es una medida de dispersin definida como la esperanza del cuadrado
de la desviacin de dicha variable respecto a su media. Est medida en la unidad de medida
de la variable al cuadrado. Por ejemplo, si la variable mide una distancia en metros, la
varianza se expresa en metros al cuadrado.

Desviacin tpica
La desviacin tpica o desviacin estndar (denotada con el smbolo o s, dependiendo de la
procedencia del conjunto de datos) es una medida de dispersin para variables de razn (variables
cuantitativas o cantidades racionales) y de intervalo. Se define como la raz cuadrada de
la varianza de la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las
medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan
los datos en su distribucin respecto de la media aritmtica de dicha distribucin.

Desviacin media

En estadstica la desviacin absoluta promedio o, sencillamente desviacin media o


promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen
de la dispersin estadstica.1

Sesgo estadstico
En estadstica se llama sesgo de un estimador a la diferencia entre su esperanza
matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo
se llama insesgado o centrado. El no tener sesgo es una propiedad deseable de los
estimadores. Una propiedad relacionada con sta es la de la consistencia: un estimador
puede tener un sesgo pero el tamao de ste converge a cero conforme crece el tamao
muestral.

Coeficiente Curtosis
En teora de la probabilidad y estadstica, la curtosis es una medida que sirve para analizar el
grado de concentracin que presentan los valores de una variable analizada alrededor de la
zona central de la distribucin de frecuencias, sin necesidad de generar el grfico. La medida
de curtosis trata de estudiar la proporcin de la varianza que se explica por la combinacin de
datos extremos respecto a la media en contraposicin con datos poco alejados de la misma.

Momento central
En estadstica el momento central o centrado de orden de una variable aleatoria es
la esperanza matemtica donde es el operador de la esperanza. Si una variable aleatoria no
tiene media el momento central es indefinido. Normalmente la letra griega para el momento
central es . El primer momento central es cero y el segundo se llama varianza () donde
es la desviacin estndar. El tercer y cuarto momentos centrales sirven para definir
los momentos estndar denominados de asimetra y de curtosis.

Momento estndar
En teora de la probabilidad y estadstica, el k-simo momento estndar de una distribucin de
probabilidad es donde es el k-simo momento centrado sobre la media y es la desviacin
estndar. Es la normalizacin del k-simo momento centrado con respecto a la desviacin
estndar. La potencia de k es porque los momentos crecen como , lo que significa que son
polinomios homogneos de grado k, y as los momentos estndar son invariantes en escala.

Base de datos probabilstica


Una base de datos probabilstica es una base de datos en la que los campos tienen
asociados valores de probabilidad. Los gestores de bases de datos probabilsticas son un
rea de investigacin muy activa en la actualidad. Si bien an no hay productos comerciales,
existen diversos prototipos.

En las bases de datos probabilsticas se distingue entre el modelo de datos y su


representacin fsica, de un modo similar al de una base de datos relacional. En las
probabilsticas esta distincin es crucial porque tienen que representar nmeros muy grandes
de posibles valores, a veces exponencial.

MUESTREO NO PROBABILSTICO
Sin embargo, no es sencillo cumplir con los requisitos impuestos por el
muestreo probabilstico:
(1) Disponer de un marco muestral es algo relativamente poco habitual
en estudios de mercado.
(2) Lograr que todos los individuos de la poblacin tengan una
probabilidad no nula de ser seleccionados es un requisito igualmente
exigente, ms an conocer la probabilidad de inclusin exacta de cada
unidad muestral. Todos los individuos que no pueden ser seleccionados
en una muestra se suelen referir como unidades fuera de cobertura.

Azar
El azar es una casualidad1 presente, tericamente, en diversos fenmenos que se
caracterizan por causas complejas, no lineales y sobre todo que no parecen
ser predictibles en todos sus detalles. Dependiendo del mbito al que se aplique, se pueden
distinguir cuatro tipos de azar:

Aleatoriedad
La aleatoriedad se asocia a todo proceso cuyo resultado no es previsible ms que en razn
de la intervencin del azar. El resultado de todo suceso aleatorio no puede determinarse en
ningn caso antes de que este se produzca. El estudio de los fenmenos aleatorios queda
dentro del mbito de la teora de la probabilidad y, en un marco ms amplio, en el de
la estadstica. La palabra aleatorio se usa para expresar una aparente carencia de
propsito, causa, u orden.

Evento
En la teora de la probabilidad, un evento aleatorio o suceso aleatorio es un subconjunto de
un espacio muestral, es decir, un conjunto de posibles resultados que se pueden dar en
un experimento aleatorio. En teora de la probabilidad a cada evento aleatorio se le puede
asignar una medida de probabilidad, y el conjunto de todos los sucesos aleatorios constituye
una -lgebra de conjuntos.

Espacio muestral
En la teora de probabilidades, el espacio muestral o espacio de muestreo (denotado E, S,
o U) consiste en el conjunto de todos los posibles resultados de un experimento aleatorio,
junto con una estructura sobre el mismo (ver ms adelante). Por ejemplo, si el experimento
consiste en lanzar dos monedas, el espacio muestral es el conjunto {(cara, cara), (cara, cruz),
(cruz, cara) y (cruz, cruz)}. Un evento o suceso es cualquier subconjunto del espacio muestral
con estructura de -lgebra,1

EVENTOS MUTUAMENTE EXCLUYENTES

Todos los eventos complementarios son mutuamente excluyentes, pero todos los
eventos mutuamente excluyentes no son necesariamente complementarios.
los eventos complementarios son dos resultados de un evento, siendo stos
los dos nicos resultados posibles.

Es como lanzar una moneda y que salga cara o cruz. Claro, no hay ms
opciones, as que estos eventos son complementarios.

Eventos mutuamente excluyentes y no excluyentes

Dos o ms eventos son no excluyentes, o conjuntos, cuando es posible que ocurran ambos. Esto
no indica que necesariamente deban ocurrir estos eventos en forma simultnea.
La regla de la Adicin expresa que: la probabilidad de ocurrencia de al menos dos sucesos A y B

Dos o ms eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no tiene


efecto sobre la probabilidad de ocurrencia del otro evento (o eventos).

Regla Adicin
Establece que si dos eventos A y B son mutuamente excluyentes la probabilidad de que uno u
otro evento ocurra es igual a la suma de sus probabilidades. De lo anterior se puede deducir
que la probabilidad de que ocurra A ms la probabilidad de que no ocurra A debe sumar 1. A esto
se le llama la regla del complemento. Esta regla establece que para determinar la probabilidad
de que ocurra un evento se puede restar de 1 la probabilidad de que no ocurra.
Probabilidad
La probabilidad es una medida de la certidumbre asociada a un suceso o evento futuro y
suele expresarse como un nmero entre 0 y 1 (o entre 0% y 100%). Una forma tradicional de
estimar algunas probabilidades sera obtener la frecuencia de un acontecimiento determinado
mediante la realizacin de experimentos aleatorios, de los que se conocen todos los
resultados posibles, bajo condiciones suficientemente estables.

Regla de Multiplicacin
La regla de multiplicacin requiere que dos eventos A y B sean independientes.
Dos eventos A y B son independientes si la ocurrencia de una no afecta la probabilidad de
ocurrencia del otro.

Anda mungkin juga menyukai