Anda di halaman 1dari 22

ACTUALIZACIN DE SPSS

Universidad Catlica Sedes Sapientiae

UCSS, Agosto 2013


TALLER DE ACTUALIZACIN DE SPSS

1.

Qu es un software estadstico? Es aquel software que se usa para resolver los problemas que surgen diariamente en las empresas y organismos oficiales utilizando el anlisis estadstico. Genera la informacin que necesita para tomar las mejores decisiones, presentando los resultados en forma de tablas o grficos.

2.

Qu es PASW 18? Es un software estadstico que ofrece un rpido entorno de modelamiento visual desde lo ms simple hasta lo ms complejo. Permite sacar provecho a los datos utilizando una completa gama de herramientas. Es una herramienta para el anlisis y administracin de datos capaz de producir grficos y reportes estadsticos rpidos con una gran variedad de tcnicas estadsticas especializadas. Diseado en un entorno grfico de modo que pueda accederse a todos los procedimientos sealando y pulsando el ratn.

3.

No era un curso de SPSS? Es verdad, SPSS (originalmente, Statistical Package for the Social Sciences) fue adquirida por IBM y pas a llamarse PASW (Predictive Analytics SoftWare).

4.

Por qu usar PASW 18? Por su facilidad de uso. Est ampliamente difundido. Permite trabajar con grandes cantidades de datos. Resultados fciles de exportar a Excel y Word.

5.

Cundo puedo usar PASW 18? En toda investigacin donde se recogen datos, estos deben de analizarse. El PASW es una herramienta poderosa para este fin. Cuando en el proceso de la formulacin de algn proyecto se consiguen datos de alguna institucin (INEI, municipalidades, ONG, etc.). Esta informacin se debe procesar de acuerdo a los requerimientos propios para una buena toma de decisiones.

6.

Esta capacitacin slo sirve para la versin 18? En realidad NO, las funciones ms utilizadas del SPSS se pueden encontrar de la misma forma en cualquiera de las versiones anteriores.

-2-

Taller de PASW 18

CONCEPTOS BSICOS DE ESTADSTICA DESCRIPTIVA

Definicin de Estadstica: Estadstica es la ciencia que nos proporciona un conjunto de mtodos y tcnicas que pueden servir para: Recoleccin de datos Clasificacin de datos Presentacin de datos Anlisis e interpretacin de datos

Variable: Es una caracterstica que puede tomar diferentes valores. Puede ser medible (peso, ingreso, etc.) o una cualidad no medible (estado civil, nacionalidad, etc.). Tipos de Variable: a. Variable Cualitativa: Son aquellas variables cuyos valores se expresan mediante palabras, es no numrico. a1. Variable cualitativa Nominal: Es aquella variable cuyos valores se expresan en categoras y se cuentan el nmero de observaciones pertenecientes a cada categora, pero sin ningn tipo de ordenacin entre o clasificacin. Ejemplo: estado civil, sexo, etc. a2. Variable cualitativa Ordinal: Es aquella cuyos valores se expresan en categoras pero se busca una clasificacin de orden. Ejemplo: clase social, nivel de educacin, etc. b. Variable Cuantitativa: Son aquellas variables cuyos valores se expresan por una cantidad. b1. Variable cuantitativa Discreta: Es aquella que se representa mediante los nmeros naturales y no pueden tomar ningn valor entre dos consecutivos. Ejemplo: Cantidad de alumnos. b2. Variable cuantitativa Continua: Puede tomar cualquier valor dentro de un rango, por tanto, se expresa por cualquier nmero real. Ejemplo: Promedio ponderado de un estudiante. Ejercicio: Para cada caso mencionado a continuacin, indique variable y tipo: a. b. c. d. e. f. g. h. i. j. k. l. m. n. o. p. q. r. s. t. u. Marca de refresco consumido Estado civil de una persona Escala de sueldos de una empresa Edad Calificacin obtenida en un examen Salario Religin practicada por cada individuo Grado de acuerdo o desacuerdo con la poltica fiscal Preferencia poltica Cantidad de acciones vendidas diariamente en la Bolsa de Valores de Lima Temperatura registrada durante un mes Los nmeros de la ruleta Tiempo de servicio de los empleados de una empresa Nmero de cheques girados diariamente en un mes Lugar de nacimiento de las personas que viven en Lima. Nmero de cigarrillos vendidos en una actividad. Coeficiente de inteligencia de una persona. Promedio ponderado de un egresado. Fallecidos en el hospital durante la ltima noche. Porcentaje de fallecidos por atropellos durante la ltima noche. Cantidad de errores en una gua de ejercicios. -3-

Universidad Catlica Sedes Sapientiae v. Distrito de procedencia de los alumnos.

TABLAS DE DISTRIBUCIN DE FRECUENCIAS

Cuando se tiene un conjunto de datos, este debe ser expresado, de acuerdo a algunos criterios, en alguna forma simple que permita ver rpidamente todas las caractersticas posibles para obtener conclusiones tiles. Si los datos disponibles son numerosos, es indispensable organizarlos en un cuadro o tabla resumen de las observaciones originales; estas tablas son conocidas como Tabla de Distribucin de Frecuencias (TDF). Ejemplo:

GRFICOS ESTADSTICOS

Un grfico es la representacin auxiliar de los datos o informacin estadstica, que permita a simple vista darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y caractersticas. Representacin grfica de una variable cualitativa Grfico de barras simples Se representan en el eje de las abscisas las distintas modalidades de la variable y se levantan sobre ellas las barras de bases iguales y cuya altura ser igual a la frecuencia absoluta o relativa correspondiente.

-4-

Taller de PASW 18

7 6 6 5 5 4 4 3 3 2 1 0 Educacin Eonoma Administracin Contabilidad

Grfico circular o de sectores Es la representacin grfica de un conjunto de datos en un crculo, por medio de sectores circulares. Es utilizado principalmente cuando se pretende comparar cada valor de la variable con el total. Ejemplo:

Contabilidad 27.8%

Educacin 22.2%

Economa 16.7% Administracin 33.3%

MEDIDAS DE TENDENCIA CENTRAL Los datos cuantitativos, presentados en tablas y grficos, constituyen la informacin bsica del problema. Pero es conveniente presentar medidas que muestren la informacin de manera resumida. Las medidas de tendencia central representan los fenmenos por sus valores medios, alrededor de los cuales se concentran los datos. Los clculos de esas medidas posibilitan representar un conjunto de datos relativos a la observacin de determinado fenmeno de forma resumida. Las principales medidas son: la media aritmtica, la mediana y la moda. LA MEDIA ARITMTICA Definicin.- Es la medida de tendencia central ms conocida por poseer propiedades matemticas importantes. Tambin se le conoce simplemente como media o promedio.

x=

x
i =1

LA MEDIANA

-5-

Universidad Catlica Sedes Sapientiae Definicin.- Dado un conjunto de n observaciones x1, x2, ,xn de la variable o caracterstica x, se define la mediana (Me) de este conjunto de valores, como aquel valor que no es superado ni supera a ms de la mitad de las n observaciones, arregladas en orden de magnitud creciente o decreciente. LA MODA Definicin.- Dado un conjunto de n observaciones x1, x2, ,xn de la variable o caracterstica x, se define la moda (Mo) de este conjunto de valores, como aquel valor que se presenta con mayor frecuencia. Si el conjunto de datos tiene una sola moda se llama unimodal. Si tiene dos modas se llama bimodal. En general, si tiene ms de dos modas se llama multimodal.

MEDIDAS DE DISPERSIN Una medida de tendencia central slo proporciona una cantidad limitada de informacin. Para describir una distribucin en forma ms completa, necesitamos una informacin adicional acerca de la dispersin de los datos alrededor de la medida de tendencia central. La idea de dispersin se relaciona con la mayor o menor concentracin de los datos en torno a un valor central, generalmente la media. 1. Varianza.- Cuantifica el grado de dispersin de los valores de una distribucin de frecuencias respecto a su media aritmtica. Mientras mayor sean las dispersiones de las observaciones, mayor ser el valor de la varianza. Se expresa en unidades (de los datos originales) elevadas al cuadrado.
2 (x i ) x i2 i =1 N N

2 =
2.

i =1

Desviacin Estndar.- Es la raz cuadrada de la varianza. Se expresa en las mismas unidades que los datos originales. Tambin es conocida como desviacin tpica.

EL PROCESO DE INVESTIGACIN 1. 2. 3. 4. 5. 6. 7. 8. Establecer necesidades de la informacin Definicin del problema y de los objetivos de la investigacin. Fuentes de informacin Planes de tabulacin y de cuestionarios Diseo de la muestra Trabajo de campo. Procesamiento, sistematizacin y anlisis de la informacin. Informe Final

-6-

Taller de PASW 18

INTRODUCCIN AL PASW 18

1.

Ejecucin de SPSS en el entorno Windows Una vez que se encuentre en el entorno de trabajo Windows para ejecutar el paquete estadstico SPSS: Inicio / Programas,/ SPSS Inc / Pasw Statistics 18 / Pasw Statistics 18 En muchas ocasiones, es posible que exista un icono de acceso directo en la pantalla. En este caso para ejecutar el paquete SPSS, simplemente tendr que hacer doble clic con el botn izquierdo del ratn sobre l. Otra forma sera haciendo doble clic sobre el icono correspondiente a cualquier archivo de tipo SPSS: Archivos de datos: tienen extensin .sav y estn en formato SPSS. Archivos de texto: tienen extensin .sps (archivos de sintaxis) Archivos de resultados: tienen extensin .spo Si ejecut desde el botn Inicio, aparece la presentacin del programa:

Si hacemos clic en Cancelar se pasa directo a la ventana Editor de Datos. 2. Pasos bsicos a seguir con PASW 18

-7-

Universidad Catlica Sedes Sapientiae Introducir los datos en SPSS. Es posible: - Introducir nuevos datos. - Ejecutar una consulta creada anteriormente. - Crear una consulta mediante el asistente de captura de base de datos. - Abrir un archivo creado anteriormente. Seleccionar un procedimiento estadstico para analizar los datos con el sistema de mens o para crear un grfico. Seleccionar las variables para el anlisis: las variables que podemos usar en cada procedimiento se muestran en un cuadro de dilogo del que se seleccionan. Ejecutar el procedimiento y ver los resultados. Los resultados aparecen en una ventana de resultados y se pueden guardar como archivos con extensin .spo. Los grficos se pueden modificar en la ventana del editor de grficos.

3.

Archivos de datos Para abrir un archivo de datos guardado en formato SPSS, seleccionar en el men principal Archivo/ Abrir/ Datos Por defecto, SPSS dar una relacin de los archivos de su directorio con extensin .sav. Buscar y seleccionar el archivo que desee abrir. Adems de los archivos guardados en formato SPSS, se pueden abrir archivos de EXCEL, LOTUS 1-2-3, dBASE y archivos delimitados por tabuladores sin necesidad de convertirlos a un formato intermedio ni de introducir informacin sobre la definicin de los datos.

4.

Ventanas de SPSS. Las ventanas de SPSS son las que se detallan a continuacin:

Editor de datos. Es la ventana que se abre automticamente cuando se inicia una sesin de SPSS. En ella se muestra el contenido del archivo de datos con el que estemos trabajando. Con el editor de datos podemos crear nuevos archivos o modificar los existentes. Con la versin actual de SPSS (18) se puede tener ms de un archivo de datos abierto al mismo tiempo. Proporciona dos vistas de los datos: Vista de datos: muestra los valores de datos reales o las etiquetas de valor definidas: - Las filas son casos. Cada fila representa un caso u observacin. - Las columnas son variables. Cada columna representa una variable o caracterstica que se mide. - Las casillas contienen valores numricos o de cadena, siendo ste un valor nico de una variable para cada caso. A diferencia de una hoja de clculo, las casillas del editor de datos no pueden contener frmulas. - No hay casillas vacas en los lmites del archivo de datos. Para variables numricas, las casillas se convierten en valores perdidos (missing) por el sistema. Para variables cadena, un espacio en blanco se considera un valor vlido.

-8-

Taller de PASW 18

Vista de variables: contiene descripciones de las caractersticas de cada variable del archivo de datos. Aqu: - Las filas son variables. - Las columnas son caractersticas de las variables.

Visor de resultados. En l se muestran todas las tablas, grficos y resultados estadsticos obtenidos con SPSS. Visor de borrador. En este se muestran los resultados como texto normal en lugar de tablas pivote interactivas. Editor de tablas pivote. Permite editar los resultados mostrados en las tablas pivotes de diferentes maneras. Editor de grficos. Permite editar todos los grficos y diagramas generados por SPSS. Editor de resultados de texto. Permite editar los resultados de texto que no aparecen en las tablas pivote.

-9-

Universidad Catlica Sedes Sapientiae Editor de sintaxis. Permite pegar la sintaxis de comandos de los procedimientos generados en los cuadros de dilogo. Editor de procesos. Permite crear y modificar los procesos estadsticos creados. Adems de las distintas ventanas con las que se puede trabajar en SPSS, existen un conjunto de elementos, comunes a todas ellas que configuran la apariencia general de SPSS: Barra de ttulos. Muestra el icono de SPSS que sirve como botn de control, sigue con el nombre del fichero que estamos utilizando y el nombre de la ventana activa y termina con los botones de minimizar, maximizar y cerrar la ventana. Barra de mens. Recoge las denominaciones de los mens de SPSS, a travs de los cuales se pueden ejecutar todos los posibles comandos que proporciona el paquete. Barra de herramientas. Proporciona un acceso rpido y fcil a las tareas ms comunes de cada ventana de SPSS. Barra de estado. Suministra informacin sobre el estado en que se encuentra SPSS. Adems, aporta la siguiente informacin acerca de los casos: 5. Filtrado. Informa acerca de la existencia de una seleccin de los casos que aparecen en el archivo de datos. Ponderado. Informa acerca de la existencia de una variable de ponderacin de los casos que aparecen en el archivo de datos. Segmentado. Informa acerca de la segmentacin del archivo.

COMENZAR A TRABAJAR CON SPSS Creacin de un archivo de datos nuevo Para crear un archivo de datos nuevo: Archivo / Nuevo / Datos, crendose de esta forma un archivo de datos. Definicin de variables Una vez que nos encontramos en la ventana de edicin de datos de SPSS podemos abrir un archivo de datos creado con anterioridad o crear un nuevo archivo de datos. En el caso en que queramos crear un archivo de datos nuevo, el primer paso que deberemos seguir es el de definir las variables de las que se va a constituir el archivo. Para definir una variable se pueden seguir dos procedimientos: Haciendo doble clic con el botn izquierdo del ratn cuando el puntero del mismo se encuentra situado en la palabra var del extremo superior de la columna (en la vista de datos). pulsar en la pestaa vista de variables.

Para la especificacin del nombre de las variables se debe tener en cuenta: Cada nombre de variable debe ser nico. El nombre debe comenzar por una letra. Los dems caracteres pueden ser letras, dgitos, puntos o los smbolos @, #, _ o $. Los nombres de variable no pueden terminar en punto. Se deben evitar los nombres de variable que terminan con subrayado (para evitar conflictos con las variables creadas automticamente por algunos procedimientos). La longitud del nombre no debe exceder los 64 bytes. Sesenta y cuatro bytes suelen equivaler a 64 caracteres en idiomas de un solo byte (por ejemplo, ingls, francs, alemn, espaol, italiano, hebreo, ruso, griego, rabe, tailands) y 32 caracteres en los idiomas de dos bytes (por ejemplo, japons, chino, coreano). No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, !, ?, ' y *). Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras reservadas son: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH.

- 10 -

Taller de PASW 18 Los nombres de variable se pueden definir combinando de cualquier manera caracteres en maysculas y en minsculas, esta distincin entre maysculas y minsculas se conserva en lo que se refiere a la visualizacin. Cuando es necesario dividir los nombres largos de variable en varias lneas en los resultados, SPSS intenta dividir las lneas aprovechando los subrayados, los puntos y los cambios de minsculas a maysculas.

Una vez se haya determinado el nombre de la variable, habr que definir las especificaciones de la variable: Tipo. Especifica el tipo datos que contiene la variable. Los valores de estas variables, en funcin del tipo seleccionado sern visualizadas segn un patrn determinado y slo estarn disponibles para estas variables aquellas operaciones que son esperables para el tipo de que se trate en cada caso. Si se pulsa el botn tipo y luego en los puntos suspensivos que aparecen en la casilla tenemos un cuadro de dilogo en el que se presentan los siguientes tipos de variables posibles: o o Numrico. Variable cuyos valores son nmeros. El editor de datos acepta valores numricos en formato estndar o en notacin cientfica. Coma. Define una variable numrica cuyos valores se muestran con comas de separacin cada tres posiciones y con un punto como separador de la parte decimal. El editor de datos acepta los valores numricos para las variables con comas o sin las comas, o en notacin cientfica.

o o

Punto. Define una variable numrica cuyos valores se muestran con puntos de separacin cada tres posiciones y con una coma como separador de la parte decimal. El editor de datos acepta valores numricos para este tipo de variables, con o sin puntos, o en notacin cientfica. Notacin cientfica. Define una variable numrica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez. El editor de datos acepta para estas variables valores numricos con o sin el exponente. El exponente puede ir precedido de E o D con un signo opcional, o por el signo solamente. Por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2, o incluso 1,23+2. Fecha. Variable numrica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. Seleccione una plantilla de la lista desplegable. Puede introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o espacios en blanco. El rango de siglo para los aos de dos dgitos se toma de las opciones de configuracin (Men Edicin, Opciones, pestaa Datos) Dlar. Define una variable numrica cuyos valores contienen un signo de dlar, una coma para la separacin de los decimales y mltiples puntos. Moneda personalizada. Variable numrica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaa Moneda del cuadro de dilogo Opciones del men Edicin. Los caracteres definidos en

- 11 -

Universidad Catlica Sedes Sapientiae la moneda personalizada no pueden emplearse para la introduccin de datos pero s los mostrar el editor de datos. Cadena. Variable cuyos valores no son numricos y, por ello, no se utilizan en los clculos. Pueden contener cualesquiera caracteres hasta la longitud definida. Las maysculas y las minsculas son consideradas diferentes. Tambin son conocidas como variables alfanumricas.

Anchura. Determina el nmero de caracteres mximo que contiene los valores de la variable. Por defecto aparecen 8 caracteres. Decimales. Especifica el nmero de decimales de la variable. Si la variable es tipo cadena, por defecto aparecen 0 decimales. Si es tipo numrica, aparecen por defecto, 2 decimales. Etiqueta de variable. Recoge una breve descripcin de la variable. Se visualiza en vista de datos, acercando el cursor al nombre de la variable. Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128 caracteres en los idiomas de doble byte). Las etiquetas de variable pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable. Etiqueta de valor). Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente til si el archivo de datos utiliza cdigos numricos para representar categoras que no son numricas (por ejemplo, cdigos 1 y 2 para hombre y mujer).

Valores perdidos. Se trata de valores que no son considerados a la hora de realizar determinados anlisis estadsticos. Existen dos tipos de valores perdidos: - Del sistema. Cualquier casilla en blanco de la matriz de datos. - Del usuario. Define los valores de los datos definidos como perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayora de los clculos. Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango ms un valor de tipo discreto. Slo pueden especificarse rangos para las variables numricas. Se considera que son vlidos todos los valores de cadena, incluidos los valores vacos o nulos, a no ser que se definan explcitamente como perdidos.

- 12 -

Taller de PASW 18 Columna y alineacin. Debemos pulsar en la vista de variables la casilla correspondiente a Columna, para elegir el ancho deseado para una columna y Alineacin, si queremos cambiar la justificacin de los datos. Nivel de medida de la variable. Finalmente, hemos de especificar si nos encontramos ante una variable: - Escala: aqulla en la que puede cuantificarse la distancia entre sus valores, por ejemplo la variable peso. Las variables de escala deben ser numricas. - Ordinal: aqulla en la que puede establecerse un determinado orden entre los valores, por ejemplo, la variable consumo con los valores bajo, medio y alto. Las variables ordinales pueden ser valores de cadena (alfanumricos) o numricos que representen diferentes categoras (por ejemplo, 1 = bajo, 2 = medio, 3 = alto). Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo, medio (orden que no es el correcto). Por norma general, se puede indicar que es ms fiable utilizar cdigos numricos para representar datos ordinales.

Nominal: Los valores de datos representan categoras sin un orden intrnseco (por ejemplo, categora laboral o divisin de la compaa). Las variables nominales pueden ser valores de cadena (alfanumricos) o numricos que representen diferentes categoras (por ejemplo, 1 = hombre, 2 = mujer).

Una variable cualitativa o atributo va a tener una escala nomina u ordinal. Una variable cuantitativa va a tener un nivel de medida tipo escala. Introduccin de datos y utilizacin de datos ya creados. Una vez definidas las variables, para la introduccin de datos (en la pestaa vista de datos) simplemente habr que situar el cursor en la primera celda de la columna y comenzar a digitar los distintos valores con el teclado de acuerdo con las especificaciones de cada variable definida y pulsar ENTER o movindonos con el cursor. Insertar un nuevo caso entre los casos existentes: Insertar una nueva variable entre variables existentes: Mover variables. Borrar algn caso o variable: Ir a un caso en el Editor de datos: Buscar un valor de datos en el Editor de datos: Guardar datos y salir de SPSS Para guardar un archivo de datos creado tendremos que situarnos en: Archivo/ Guardar como nos aparecer un cuadro de dilogo en el cual deberemos indicar el nombre del archivo que queremos guardar, as como el lugar donde queremos guardarlo. En el caso en que se trate de cambios en un archivo que ya ha sido guardado con anterioridad, slo tendremos que situarnos en Archivo / Guardar y el contenido del archivo se habr guardado con el mismo nombre y ubicacin donde se guard con anterioridad. Finalmente, para salir de SPSS, nos situamos en Archivo /Salir , y a continuacin se cerrar la sesin de SPSS. Ejercicio: - 13 -

Universidad Catlica Sedes Sapientiae La siguiente tabla nos muestra la edad de 48 trabajadores de una determinada empresa. La variable edad es cuantitativa y mostramos sus valores, La variable sexo es cualitativa y utilizamos una escala nominal (1, hombre; 2, mujer). Los datos son los siguientes: Hombres 32 55 48 39 37 39 48 46 36 56 40 31 32 37 43 47 51 42 62 53 40 43 33 32 Mujeres 50 49 37 30 44 33 26 37 35 54 34 31 60 30 34 27 26 33 35 28 41 26 41 31 a) Crea un archivo con la definicin anterior de las variables y los datos, y gurdalo con el nombre EDAD.SAV. b) Crea una nueva variable situada entre las dos anteriores en el archivo, denominada SUELDO y le das los valores que quieras, teniendo en cuenta que se refiere al sueldo mensual que cobran en la empresa (en soles). En la vista de variables, da los atributos necesarios.

CREACIN O TRANSFORMACIN DE VARIABLES Este comando nos va a permitir crear nuevas variables o transformar las ya existentes mediante el uso de operadores aritmticos, funciones aritmticas, funciones estadsticas, funciones lgicas, funciones de cadena, funciones de fecha y hora, funciones de distribucin, funciones de variables aleatorias y funciones de valores perdidos. Men Transformar/ Calcular...

1. Asignar un nombre a la nueva variable. Este nombre lo introduciremos en la celda Variable de destino. 2. Especificar el tipo de variable que queremos crear y, opcionalmente, la etiqueta de la nueva variable.

- 14 -

Taller de PASW 18 3. En Expresin numrica tendremos que escribir la expresin a travs de la cual se determina los distintos valores que toma esta nueva variable. Para ello tenemos una serie de botones con dgitos del 0 al 9, operadores aritmticos, operadores lgicos, etc. Adems, tenemos un conjunto de funciones que nos permitirn realizar distintas operaciones. Una vez seleccionado un grupo concreto de funciones, seleccionaremos una funcin determinada. 4. Con el botn "Si..." podemos establecer una expresin condicional. De esta forma, la nueva variable slo se calcular para aquellos casos en los cuales se cumpla la condicin. En aquellos casos, en los que no se cumpla la condicin la nueva variable no tomar ningn valor y, como resultado de ello, tendremos un valor perdido del sistema. Al presionar dicho botn aparece un cuadro de dilogo, deberemos seleccionar la opcin Incluir si el caso satisface la condicin y establecer la condicin que ha de cumplir un determinado caso para que el valor correspondiente de la nueva variable sea calculado. Finalmente haremos clic en el botn "Continuar". 5. Hacer clic en el botn "Aceptar" del cuadro de dilogo de Calcular variable.

Ejemplo 1: (Archivo 200.sav): Calcula una nueva variable denominada futuro, definida como el doble de la edad actual. Esta nueva variable slo deber generarse para aquellos hombres de edad comprendida entre 20 y 45 aos.

RECODIFICAR VARIABLES Permite modificar los valores de las variables recodificndolos. Esto es til para aadir o combinar categoras en una variable. El resultado de la recodificacin puede guardarse en la misma variable, sustituyendo as los valores originales, o bien generar una nueva variable. a) Para recodificar los valores de una variable en la misma variable: Elegir los mens: Transformar/ Recodificar/ En las mismas variables... Seleccionar las variables que se deseen recodificar. Si se seleccionan varias variables, debern ser del mismo tipo (numricas o de cadena). Pulsar en Valores antiguos y nuevos y especificar cmo recodificar los valores.

b)

Para recodificar los valores de una variable en una nueva variable: Elegir los mens: Transformar/ Recodificar/ En distintas variables... Seleccionar las variables que se deseen recodificar. Si se seleccionan varias variables, debern ser del mismo tipo (numricas o de cadena). Introducir el nombre de una (nueva variable) de los resultados para cada variable seleccionada y pulsar Cambiar. Pulsar en Valores antiguos y nuevos y especificar cmo recodificar los valores.

MANIPULACIN DE ARCHIVOS a) Ordenar datos Permite ordenar todos los casos de un archivo, utilizando como criterio una o ms variables. Men Datos / Ordenar casos. Entonces, aparecer en pantalla un cuadro de dilogo:

- 15 -

Universidad Catlica Sedes Sapientiae

Deberemos introducir en el cuadro "Ordenar por", en primer lugar, la variable que va a constituir el criterio de ordenacin principal y, a continuacin, la variable o variables que se van a tener en cuenta cuando existan determinados casos que tengan para dicha variable el mismo valor. Asimismo, habr que especificar el "Orden de clasificacin", es decir, si queremos que los casos los ordene de menor a mayor (ascendente) o de mayor a menor (descendente). Ejemplo 2: (Archivo 200.sav): Ordena los casos por la edad en orden ascendente y en el caso de que tengan varios encuestados la misma edad, por el sexo en orden ascendente.

b)

Agrupar datos Esta opcin permite agrupar casos basndose en los valores de una variable de agrupacin y crear un nuevo archivo donde habr un caso por cada grupo. Men Datos / Agregar / Variable de segmentacin: /Variables agregadas: Funcin /Crear archivo El resultado de la agrupacin puede aparecer en el archivo activo, en un nuevo conjunto de datos o en un nuevo archivo. Segmentar archivos. Este comando nos va a permitir dividir nuestro archivo de datos en distintos grupos de elementos. Por ejemplo, pensemos que tenemos las variables peso, edad y sexo. Podramos estudiar el peso y la edad por separado en los hombres y en las mujeres. Men Datos / Segmentar archivo o emplear el botn de la barra de herramientas: Segmentar un archivo es un procedimiento que crea un nuevo grupo cada vez que aparece un nuevo valor de la variable que se emplea para segmentar el archivo de datos. Las opciones que podemos seleccionar en el cuadro de dilogo son: Analizar todos los casos, no crear los grupos: Analiza todos los casos juntos. De esta manera, si se selecciona esta opcin se dejar de realizar los distintos anlisis estadsticos para cada uno de los posibles grupos en que estuviera segmentado el archivo, pasando a realizarse sobre el total de casos. Comparar los grupos: Los resultados obtenidos tras la ejecucin de un determinado procedimiento se presentan juntos para que puedan ser comparados. Organizar los resultados por grupos: Los resultados de cada grupo se presentan por separado para cada grupo en que est segmentado el archivo.

c)

Finalmente, hay dos opciones ms que se activan cuando seleccionamos Comparar los grupos u Organizar los resultados por grupos: Ordenar los archivos segn variable de agrupacin: El archivo es ordenado en funcin de los valores de las variables que aparecen en la lista Grupos basados en, teniendo en cuenta el orden en que dichas variables aparecen en la lista. Seleccionaremos esta opcin cuando el archivo de datos no est ordenado segn los valores de las variables de agrupacin. El archivo ya est ordenado: El archivo ya est ordenado por las variables que aparecen en la lista Grupos basados en. Con los archivos muy grandes esta opcin tiene la ventaja de que nos permite ahorrar bastante tiempo de procesamiento. Sin embargo, tiene el inconveniente de que puede aparecer un gran nmero de grupos intiles en el supuesto de que el archivo no est ordenado en el orden correcto.

Ejemplo 3: (Archivo 200.sav): Separa los datos en grupos en funcin de la variable sexo. Calcula a continuacin las medias aritmticas de cada grupo, las varianzas y las desviaciones tpicas de tal forma que aparezcan todos los resultados en una sola tabla para facilitar su comparacin, para la variable Edad.

- 16 -

Taller de PASW 18 d) Seleccionar submuestras de datos En definitiva, la opcin Seleccionar casos del men Datos nos permitir trabajar con un subconjunto de casos o submuestra en lugar de con el total. Las caractersticas de la submuestra de datos dependern de la forma en que la hayamos escogido. Men Datos / Seleccionar casos o pulsar el botn de la barra de herramientas:

De esta forma, aparecer en pantalla un cuadro de dilogo en el que existen 5 opciones: Todos los casos: Esta es la opcin por defecto. Si escogemos esta opcin, todos los procedimientos estadsticos que realicemos sern aplicados sobre el conjunto de todos los casos. Si hemos filtrado nuestro archivo de datos de tal forma que slo estamos considerando determinados casos y queremos de nuevo trabajar con todos los casos, ser necesario que seleccionemos esta opcin. Si se satisface la condicin: Se establece una condicin para incluir o no en la seleccin a cada uno de los casos. Si un caso cumple la condicin, es seleccionado. Si no la cumple, no es seleccionado. Muestra aleatoria de casos: Selecciona una muestra aleatoria basndose en un porcentaje aproximado del nmero total de casos o en un nmero exacto de casos. Basndose en el rango del tiempo o de los casos: Sirve para seleccionar una muestra de sujetos adyacentes. Por ejemplo, para seleccionar del elemento 5 al 15, una vez - 17 -

Universidad Catlica Sedes Sapientiae seleccionada esta opcin, haramos clic en el botn Rango y, posteriormente, en el nuevo cuadro de dilogo teclearamos 5 como Primer caso y 15 como ltimo caso. Usar variable de filtro: Utiliza como variable para el filtrado la variable escogida del archivo de datos. Se seleccionan todos los casos que tomen para dicha variable un valor distinto de cero o que no sean valores perdidos del sistema.

El resultado puede ser: Los casos no seleccionados son descartados (aparecen tachados) Los casos seleccionados se copian en un nuevo conjunto de datos. Los casos no seleccionados sern borrados de forma permanente de la ventana

Ejemplo 4: Selecciona aquellas mujeres que tengan una edad comprendida entre 25 y 45 aos (no elimines los casos no seleccionados!!!). Determina la media aritmtica y desviacin tpica de la variable Edad. e) AGRUPACIN VISUAL La agrupacin visual est diseada para ayudar a "categorizar" datos de escala en rangos categricos (por ejemplo, edad en rangos de 10 aos). Su objetivo es el de ayudar en el proceso de creacin de variables nuevas, basado en la agrupacin de los valores contiguos de las variables existentes para dar lugar a un nmero limitado de categoras diferentes. Puede utilizarse para: Crear variables categricas a partir de variables de escala continuas. Por ejemplo, puede utilizar una variable de escala con el peso para crear una variable categrica nueva que contenga intervalos de peso. Colapsar un nmero elevado de categoras ordinales en un conjunto menor de categoras. Por ejemplo, es posible colapsar una escala de evaluacin de nueve categoras en tres categoras que representen: bajo, medio y alto. El procedimiento: 1. Transformar/ Agrupacin Visual/ Seleccionar la variable numrica de escala u ordinales para la que se desea crear nuevas variables categricas (por ej. peso). 2. Poner el nombre a la nueva variable (xpeso) 3. Crear puntos de corte. Hay tres opciones: a) Generar intervalos de la misma amplitud b) A travs de percentiles c) A travs de puntos de corte en la media y en desviaciones tpicas seleccionadas 4. Aplicar. 5. Poner etiqueta a los intervalos que van a crearse. Aceptar. Como alternativa, puede limitar la cantidad de casos que se van a explorar. Con los archivos de datos que contengan un gran nmero de casos, la limitacin del nmero de casos que se va a explorar puede ahorrar tiempo, pero debe evitarse este procedimiento en lo posible, ya que influir en la distribucin de los valores que sern utilizados en los clculos posteriores en la Agrupacin Visual. Nota: Las variables de cadena no se muestran en la lista de variables origen. La Agrupacin Visual requiere que las variables sean numricas, puesto que asume que los valores de los datos representan algn tipo de orden lgico que puede ser utilizado para agrupar los valores con sentido.

GENERANDO ANLISIS DESCRIPTIVOS CON SPSS


Tablas de Frecuencia Simples (Para variables discretas con pocos valores distintos y atributos) Procedimiento: Analizar / Estadsticos descriptivos / Frecuencias. Como resultado de esta operacin aparecer el cuadro de dilogo Frecuencias:

- 18 -

Taller de PASW 18

Habr que seleccionar en el recuadro de la izquierda, la variable o variables de las cuales se desee elaborar la tabla de frecuencias y desplazarla al recuadro de Variables, haciendo un clic en la flecha azul situada entre estos los dos recuadros. Despus seleccionar la opcin Mostrar tablas de frecuencias y pulsar el botn Aceptar. El visor de resultados de SPSS mostrar la tabla de frecuencias que se ha elaborado. Tablas de Frecuencia con datos agrupados en intervalos (para variables continuas o discretas con muchos valores distintos) Para la elaboracin de tablas de frecuencias con datos agrupados en intervalos, antes de acceder al men de Frecuencias (como en el caso anterior), hay que crear una nueva variable categrica a partir de la variable de inters, que contenga los intervalos. Para ello utilizaremos la opcin vista ya Transformar / Agrupacin visual. El cuadro de dialogo de la agrupacin visual permite: Crear variables categricas a partir de variables de escala continuas. Por ejemplo, puede utilizar una variable de escala, como el peso, para crear una variable categrica nueva que contenga intervalos de peso. Colapsar un nmero elevado de categoras ordinales en un conjunto menor de categoras. Por ejemplo, es posible colapsar una escala de evaluacin de nueve categoras en tres categoras que representen: bajo, medio y alto.

Una vez seleccionada la variable de inters (ej: salarios), le damos nombre a la nueva variable que vamos a crear, por ejemplo, SALARIOS1. Adems nos aparece el valor mnimo y mximo de la variable.

Ponderaciones En algunos casos se dispone de los datos ya tabulados, de modo que la elaboracin de una tabla de frecuencias con SPSS no ser necesaria. Para la introduccin de estos datos en el editor de datos de SPSS no es necesario repetir un mismo valor tantas veces como indique su frecuencia absoluta, sino que ser suficiente con ponderar los distintos valores de la variable con sus frecuencias absolutas o relativas. Igualmente, nos podemos encontrar con una variable ponderada por una serie de valores de ponderacin que tienen que coincidir necesariamente con las frecuencias absolutas o relativas de la variable. Para ponderar una variable, el primer paso que se debe seguir es crear una variable de tipo numrica mediante los procedimientos expuestos en el tema anterior que denominaremos frecuencia o ponderacin segn los casos, en la que se introducirn los valores de las frecuencias o ponderaciones de cada uno de los valores de la variable que se desee ponderar.

GRFICOS Nos proporcionan una idea del comportamiento global de una determinada variable. El SPSS nos proporciona una amplia gama de representaciones grficas.

- 19 -

Universidad Catlica Sedes Sapientiae Para obtenerlas tenemos varias alternativas: bien directamente usando el men Grficos, o bien indirectamente, al utilizar determinados procedimientos estadsticos del SPSS (del men Analizar) que incluyen grficos relacionados con la tcnica seleccionada. Veamos algunos ejemplos: Grficos > Cuadros de dilogo antiguos Este men nos brinda la posibilidad de generar una gran gama de representaciones grficas. Describiremos algunas de ellas: Barras...: Nos va a permitir crear 3 clases distintas de diagramas de barras. En primer lugar, deberemos seleccionar alguna de las siguiente opciones: Simple: Generar una barra distinta para cada uno de los valores de la variable o para cada una de las modalidades del atributo. Agrupado: Crea un grfico que resume las categoras de una variable dentro de las categoras de otra variable. Apilado: Crea un grfico en el que los segmentos de barras aparecen apilados unos sobre otros. Aparece una barra para cada valor de la variable de eje de categoras. Los segmentos de cada barra representan categoras de la variable apilada.

En relacin con el cuadro "Los datos del grfico son", el significado de las opciones se detalla a continuacin: Resmenes para grupos de casos: Se resumen las categoras (valores o modalidades) de una sola variable o atributo. Resmenes para distintas variables: Se resumen dos o ms variables. Cada barra representa una de las variables. La altura de cada barra ser por defecto igual a la media aritmtica de todos los valores que toma dicha variable1. Valores individuales de los casos: Se resume una nica variable. Cada barra representa un caso individual. La altura de cada barra viene determinada por el valor que toma la variable que est siendo representada en cada caso individual. Una vez elegido el tipo de grfico y de datos; pulsamos en el botn "Definir" del cuadro de dilogo. Entonces, surgir en pantalla un cuadro de dilogo que incluye, entre otros, los siguientes aspectos:

- 20 -

Taller de PASW 18 En el cuadro "Las barras representan" tendremos que indicar si queremos representar frecuencias absolutas, porcentajes u otra funcin resumen. En el cuadro "Eje de categoras" debemos elegir la/s variable/s que vamos a representar. Lneas...: El programa SPSS nos permite generar 3 tipos distintos de grficos de lneas. Hay que establecer, en primer lugar, el tipo de grfico de lneas que se quiere llevar a cabo. Para ello habr que seleccionar alguna de las tres opciones siguientes: Simple: Grfico que muestra una sola lnea. Mltiple: Grfico que permite comparar la distribucin de valores entre diferentes grupos. Lneas verticales: Grfico que presenta lneas verticales que conectan los marcadores dentro de cada categora. Los marcadores vendrn definidos por otra variable distinta.

Sectores...: Empleando esta opcin podremos generar diagramas de sectores, que tambin se denominan diagramas de tarta o de pastel. Las opciones ya han sido explicadas anteriormente en el diagrama de barras. Lo normal ser escoger "Resmenes para grupos de casos" dado que esta opcin genera un grfico en el que cada sector representa al porcentaje de valores de una determinada categora.

ESTADSTICOS DESCRIPTIVOS El programa SPSS nos da la posibilidad de estudiar las caractersticas de las variables que estemos analizando a travs del clculo de las siguientes medidas: Medidas de tendencia central: Entre ellas cabe destacar: la media aritmtica, la mediana y la moda. Medidas de dispersin: El programa SPSS nos proporciona las siguientes: la varianza, la desviacin tpica y el rango o recorrido. Medidas de forma: con ellas podemos estudiar la asimetra y curtosis.

Para proceder al clculo de estas medidas, existen varias alternativas: a) Men: Analizar > Estadsticos descriptivos > Descriptivos: Introducimos la/s variable/s para las que queremos calcular estas medidas, en el cuadro Variables y pulsamos Opciones. De esta manera, aparecer en pantalla un cuadro de dilogo que nos ofrece algunos de los estadsticos vistos en teora. La opcin "Guardar valores tipificados como variables" genera una/s variable/s en la ventana Editor de datos que contiene/n los valores tipificados de las variable/s que hayamos situado en el cuadro "Variables". b) Men; Analizar > Estadsticos descriptivos > Frecuencias: Introducimos en el cuadro "Variable" las variables sobre las cuales queremos calcular estas medidas. Damos a Estadsticos. De esta forma, surgir en pantalla un cuadro de dilogo: Valores percentiles: Podemos calcular los cuartiles y percentiles, y por defecto presenta los valores que dividen a la distribucin en 10 grupos de igual tamao (deciles). Puede modificarse el n de grupos introduciendo otro valor entre 2 y 100 (centiles). Tambin podemos calcular algn percentil especfico introduciendo el nmero que queremos calcular en el cuadro de Percentiles y pulsando Aadir. Dispersin: En este cuadro encontramos: Desviacin Tpica, Varianza, Rango, Mnimo, Mximo y Error tipo de la media (es una estimacin de la variabilidad muestral de la media). Tendencia central: Podemos seleccionar entre Media, Mediana, Moda y Suma (es la suma de los valores de todos los casos para una determinada variable, eliminando los valores perdidos). Distribucin: Podemos calcular los ndices de asimetra y curtosis.

Finalmente, la opcin "Los valores son puntos medios de grupos" calcula los estadsticos del valor percentil y la mediana bajo el supuesto de que sus datos han sido agrupados y que los valores - 21 -

Universidad Catlica Sedes Sapientiae presentes en los datos son puntos medios de los grupos. Por ejemplo, si las edades de todas las personas entre treinta y cuarenta aos se codifican como 35, seleccione esta opcin para estimar la mediana y los percentiles para los datos originales no agrupados.

- 22 -

Anda mungkin juga menyukai