AL ENTORNO DE
1/1
Mexico, 2012
es R? Que
de R es un entorno y un lenguaje para el calculo estad stico y la generacion S. La primera version de R gracos; derivado del lenguaje de programacion en el Departamento de Estad se desarrollo stica de la Universidad de Auckland por Ross Ihaka y Robert Gentleman en 1996. R es un software libre, que se ha difundido y expandido rapidamente gracias a las aportaciones de investigadores de diferentes areas del conocimiento; perlandose como un entorno dinamico. R al ser un software libre se asienta dentro del proyecto GNU General Public License. El objetivo de la licencia GNU es declarar la libertad del uso, y distribucion del software. modicacion R conjunta una serie de paquetes incorporados al entorno R los cuales incrementan su capacidad y versatilidad, Cuenta con funciones basicas para complejos y el analisis descriptivos de datos, as como con modelos mas actuales referentes a los ultimos avances en el campo de la estad stica. R es un potente generador de gracos, permite realizar gracos simples asi como guras complejas, incluso crear animaciones.
Isabel Rodr guez, M.C. 2/1 Universidad Anahuac Mexico Norte Mexico, 2012
Ejemplos de gracos
3/1
Mexico, 2012
e instalacion Obtencion
En la pagina ocial de R, http://www.r-project.org/ se encuentran el comando download R, tal cual lo muestra la gura siguiente.
4/1
Mexico, 2012
e instalacion Obtencion
El comando download lleva a la pantalla siguiente donde la red disponible para las direcciones URL, es aqui Comprehensive R Archive esta la version de R con la donde se debe elegir el espejo de donde se obtendra que se desea trabajar.
5/1
Mexico, 2012
e instalacion Obtencion
Una vez elegido el espejo (mirror) con el que se va a trabajar se procede a elegir la plataforma donde R va a trabajar.
6/1
Mexico, 2012
e instalacion Obtencion
seleccionados el espejo, la plataforma y se desea Cuando ya se estan instalar por primera vez se deben elegir las opciones que se muestran en las de R siguientes pantallas. Es recomendable descargar la ultima version (R-2.15.1).
Una vez elegidos estos parametros el archivo R-2.15.1-win.exe se automaticamente, el cual debera ser ejecutado para iniciar el descargara proceso de instalacion.
Isabel Rodr guez, M.C. 7/1 Universidad Anahuac Mexico Norte Mexico, 2012
e instalacion Obtencion
Las pantallas siguientes muestran las opciones a elegir durante el proceso de instalacion.
Al nalizar aparece un cuadro de dialogo con la leyenda Completando la de R Windows 2.15.1, se debe oprimir el boton Finalizar y R instalacion listo para ser utilizado. estara
Isabel Rodr guez, M.C. 8/1 Universidad Anahuac Mexico Norte Mexico, 2012
9/1
Mexico, 2012
10/1
Mexico, 2012
11/1
Mexico, 2012
12/1
Mexico, 2012
de El rapido incremento en el numero de paquetes disponibles para R (mas que facilite 3500) ha hecho necesario crear un sistema de clasicacion orientarse entre ellos. Los paquetes han sido catalogados en varios grupos a de la pagina los que se puede acceder a traves CRAN (http://www.cran.r-project.org/web/views/).
14/1
Mexico, 2012
Nombre Bayesian Cluster Econometrics ExperimentalDesign Genetics MedicalImaging Optimization Psychometrics SocialSciences Survival
Descripcion Estad stica Bayesiana Conglomerados y modelos mixtos Econometr a de experimentos Diseno Modelos para la genetica Analisis de imagenes medicas Estad stica operativa Modelos psicometricos Estad stica para las C.S. Analisis de supervivencia
Nombre ClinicalTrials Distributions Environmetrics Finance Graphics Multivariate Pharmacokinetics Robust Spatial TimeSeries
Descripcion Analisis de ensayos cl nicos Distribuciones Modelos para la Ecolog a Analisis nanciero Gracos Analisis multivariado Datos farmaquineticos Metodos robustos Analisis de datos espaciales Analisis de series de tiempo
tiene una breve descripcion de los paquetes disenados. Cada clasicacion Por ejemplo en el grupo de paquetes del area de Ciencias Sociales se describen las librer as que incluyen funciones dentro del modelo lineal general, modelo lineal generalizado, analisis de datos categoricos y modelos de regresiones no-lineales.
Isabel Rodr guez, M.C. 15/1 Universidad Anahuac Mexico Norte Mexico, 2012
Ayuda en R
R cuenta con extensos recursos de ayuda, es importante famil familiarizarse Ayuda, la cual con ellos. En la barra de menus se encuentra la opcion muestra las siguientes opciones: Consola: La cual ofrece atajos utiles, por ejemplo, Ctrl+L, para borrar la pantalla de la consola R.
frecuentes sobre el funcionamiento general FAQ en R: Preguntas mas de R. frecuentes sobre R, adaptado a FAQ en R for Windows: Preguntas mas la plataforma de Windows.
Isabel Rodr guez, M.C. 16/1 Universidad Anahuac Mexico Norte Mexico, 2012
Ayuda en R
Manuales en pdf: Muestra los manuales tecnicos sobre todas las los lenguajes de caracter sticas del sistema incluyendo la instalacion, completa, y los paquetes add-on. denicion
si se Funciones R(texto)...: Solo se debe utilizar esta esta opcion que se desea informacion conoce el nombre exacto de la funcion adicional, lo cual es equivalente a escribir help(nombre de la funcion) en la l nea de comandos, o ?nombre de la funcion.
Isabel Rodr guez, M.C. 17/1 Universidad Anahuac Mexico Norte Mexico, 2012
Ayuda en R
Ayuda Html: Esta opciones para navegar por los manuales con enlaces. Cuenta con un motor de busqueda y palabras claves para buscar los t tulos de las paginas de ayuda. Es el mejor metodo de ayuda para los principiantes. Se puede iniciar desde la l nea de comandos con el comando help.start(). Buscar ayuda...: Cuando no se conoce el nombre exacto de la funcion Se puede utilizar el comando help.search(factor o paquete de interes. analysis) en el de l nea de comandos o equivalentemente ??factor analysis.
18/1
Mexico, 2012
Ayuda en R
es posible ampliar la base de la search.r-project.org...: Con esta opcion y optar por una busqueda exploracion a en la red. En la l nea de comando se teclea RSiteSearch(). sobre R accesibles en la red; R Existen variadas fuentes de informacion (https://stat.ethz.ch/mailman/listinfo/r-help) dispone de un lista de distribucion y de un buscador espec co sobre funciones, comandos o cuestiones relacionadas con R http://www.rseek.org/. La pagina principal de CRAN (Comprehensive R Archive Network; sobre R; incluye manuales http://cran.r-project.org/) tiene mucha informacion sobre paquetes o listas sobre FAQ que pueden de uso, informacion de una duda. solucionar mas
19/1
Mexico, 2012
20/1
Mexico, 2012
El caracter # se utiliza para escribir comentarios, todo lo que se escriba es ignorado por R. Se puede cambiar el numero despues de d gitos que maneja R por defecto. Tal cual se muestra en las siguientes opciones:
21/1
Mexico, 2012
Objetos en R
se conocen Un dato numerico, un vector, una matriz de datos o una funcion, en R como objetos. Cada objeto tiene caracter sticas propias y R las Para reconoce.Un objeto es la forma en la que R almacena la informacion. obtener un listado de los objetos disponibles en el espacio de trabajo pueden utilizarse las funciones ls() u objects(). simple es un numero El objeto mas o caracter numerico que puede almacenarse en un objeto de nombre x. Para almacenar un objeto es se utiliza el comando < .
el objeto x con el valor 2. Ahora R puede utilizar el valor de Aqu se creo x como asi convenga. Si se reasigna un nuevo valor a x el primer valor desaparece. Para nombrar objetos se puede usar letras, numeros, guiones o el punto. Los nombres no pueden comenzar por un caracter numerico. los nombres utilizados por R son caso-sensitivos, de tal forma que Ademas x no es equivalente a X.
Isabel Rodr guez, M.C. 22/1 Universidad Anahuac Mexico Norte Mexico, 2012
Tipos de objetos
Un objeto puede ser almacenado bajo diferentes formas (type), los mas comunes son: dobles, enteros, complejos, logicos, caracter y listas. Dobles (Double). Estos datos R los maneja por defecto. Los datos de este tipo son numeros reales (racionales e irracionales). Para vericar si un dato es doble se utilza is.double().
Enteros (Integer). Son variables numericas enteras (0,1, 2, 3, ...), . Para denir un valor numerico se utiliza as.integer().
23/1
Mexico, 2012
Tipos de objetos
contienen dos valores FALSE Logicos (logical). Los datos logico solo de evaluar (falso) y TRUE (verdadero). Son generados por R despues expresiones logicas.
La tabla siguiente muestra los s mbolos y operadores logicos validos para R: S mbolo <, <= >, >= == != & | !
Isabel Rodr guez, M.C.
Descripcion Menor que; Menor o igual que Mayor que; Mayor o igual que Igual a Diferente a y o no
24/1 Universidad Anahuac Mexico Norte Mexico, 2012
Tipos de objetos
Caracter (character). Los datos de este tipo pueden ser letras, palabras, enunciados y se representan entre comillas ( ).
typeof. Se puede determinar el tipo de dato de un objeto con la funcion del tipo de datos anteriores existe el tipo de dato complejo Ademas (complex):
25/1
Mexico, 2012
el modo del vector, mode() que junto con su El tipo de dato determinara sus atributos. longitud lenght() seran
26/1
Mexico, 2012
1. Vector
Generacion: Para construir un vector es posible utilizar la funcion c Concatenacion. (concatenar), que agrupa elementos simples o vectores denidos previamente.
Secuencias.Es posible generar secuencias numericas que se como vectores. El modo mas sencillo para hacerlo es la almacenaran del operador :. utilizacion
27/1
Mexico, 2012
1. Vector
rep() repite un vector dado, independientemente del numero La funcion de es el vector, y el elementos que contenga. El primer argumento de la funcion segundo argumento puede ser un numero que indica cuantas veces tiene que repetirse el vector.
de secuencias Si el vector estuviera formado por caracteres, la generacion letters o LETTERS. Ambas generan los 26 podr a incluir la funcion caracteres del alfabeto, en minusculas (letters) y en mayusculas (LETTERS).
28/1
Mexico, 2012
1. Vector
Operaciones: Las operaciones que se hacen sobre vectores se llevan a cabo sobre cada uno de sus elementos. Tal cual se muestra en el siguiente ejemplo.
Si los vectores no son de la misma longitud, el vector de menor longitud se hasta que tenga la misma longitud del vector mayor. repetira
29/1
Mexico, 2012
1. Vector
Funciones para vectores Funcion length(x) sum(x) prod(x) max(x) min(x) cumsum(x) cumprod(x) diff(x) unique(x) duplicated(x) median(x) mean(x) quantile(x) range(x) sd(x) var(x) summary(x)
Isabel Rodr guez, M.C.
Salida Longitud del vector x Suma de los elementos de x Producto de los elementos de x Maximo valor del vector x M nimo valor del vector x Vector de sumas acumulada de los elementos Producto acumulado de los elementos Vector de diferencias entre elementos Un vector de valores unicos duplicados Vector logico que indica si los elementos estan Mediana de los elementos de x Promedio de los elementos de x Cuantiles 0 25% 50% 75% 100% de x Rango del vector x estandar Desviacion de x Varianza de x Resumen descriptivo de x
30/1 Universidad Anahuac Mexico Norte Mexico, 2012
1. Vector
sort() ordena los elementos de un vector de forma ascendente, y La funcion a es rev(sort(x)), descendente la funcion
order() genera un vector cuyos elementos indican el orden La funcion ascendente (o descendente) que ocupan en el vector original sus elementos.
Las funciones anteriores pueden resultar triviales; sin embargo, en muchos contextos el objetivo es ordenar un conjunto de variables de acuerdo al valor de otra variable.
31/1
Mexico, 2012
1. Vector
outer(), sirve para obtener resultados de operaciones cruzadas La funcion entre dos vectores. Se obtiene una matriz de dimensiones dim(x), dim(y) sobre cuyos elementos son el resultado de aplicar una determinada funcion x, y.
32/1
Mexico, 2012
2. Factor
Factor. Es la forma en que R almacena las variables categoricas. En un factor se guardan el numero de niveles de la variable categorica, y el numero de elementos existente en cada uno de ellos. Por ejemplo, en una encuesta de calidad de servicio se levantan 133 cuestionarios, de los cuales 87 son mujeres y 46 son hombres, para generar un vector de variables categoricas y convertir el vector en factor, se debe hacer lo siguiente: despues
33/1
Mexico, 2012
2. Factor
El uso de factores reduce el espacio de almacenamiento del vector. Internamente el factor sexo se almacena como 87 valores de 1, y 46 valores de 2. Estos valores 1, 2, o sus correspondientes etiquetas mujer/hombre son los niveles del factor. El comando levels() permite ver los niveles del factor, y el orden en el que estos han sido almacenados. el orden El orden de los niveles del factor es importante porque determinara en las tablas o gracos. en que apareceran Para establecer un orden espec co, el comando a emplear ser a relevel().
Se pueden generar factores con el uso del comando cut(). Como argumento cada uno de los niveles; la opcion se especican los intervalos que deniran para ello es breaks.
34/1
Mexico, 2012
2. Factor
comunes con factores es la generacion de Una de las operaciones mas tablas de frecuencias.
35/1
Mexico, 2012
3. Matriz
Matriz. Es una clase de objeto bidimensional formado por las y columnas con elementos del mismo tipo. Las las y las columnas determinan la o atributos de la matriz (dim). Los elementos de una matriz dimension pueden ser de tipo numerico, logico o caracter y ellos denen el modo (mode) de la matriz.
36/1
Mexico, 2012
3. Matriz
de la funcion dim() sobre un vector ya existente lo convierte a La aplicacion este en una matriz con un numero de las y columnas que se especicara por medio de un vector de 2 elementos, c(no las, no columnas).
matrix() genera matrices a partir de un vector. Basta con denir el La funcion numero de las, el numero de columnas, y el modo en que se ira completando la matriz, si se hace por las (byrow = T) o por columnas (byrow = F).
37/1
Mexico, 2012
3. Matriz
Otra forma es:
38/1
Mexico, 2012
3. Matriz
cbind() unira los Puede crearse una matriz uniendo vectores. La funcion vectores por columnas, y rbind() por las.
3. Matriz
Funciones para matrices Funcion det() diag() eigen() ncol() nrow() row() solve() var() cor() %*% colnames() colSums () dim() length() Rownames() rowSums() colMeans () rowMeans () Salida Determinante Extrae los elementos de la diagonal Computa Eigenvalues y Eigenvectores Devuelve el numero de columnas de la matriz Devuelve el numero de las de la matriz Matriz cuyos elementos son el numero de la Calcula la inversa de la matriz Estima la matriz de varianzas-covarianzas Estima la matriz de correlaciones Producto matricial Nombres de las columnas de la matriz Suma los elementos de las columnas Dimensiones de la matriz Numero de elementos de la matriz Nombres de las las de la matriz Suma los elementos de las las de una matriz Obtiene la media aritmetica de cada columna Obtiene la media aritmetica de cada la
40/1
Mexico, 2012
3. Matriz
41/1
Mexico, 2012
4. Arrays (Arreglos)
Arrays. Son estructuras compuestas por elementos del mismo tipo de 3 niveles o (numerico, caracter, logico) que pueden tener mas de un array de dimensiones. En el ejemplo siguiente se muestra la creacion 2x3x2 (2 las, 3 columnas, 2 niveles).
42/1
Mexico, 2012
43/1
Mexico, 2012
as.data.frame() 4.2 Funcion Transforma cualquier objeto en un marco de datos. Por ejemplo, para convertir una matriz cualquiera en un la siguiente marco de datos se utilizara funcion:
En el ejemplo anterior R asigna los nombres V1, V2 y V3 a las columnas; names() y utilizando la funcion row.names() permiten modicarlos.
44/1
Mexico, 2012
de las/columnas 4.3 Adicion de la funcion Es posible anadir una columna a un marco de datos a traves cbind(). Si se quiere agregar al marco de datos de nombre ejemplo una nueva variable que se haya almacenada en un vector de nombre datos la sintaxis del comando ser a:
El lado izquierdo de la igualdad se establece el nombre de la variable incorporada en el nuevo marco de datos (nal). El lado derecho especica el nombre del vector anadido. Se pueden agregar las a un marco de datos provenientes de otro marco de datos con el comando rbind(), en el que se debe especicar el nombre de la estructura creada, y las variables comunes de los dos marcos de datos que se quieren integrar.
45/1
Mexico, 2012
4.4 Contenido a utilizar Para visualizar los primeros casos de un marco de datos, la funcion es head(), y para obtener un resumen de las variables que lo integran se summary(), o la funcion str(). aplica la funcion
46/1
Mexico, 2012
5. Listas
ordenada de elementos de distinto tipo, puede Una lista es una coleccion contener otra lista, y de este modo puede utilizarse para construir estructuras de datos arbitrarias. Son utilizadas por R como salidas de las funciones estad sticas. de listas 5.1 Generacion El comando list() permite crear listas; los nombres de los componentes de la list() lista pueden especicarse por medio de los argumentos de la funcion utilizando el caracter =.
47/1
Mexico, 2012
names() permite extraer los nombres de los componentes, y al La funcion mismo tiempo cambiar sus etiquetas.
es posible anadir Tambien nuevos elementos a la lista; para ello se puede utilizar el doble corchete [[ ]], o el s mbolo $:
48/1
Mexico, 2012