¡Hola, bienvenidos a esta lección!
En estos minutos, analizaremos la estructura de datos con los que opera “R” para manejar información estadística.
Primero, ¿Cuáles son los vectores?
Los vectores son arreglos ordenados donde se puede almacenar información de diversos tipos:
La función que permite crear un vector es c() (concatenar) y dentro de los paréntesis se localizará la información que se va a almacenar. Una vez que se ha creado un vector, este debe tener un nombre pequeño y representativo del contenido de la información, que se asigna por medio del operador <-, por ejemplo:
En el ejemplo existen tres vectores (edad, deporte y comic.fav). El primero contiene la edad de cinco personas, el símbolo NA significa que no se tiene registro de la edad de una persona. El segundo es un vector lógico que guarda las respuestas a la pregunta: ¿Usted práctica algún deporte? El tercer vector contiene la historieta favorita de las personas entrevistadas.
Para poder extraer el valor de un vector, se debe escribir el nombre del vector y la posición:
Arrays y matrices
Un arreglo (array) es una matriz con diversas dimensiones, y puede contener información numérica, alfanumérica o lógica. Para crear un arreglo utilizamos la función array().
El código para realizar un arreglo de 3 x 4 x 2 con las primeras 24 letras del alfabeto es el siguiente:
Así, las matrices son arreglos de forma rectangular de filas y columnas con información numérica, alfanumérica o lógica. Para crear una matriz utilizamos la función matrix().
El código para realizar una matriz de 4x5 con los primeros 20 números positivos es el siguiente:
Data frames
Frecuentemente, los datos se disponen en tablas: Hojas de cálculo, bases de datos, ficheros csv, entre otros. contienen, esencialmente, tablas. Además, casi todos los métodos estadísticos (por ejemplo, la regresión lineal) operan sobre información organizada en tablas. Entonces, gran parte del día a día del trabajo con R consiste en manipular tablas de datos, para darles el formato necesario y acabar analizándolos estadística o gráficamente.
Esta lección abarca lo esencial del lenguaje R, pues todo lo que puede proseguir será conocimiento estadístico aplicado sobre estos objetos. Te exhortamos a la práctica continua y al autoestudio de múltiples casos de uso donde puede utilizarse este lenguaje.