El entorno de R
R es un entorno de programación para el análisis estadístico de datos muy usado en la academia con una gran base de usuarios. Su uso tiene muchas ventajas, para empezar, es software libre. La elección de software libre es, en general, acertada por varios motivos: por un lado, transmite valores socialmente positivos, como por ejemplo la libertad individual, el conocimiento compartido, la solidaridad y la cooperación; por otro, nos aproxima al método científico, porque permite el examen y mejora del código desarrollado por otros usuarios y la reproducibilidad de los resultados obtenidos; finalmente, pero no menos importante desde un punto de vista práctico, podemos adquirir de manera legal y gratuita copias del programa, sin necesidad de licencias personales o académicas.
Aparte de su faceta de software libre, R tiene algunas ventajas específicas: por ejemplo, su sintaxis básica es sencilla e intuitiva, con la que es muy fácil familiarizarse, lo que se traduce en un aprendizaje rápido y cómodo; además, tiene una enorme comunidad de usuarios, estructurada alrededor de la Comprehensive R Archive Network (CRAN) que desarrolla cada día nuevos paquetes que extienden sus funcionalidades y cubren casi todas las necesidades computacionales y estadísticas de un científico, ingeniero o analista de datos.
Instalación de R
Instalar R es muy sencillo, pero dependiendo del Sistema Operativo que tengamos deberemos realizar distintos pasos.
Los pasos a realizar en Windows o Mac OS X para instalar su última versión son los siguientes. En primer lugar, accederemos a la página web de la CRAN: https://cran.r-project.org/ y descargaremos la versión correspondiente a nuestro sistema operativo:
Usuarios de Windows: entrad en el enlace base, descargad R y seguid las instrucciones de instalación del documento Install R for the first time que encontraréis en esa misma página.
Usuarios de Mac OS X: descargad el fichero .pkg correspondiente y, una vez descargado, abridlo y seguid las instrucciones del Asistente de Instalación.
Usuarios de Ubuntu o Debian, para instalar la última versión de R basta que ejecutéis en una terminal, estando conectados a Internet, la siguiente instrucción:
sudo apt install r-base
.
RStudio
Una vez instalado R nos tocará instalar RStudio, un entorno de desarrollo integrado (IDE) que usaremos como interfaz gráfica para la interacción con R. Está disponible para todos los sistemas operativos. Este entorno dispone de un amplio conjunto de herramientas que facilitan el trabajo con este lenguaje. Para instalarlo, se ha de descargar la versión RStudio Desktop desde el siguiente enlace: https://www.rstudio.com/products/rstudio/download/.
Conviene recordar que RStudio no es R, ni tan solo lo contiene: hay que instalar ambos programas. De hecho, las instalaciones de ambos son independientes una de la otra, de manera que cuando se actualiza uno de estos programas, no se modifica el otro.
La terminal
La terminal (también conocida como consola) es una forma generalizada de llamar a la interfaz de usuario de línea de comandos: una pantalla donde escribiendo comandos (secuencias de palabras en lenguaje R) podemos ordenar al sistema que realice acciones concretas.
Por defecto, la consola se encuentra en el panel inferior-izquierdo. ¿Vemos la pestaña que pone Console? Inmediatamente debajo aparece un texto informativo y, finalmente, el símbolo >. Aquí es donde R espera que le demos instrucciones. Para ejecutarlas y obtener el resultado pulsamos la tecla enter.
Cuando usemos RStudio de manera interactiva lo haremos de la siguiente manera:
Escribiremos una instrucción en la consola, a la derecha de la marca de inicio de su última línea.
La ejecutaremos pulsando la tecla enter.
R la evaluará y, si corresponde, escribirá el resultado en la línea siguiente de la consola.
R abrirá una nueva línea.
A continuación tenemos un ejemplo del flujo anteriormente explicado:
> 1+1
[1] 2
>
Para facilitarnos el trabajo, la consola dispone de un mecanismo para acceder a las instrucciones ya ejecutadas y modificarlas si queremos. Si situamos el cursor a la derecha de la marca de inicio de la línea inferior y pulsamos la tecla de la flecha vertical ascendente ↑, iremos obteniendo de manera consecutiva, en esa línea, las instrucciones escritas hasta el momento en la misma sesión; si nos pasamos, podemos usar la tecla ↓ para retroceder dentro de esta lista; una vez alcanzada la instrucción deseada, podemos volver a ejecutarla o, con las teclas de flechas horizontales, ir al lugar de la instrucción que queramos y reescribir un trozo antes de ejecutarla.
Cómo guardar el trabajo realizado
Antes de empezar a utilizar R , lo primero que tenemos que hacer es crear en nuestro ordenador una carpeta específica que será la carpeta de trabajo con R. A continuación, en las Preferencias de RStudio, que podréis abrir desde el menú, tenéis que declarar esta carpeta como Default working directory. A partir de este momento, por defecto, todo el trabajo que realizemos quedará guardado dentro de esta carpeta, además RStudio buscará dentro de esta carpeta todo lo que queráis que lea. Si en un momento determinado queremos cambiar temporalmente de carpeta de trabajo, tenéis dos opciones:
Podéis usar el menú Session → Set Working Directory → Choose Directory … para escoger una carpeta.
Podéis abrir la pestaña Files de la ventana inferior derecha y navegar por el árbol de directorios que aparece en su barra superior hasta llegar a la carpeta deseada.
Tanto de una manera como de la otra, la carpeta que especifiquéis será la carpeta de trabajo durante lo que queda de sesión o hasta que la volváis a cambiar. En cualquier momento podéis guardar la sesión en la que estéis trabajando usando el menú Session → Save Workspace as… . Además, si no habéis modificado esta opción en las Preferencias, cuando cerréis RStudio se os pedirá si queréis guardar la sesión; si contestáis que sí, RStudio guardará en la carpeta de trabajo dos ficheros, .RData y .RHistory, que se cargarán automáticamente al volver a abrir RStudio y estaréis exactamente donde lo habíais dejado.
Cabe mencionar que normalmente, no nos interesará arrastrar todo lo que hayamos hecho en sesiones anteriores. Si queremos guardar algunas definiciones e instrucciones de una sesión, lo más práctico es guardarlas en un script (fichero de código).
Los gráficos que generemos con RStudio aparecerán en la ventana inferior derecha, en la pestaña Plots que se activa automáticamente cuando se crea alguno. Para guardar un gráfico, hay que ir al menú Export de esta ventana y seleccionar cómo queréis guardarlo: como una imagen en uno los formatos estándares de imágenes (.png, .jpeg, .tiff, etc.) o en formato PDF. Entonces, se abrirá una ventana donde podéis darle nombre, modificar sus dimensiones y especificar el directorio donde queráis que se guarde, entre otras opciones.
Scripts
Todos los lenguajes de programación permiten crear y usar ficheros que contienen instrucciones / código que se pueden ejecutar y guardar llamados scripts. Estos scripts son una alternativa muy cómoda a las sesiones interactivas de trabajo con el terminal, porque permiten guardar las versiones finales de las instrucciones usadas, y no toda la sesión con pruebas, errores y resultados provisionales, y facilitan la ejecución de secuencias de instrucciones en un solo paso.
Además, un script se puede guardar, volver a abrir más adelante, editar, etc. Para crear un script con RStudio, tenéis que ir al menú File → New File → R Script. Veréis que os aparece una ventana nueva en la parte superior izquierda de la ventana de RStudio, sobre la consola: la llamaremos ventana de ficheros. En ella podéis escribir, línea a línea, las instrucciones que queráis. Para ejecutar algunas instrucciones, basta que las seleccionéis y pulséis el botón Run que aparece en la barra superior de esta ventana.
Para guardar un script, basta pulsar el botón con el icono de un disquete de ordenador que aparece en la barra superior de su ventana. Otra posibilidad es usar el menú File → Save, o pulsar la combinación de teclas usual para guardar un fichero en vuestro sistema operativo, siempre y cuando la ventana activa de RStudio (donde esté el cursor en ese momento) sea la del script. Si guardamos un script concreto por primera vez, se abre una ventana de diálogo donde RStudio espera que le demos un nombre; para los scripts la costumbre es usar la extensión .R. Podéis abrir un script ya preexistente con RStudio usando el menú File → Open File de RStudio o pulsando sobre él en la pestaña Files. También podéis arrastrar el icono del script sobre el de RStudio o simplemente abrir el fichero de la manera usual en vuestro sistema operativo.
En los scripts, podemos usar el carácter # sirve para indicar a R que omita todo lo que hay a su derecha en la misma línea, lo que permite añadir comentarios a un script.
Instalar y usar librerias
La instalación que hemos realizado de R nos proporciona un sistema base, pero para extender su funcionalidad es necesario instalar paquetes adicionales.
Podemos instalar paquetes de varias formas:
A través del menú: Tools > Install packages…
En el escritorio de RStudio: Packages/Install. Vemos los paquetes que tenemos actualmente instalados y aquellos que se encuentran cargados.
Utilizando la función
install.packages()
en la terminal o en un script. El nombre del paquete que queremos instalar debe ir entre comillas, por ejemplo:install.packages("ggplot2")