Visualización de datos en R | audacia
Si trabaja con datos, la visualización es una habilidad esencial. La visualización de datos no solo le permite comunicarse claramente con colegas y clientes, sino que también puede ayudarlo a comprender mejor sus datos y encontrar patrones que pueden ayudarlo en su trabajo. Con R, puede visualizar datos fácilmente. En esta publicación de blog, presentaremos algunas técnicas de visualización de datos en R.
Comencemos mirando algunos datos. Considere los siguientes nueve números, que juntaremos en un vector llamado simple_data:
datos_simples<-c(1,1,2,3,5,8,13,21,34)
Estos nueve números naturales se llaman números de Fibonacci. Tienen un patrón especial: la forma de encontrar el siguiente número en la secuencia es sumando los dos números anteriores en la secuencia (por ejemplo, 1+1=2, 1+2=3, 2+3=5, y así nosotros). Podemos visualizar estos números en R usando un comando simple:
plot(datos_simples)
Si ejecuta esto en R, debería ver el siguiente gráfico:
Cada vez que tenga algunos datos, puede graficarlos usando el trama() Comando como lo hicimos arriba. Pero no siempre queremos que todas nuestras parcelas se vean como esta. Si hacemos un solo cambio en nuestro código, podemos cambiar la apariencia de nuestra trama:
plot(datos_simples,pch=19)
Aquí, ajustamos el pch argumento en el trama() comando, configurándolo en pc=19. Si ejecuta este nuevo código, verá el siguiente resultado:
Puede ver que la apariencia de los puntos trazados ha cambiado: en lugar de círculos huecos, vemos un círculo sólido para cada punto de datos. También puede probar otros valores para el argumento pch. si configuras pc=11verás una estrella, y si configuras pc=4verás una forma de "x".
Ajuste pch no es el único cambio que podemos hacer en la apariencia de una trama. Hay muchos otros argumentos que podemos especificar en el trama() dominio. Por ejemplo, podemos ejecutar el siguiente código:
plot(simple_data,pch=19,col="red")
Aquí, hemos especificado un valor para el argumento col, que determina el color de los puntos trazados. Si ejecuta este código, verá el siguiente resultado:
De nuevo, puedes probar otros valores, como col="azul" oro col="verde" para ver cómo se ven otros colores.
Hay algunos otros argumentos importantes que podemos especificar al usar el trama() función. Aquí hay un ejemplo de un código que usa varios otros argumentos:
plot(simple_data,pch=19,col="red",main='Secuencias de Fibonacci',xlab='Índice',ylab='Número de Fibonacci')
Aquí, hemos especificado mano (el argumento que determina el título que se muestra en la trama), así como xlab (el argumento que determina la etiqueta del eje x) y ylab (el argumento que determina la etiqueta del eje y). Puede ver el siguiente resultado generado por este código:
Un argumento crucial en el trama() función es el argumento de tipo. Por ejemplo, agregue tipo = "o" a su código de trazado:
plot(simple_data,pch=19,col="red",main='Secuencias de Fibonacci',xlab='Índice',ylab='Número de Fibonacci', type='o')
Cuando ejecute este código, verá que los puntos graficados se muestran con líneas de conexión entre ellos, creando un gráfico de líneas en lugar de un diagrama de dispersión. Otros tipos de gráficos comúnmente utilizados son tipo = "l" y tipo = "p".
Otro comando que puede ser útil al crear visualizaciones es el abline() dominio. Puedes usar abline() para dibujar líneas adicionales en sus parcelas. Por ejemplo, pruebe el siguiente código:
plot(simple_data,pch=19,col="red",main='Secuencias de Fibonacci',xlab='Índice',ylab='Número de Fibonacci', type="o")
abline(h=4.5)
abline(v=6)
Cuando usas abline()puedes usar h= para especificar que desea agregar una línea horizontal, y v= para especificar que desea agregar una línea vertical. En este caso, puede ver que hemos agregado una línea horizontal y una línea vertical a la gráfica:
Al dibujar estas gráficas, podemos notar algunas cosas sobre los números de Fibonacci en nuestros datos. Lo más obvio a notar es el crecimiento exponencial de la secuencia. También podemos ver fácilmente que esta es una secuencia monótona: una en la que cada valor es al menos tan alto como el anterior. A veces, este tipo de patrones de crecimiento son difíciles de notar o de los que estar seguros sin visualizar primero los datos, y esa es una de las razones por las que la visualización de datos es tan importante.
La visualización de datos es una habilidad crucial en el mundo de la ciencia de datos. Mejorar sus habilidades de visualización de datos en R puede ayudarlo en su carrera, ya que mejorará sus habilidades de comunicación y su velocidad para comprender los datos.
¿Quiere ampliar sus conocimientos de R? La programación de Udacity para la ciencia de datos con R Nanodegree le enseñará los fundamentos de R para ayudarlo a prepararse para una carrera en ciencia de datos.