Marcus Nunes, professor do Departamento de EstatĆstica da UFRN
Big Data
Visualização de dados
Curso em duas partes
Hoje: introdução ao ggplot2
e ao dplyr
Ideias bƔsicas, mudanƧa de paradigma e exemplos
Amanhã: aula prÔtica
AnƔlise de dados de gastos de deputados federais
O material deste curso estĆ” disponĆvel em um pacote no R
Este pacote poder ser instalado com os comandos
para acessÔ-lo dentro da sua instalação do R
ou do RStudio
ggplot2
é um pacote de visualização de dados
Foi criado por Hadley Wickham em 2007, baseado no livro Grammar of Graphics, de Leland Wilkinson
A ideia principal Ć© criar grĆ”ficos como se eles fossem frases de uma lĆngua, onde cada elemento do grĆ”fico Ć© uma palavra
Isto nos permite construir grÔficos tão complexos quanto quisermos
Os grÔficos criados com esta ferramenta são, em geral, mais bonitos do que os grÔficos tradicionais do R
Entretanto, esta versatilidade tem dois custos associados:
A curva de aprendizagem do ggplot2
Ʃ um pouco maior do que das funƧƵes grƔficas tradicionais do R
(por exemplo, plot
, boxplot
e hist
)
à uma ferramenta um pouco mais lenta para exibir os resultados dos grÔficos criados
Por exemplo, veja o grÔfico do próximo slide
Este grƔfico foi criado com ggplot2
, utilizando poucas linhas de código
Como seria possĆvel criĆ”-lo utilizando as ferramentas tradicionais do R
?