Visualização de Dados com ggplot2

Marcus Nunes

João Pessoa, 17 e 18 de Maio de 2018

Apresentação

Apresentação

Preparação

Preparação

  • Curso em duas partes

  • Hoje: introdução ao ggplot2 e ao dplyr

  • Ideias básicas, mudança de paradigma e exemplos

  • Amanhã: aula prática

  • Análise de dados de gastos de deputados federais

Preparação

  • O material deste curso está disponível em um pacote no R

  • Este pacote poder ser instalado com os comandos

  • Para ter acesso ao material em seu computador, carregue o pacote normalmente através do comando

Preparação

  • Além dos conjuntos de dados, este pacote vem com um tutorial idêntico a este conjunto de slides. Basta rodar

para acessá-lo dentro da sua instalação do R ou do RStudio

Introdução

Introdução

  • ggplot2 é um pacote de visualização de dados

  • Foi criado por Hadley Wickham em 2007, baseado no livro Grammar of Graphics, de Leland Wilkinson

  • A ideia principal é criar gráficos como se eles fossem frases de uma língua, onde cada elemento do gráfico é uma palavra

Introdução

  • Isto nos permite construir gráficos tão complexos quanto quisermos

  • Os gráficos criados com esta ferramenta são, em geral, mais bonitos do que os gráficos tradicionais do R

Introdução

  • Entretanto, esta versatilidade tem dois custos associados:

    • A curva de aprendizagem do ggplot2 é um pouco maior do que das funções gráficas tradicionais do R (por exemplo, plot, boxplot e hist)

    • É uma ferramenta um pouco mais lenta para exibir os resultados dos gráficos criados

Introdução

  • Por exemplo, veja o gráfico do próximo slide

  • Este gráfico foi criado com ggplot2, utilizando poucas linhas de código

  • Como seria possível criá-lo utilizando as ferramentas tradicionais do R?

Introdução