Introdução Link para o cabeçalho

Recentemente um tweet meu hitou, como os jovens dizem. Ao criar um mapa comparando o número de cabeças de gado com a população de cada estado brasileiro

Como mais de 300.000 impressões de um tweet é algo impressionante para o meu perfil, resolvi compartilhar aqui no blog o código usado para este mapa.

Obtenção dos Dados Link para o cabeçalho

Os dados foram baixados do SIDRA: Sistema IBGE de Recuperação Automática. Embora seja possível recuperar estes dados manualmente, eu preferi utilizar o pacote sidrar para baixá-los de maneira automática.

# baixando os dados do sidra do ibge

library(sidrar)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.2     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.2     ✔ tidyr     1.3.0
## ✔ purrr     1.0.1     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
theme_set(theme_bw())
library(janitor)
## 
## Attaching package: 'janitor'
## 
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
rebanhos <- 
	get_sidra(x = "3939",
	          period = "2019",
						geo = "State") %>%
	clean_names() %>%
	filter(tipo_de_rebanho == "Bovino") %>%
	select(bovinos = valor, unidade_da_federacao)
## Considering all categories once 'classific' was set to 'all' (default)
populacao <- 
	get_sidra(x = "6579",
						period = "2019",
						geo = "State") %>%
	clean_names() %>%
	select(populacao = valor, unidade_da_federacao)
## Considering all categories once 'classific' was set to 'all' (default)

Veja como é fácil obter as tabelas que nos interessam. Basta informar seu número e a função get_sidra as baixa automaticamente. Uma pequena limpeza é necessária para que os dados fiquem prontos para a análise que desejamos realizar.

Em seguida, é necessário juntar os dados do rebanho bovino e da população. Isso é feito para criar uma variável indicadora, que serve justamente para identificar quais estados possuem mais cabeças de gado do que habitantes.

# juntando os conjuntos de dados de populacao e rebanho

dados <- 
	left_join(rebanhos, populacao, by = "unidade_da_federacao") %>%
	mutate(nome = str_to_upper(unidade_da_federacao)) %>%
	mutate(indicador = ifelse(bovinos > populacao, "Sim", "Não")) %>%
	mutate(indicador = factor(indicador, levels = c("Sim", "Não"))) %>%
	select(-unidade_da_federacao)

Por fim, basta plotar estas informações no mapa do Brasil. Para isso, usei a mesma técnica que já havia utilizado nos posts Análise Descritiva do Coronavírus nos Estados Brasileiros e Visualização do Mapa do Brasil Dividido por Estratos Populacionais aqui mesmo neste blog.

# mapa

library(brazilmaps)
library(sf)
## Linking to GEOS 3.11.0, GDAL 3.5.3, PROJ 9.1.0; sf_use_s2() is TRUE
mapa_br <- get_brmap("State")

mapa_br %>%
	left_join(dados, by = "nome") %>%
	ggplot() +
	geom_sf(aes(fill = indicador)) +
	scale_fill_viridis_d() + 
	labs(fill = "População Bovina\nMaior do que a\nHumana?",
			 caption = "marcusnunes.me") +
	theme_void()
## old-style crs object detected; please recreate object with a recent sf::st_crs()