Rendimiento de los cultivos importantes de Bolivia

R Data Science Crop Yield

Tendencias de rendimiento de los cultivos más importantes de Bolivia desde 1984 hasta 2019.

Author

Affiliation

Franklin Santos ORCID ID

AgriTech Bolivia

Published

Jan. 1, 2021

Citation

Santos, 2021

Introducción

La agricultura de Bolivia es muy variada; sin embargo, los cultivos más importantes se basan en trigo, arroz, maíz y papa. Las estadísticas de rendimiento son para observar las tendencias de productividad en cada departamento de Bolivia. En función a ello, se podría generar proyectos de investigación e incrementar las tendencias de productividad en Bolivia.

Base de datos

Los datos se descargarón del Instituto Nacional de Estadística de Bolivia (INE). Los datos nos proporcionan en una planilla excel. Dentro del documento se encuentra distribuido en hojas. En cada hoja se encuentra información estadística de cada departamento.

Limpieza de datos por departamento

Se muestra un ejemplo de programación para la limpieza de datos para el departamento de Chuquisaca. El mismo proceso se repite para cada departamento.

##librerias para el proceso de limpieza
library(tidyverse)
library(readxl)
library(knitr)
## Importando datos 
chuq <- read_xlsx("Bolivia-Rendimiento_1984-2019.xlsx",
                sheet = "Chuquisaca",
                range = cell_rows(3:82))
chuq[chuq == "-"] <- NA
chuq[chuq == "0"] <- NA

## Pivotando datos de años y rendimientos
chuq1 <- chuq %>%
  type_convert(col_types = NULL) %>%
  pivot_longer(
    cols = `1983-1984`:`2018-2019(p)`,
    names_to = "Year",
    values_to = "yield",
    values_drop_na = TRUE
  )

# filtrar cultivos de interes para graficar
cropfilter <- chuq1 %>%
  janitor::clean_names() %>%
  filter(descripcion %in% c("Trigo (1)", 
                            "Papa", 
                            "Maíz en grano (1)",
                            "Arroz con cáscara")
  )

# Separar la columna descripción
chuq2 <- cropfilter %>%
  separate(descripcion, c("cultivo"), sep = " ") %>%
  separate(year, c("ano1", "años"), sep ="-", 
           convert = TRUE) %>%
  mutate(year = ano1 + 1) %>%
  mutate(Chuquisaca = yield/1000)%>%
  select(cultivo, year, Chuquisaca)
kable(head(chuq2))
cultivo year Chuquisaca
Arroz 1984 1.422
Arroz 1985 1.422
Arroz 1986 1.539
Arroz 1987 1.449
Arroz 1988 1.426
Arroz 1989 1.514

Con los siguientes códigos se consolidó los datos de cada departamento en una sola base de datos.

################# Unir datos #######################

yieldfs <- chuq2 %>%
  left_join(lp2) %>%
  left_join(cbb2) %>%
  left_join(pt2) %>%
  left_join(tj2) %>%
  left_join(sc2) %>%
  left_join(bn2) %>%
  left_join(pn2) %>%
  left_join(or2)

kable(head(yieldfs))
cultivo year Chuquisaca La_Paz Cochabamba Potosi Tarija Santa_Cruz Beni Pando Oruro
Arroz 1984 1.422 1.160 1.230 NA 1.450 2.148 1.612 1.376 NA
Arroz 1985 1.422 1.079 1.210 NA 1.446 2.113 1.613 1.384 NA
Arroz 1986 1.539 1.187 1.136 NA 1.224 2.676 1.623 1.480 NA
Arroz 1987 1.449 1.250 1.328 NA 1.164 2.691 1.650 1.468 NA
Arroz 1988 1.426 1.285 1.309 NA 1.249 2.192 1.550 1.500 NA
Arroz 1989 1.514 1.139 1.354 NA 1.188 2.280 1.700 1.550 NA

Resultados

# Pivotando datos de años y rendimientos
yieldclean <- yieldfs %>%
  pivot_longer(
    cols = `Chuquisaca`:`Oruro`,
    names_to = "Depto",
    values_to = "Yield",
    values_drop_na = TRUE
  )

kable(head(yieldclean))
cultivo year Depto Yield
Arroz 1984 Chuquisaca 1.422
Arroz 1984 La_Paz 1.160
Arroz 1984 Cochabamba 1.230
Arroz 1984 Tarija 1.450
Arroz 1984 Santa_Cruz 2.148
Arroz 1984 Beni 1.612
######## Plot option #############
library(reshape2)
library(plotly)

p <- yieldclean %>%
  ggplot(aes(year, Yield, color = Depto)) +
  geom_line() +
  facet_wrap(~cultivo, ncol = 2) +
  labs(x = "Year", y = "Yield (t ha)")

fig <- ggplotly(p)
fig
0.02.55.07.510.019902000201020200.02.55.07.510.01990200020102020
BeniChuquisacaCochabambaLa_PazOruroPandoPotosiSanta_CruzTarijaYearYield (t ha)ArrozMaízPapaTrigoDepto

Rendimiento del año 2019

Se puede generar una gráfica de barras del rendimiento del año 2019.

yearfs <- yieldclean %>%
  filter(year == 2019)

# seleccion de tema para la gráfica
theme_set(
  theme_classic() +
    theme(legend.position = "top")
)

#Generando gráfica de barras
f<-ggplot(yearfs, aes(x=Depto, y=Yield, fill=cultivo)) +
  geom_bar(stat="identity", position = position_dodge()) +
  labs(x = "Departamentos", y = "Yield (t ha)")
fig2 <- ggplotly(f)
fig2
BeniChuquisacaCochabambaLa_PazOruroPandoPotosiSanta_CruzTarija0.02.55.07.510.0
ArrozMaízPapaTrigoDepartamentosYield (t ha)cultivo

Footnotes

    Citation

    For attribution, please cite this work as

    Santos (2021, Jan. 1). Franklin Santos: Rendimiento de los cultivos importantes de Bolivia. Retrieved from https://franklinsantos.com/posts/2021-03-14-tidyinebolivia/

    BibTeX citation

    @misc{santos2021rendimiento,
      author = {Santos, Franklin},
      title = {Franklin Santos: Rendimiento de los cultivos importantes de Bolivia},
      url = {https://franklinsantos.com/posts/2021-03-14-tidyinebolivia/},
      year = {2021}
    }