Análise dos candidatos de SP (2024)

Análise estatística dos candidatos a prefeito do município de São Paulo, utilizando dados de pesquisas eleitorais e informações demográficas.

Python Pandas Matplotlib SciPy Seaborn NumPy

Visão Geral

Este projeto foi desenvolvido para a disciplina Métodos Matemáticos para Análise de Dados, na Universidade Federal de Itajubá, com o objetivo de analisar os candidatos a prefeito do município de São Paulo nas eleições de 2024. A análise envolveu a coleta de dados de pesquisas eleitorais, informações demográficas e estatísticas dos candidatos.

O objetivo principal era criar uma visualização que permitisse explorar as características dos candidatos, como cor, raça, patrimônio, idade e gênero. Além disso, foram realizadas análises temporais do número de candidatos por partido e coligação ao longo do tempo.

Objetivos

Análises realizadas

  • • Raça (branca, parda, preta, amarela, indígena)
  • • Número de candidatos por partido
  • • Idade dos candidatos
  • • Patrimônio em reais (partidos e candidatos)
  • • Número de candidatos por posicionamento político ao longo do tempo
  • • Número de candidatos eleitos por posicionamento político ao longo do tempo
  • • Divisão de cor e raça por posicionamento político
  • • Divisão de gênero por posicionamento político

Implementação

Pipeline de Dados

1

Extração de Dados

Extração dos dados de candidatos a partir de fontes públicas, como o Tribunal Regional Eleitoral de São Paulo (TRE-SP) e outras bases de dados relevantes em formato CSV.

2

Transformação e Limpeza

Limpeza de dados, tratamento de valores nulos e padronização de formatos.

3

Visualização

Desenvolvimento de gráficos, visualizações e análises estatísticas.

Funcionalidades Principais

  • • Distribuição normal da idade dos candidatos
  • • Partidos com mais candidaturas
  • • Número de eleitos em SP por posicionamento político ao longo do tempo
  • • Divisão de cor/raça e gênero por posicionamento político
  • • Top 10 candidatos com maior patrimônio
  • • Top 15 partidos com maior patrimônio

Tecnologias Utilizadas

  • Python - Linguagem de programação
  • Pandas - Limpeza e modelagem de dados
  • Matplotlib - Gráficos
  • Scipy - Funções estatísticas
  • Seaborn - Gráficos
  • NumPy - Cálculos numéricos

Desafios e Soluções

Desafio: Integração de Múltiplas Fontes

O projeto envolvia dados de diferentes sistemas e vários CSVs, o que exigia uma integração eficiente e consistente antes de qualquer análise.

Solução: Utilização de bibliotecas como Pandas para ler, limpar e integrar os dados de forma eficiente.

Aprendizados

  • Uso do Scipy para análises estatísticas
  • A necessidade de criar gráficos intuitivos que atendam diferentes níveis de usuários