Análise dos candidatos de SP (2024)
Análise estatística dos candidatos a prefeito do município de São Paulo, utilizando dados de pesquisas eleitorais e informações demográficas.
Visão Geral
Este projeto foi desenvolvido para a disciplina Métodos Matemáticos para Análise de Dados, na Universidade Federal de Itajubá, com o objetivo de analisar os candidatos a prefeito do município de São Paulo nas eleições de 2024. A análise envolveu a coleta de dados de pesquisas eleitorais, informações demográficas e estatísticas dos candidatos.
O objetivo principal era criar uma visualização que permitisse explorar as características dos candidatos, como cor, raça, patrimônio, idade e gênero. Além disso, foram realizadas análises temporais do número de candidatos por partido e coligação ao longo do tempo.
Objetivos
Análises realizadas
- • Raça (branca, parda, preta, amarela, indígena)
- • Número de candidatos por partido
- • Idade dos candidatos
- • Patrimônio em reais (partidos e candidatos)
- • Número de candidatos por posicionamento político ao longo do tempo
- • Número de candidatos eleitos por posicionamento político ao longo do tempo
- • Divisão de cor e raça por posicionamento político
- • Divisão de gênero por posicionamento político
Análises realizadas
- • Raça (branca, parda, preta, amarela, indígena)
- • Número de candidatos por partido
- • Idade dos candidatos
- • Patrimônio em reais (partidos e candidatos)
- • Número de candidatos por posicionamento político ao longo do tempo
- • Número de candidatos eleitos por posicionamento político ao longo do tempo
- • Divisão de cor e raça por posicionamento político
- • Divisão de gênero por posicionamento político
Implementação
Pipeline de Dados
Extração de Dados
Extração dos dados de candidatos a partir de fontes públicas, como o Tribunal Regional Eleitoral de São Paulo (TRE-SP) e outras bases de dados relevantes em formato CSV.
Transformação e Limpeza
Limpeza de dados, tratamento de valores nulos e padronização de formatos.
Visualização
Desenvolvimento de gráficos, visualizações e análises estatísticas.
Funcionalidades Principais
- • Distribuição normal da idade dos candidatos
- • Partidos com mais candidaturas
- • Número de eleitos em SP por posicionamento político ao longo do tempo
- • Divisão de cor/raça e gênero por posicionamento político
- • Top 10 candidatos com maior patrimônio
- • Top 15 partidos com maior patrimônio
Tecnologias Utilizadas
- • Python - Linguagem de programação
- • Pandas - Limpeza e modelagem de dados
- • Matplotlib - Gráficos
- • Scipy - Funções estatísticas
- • Seaborn - Gráficos
- • NumPy - Cálculos numéricos
Desafios e Soluções
Desafio: Integração de Múltiplas Fontes
O projeto envolvia dados de diferentes sistemas e vários CSVs, o que exigia uma integração eficiente e consistente antes de qualquer análise.
Solução: Utilização de bibliotecas como Pandas para ler, limpar e integrar os dados de forma eficiente.
Aprendizados
- Uso do Scipy para análises estatísticas
- A necessidade de criar gráficos intuitivos que atendam diferentes níveis de usuários