Machine Learning para Classificação e Agrupamento de Sementes

Aplicação de técnicas de machine learning para classificar e agrupar sementes com base em suas características morfológicas.

Python Scikit-learn Pandas Jupyter Notebook Git

Visão Geral

Este projeto foi desenvolvido para a disciplina de Inteligência Artificial, na Universidade Federal de Itajubá, com o objetivo de aplicar técnicas de machine learning para classificar e agrupar sementes com base em suas características morfológicas. Utilizando o dataset "Seeds", o projeto envolveu a aplicação de algoritmos de classificação e agrupamento, para identificar padrões e relações entre as características das sementes.

O objetivo principal era explorar as técnicas de machine learning, como classificação e agrupamento, para entender melhor os dados das sementes. O projeto incluiu a análise exploratória dos dados, a aplicação de algoritmos de machine learning e a visualização dos resultados. Através deste projeto, foi possível aprender sobre a importância de pré-processamento de dados, a escolha adequada de algoritmos e a interpretação dos resultados obtidos pelos modelos de machine learning.

Objetivos

Principais Metas

  • • Testar diferentes técnicas de agrupamento e classificação (KNN, K-Means, Random Florest)
  • • Verificar a performance de cada algoritmo

Implementação

1

Extração e Limpeza de Dados

Realização de ETL com Python, Pandas e NumPy para ler, limpar e integrar os dados do dataset

2

Teste de Algoritmos

Aplicação de algoritmos de classificação e agrupamento (KNN, K-Means, Random Forest) para identificar padrões nos dados

3

Resultados

Matrizes de confusão, acurácia e outras métricas para avaliar a performance dos modelos

Tecnologias Utilizadas

  • Python - Linguagem de Programação
  • Scikit-Learn - Aplicação dos modelos de ML
  • Pandas - Manipulação e Limpeza dos dados
  • Jupyter Notebook
  • Git

Aprendizados

  • Aplicação de diferentes modelos de aprendizado de máquina
  • Testes e otimizações no dataset inicial para a melhor performance do agrupamento e classificação