Classificação de gêneros por voz usando Machine Learning (ML) e algumas Análises Exploratória de Dados (EDA).
Database usada: https://www.kaggle.com/primaryobjects/voicegender
Esse material foi utilizado como desafio do Nível 2 (Jedi) do evento (Re)Start Data Science realizado nos dias 30/11/2021 à 04/12/2021, organizado pela Data Girls Neuron. Foram utilizados como critério no desafio o uso do Google Colab e extração do dataset pelo Kaggle.
Decidi utilizar esse dataset do Kaggle pela facilidade dos dados estarem estruturados e grande parte do conteúdo ser numérico, o que facilita na realização e utilização de ML.
O projeto foi dividido em partes:
-- Introdução
-- Carregamento e visualização prévia dos dados
-- Pré-Processamento dos dados
-- Visualização dos dados
-- Aplicação de ML supervisionado
-- Conclusões
O conteúdo analítico (storytelling) está contido no Colab. Futuramente, pretendo utilizar esse dataset, dessa vez para ML não supervisionado.