Skip to content

Desafios propostos no #7DaysOfCode sobre ciência de dados

Notifications You must be signed in to change notification settings

fab-souza/7DaysOfCodeDados

Repository files navigation

7DaysOfCodeDados

Badge em Desenvolvimento

Badge code size GitHub Org's stars

🪧 Vitrine.Dev
✨ Nome 7 Days Of Code - Ciência de Dados
🏷️ Tecnologias python
🚀 URL
🔥 Desafio 7 Days Of Code

Sobre o desafio 📚

Desafios propostos no 7 Days Of Code sobre ciência de dados.

Minha prática 👩🏻‍💻

Desafio 1/7: Data Cleaning and Preparation

Baixar um dataset do portal do CEAPS (Cota para Exercício da Atividade Parlamentar dos Senadores) e aplicar processos de tratamento e limpeza de dados.

Ao final do tratamento dos dados, gerei uma amostra do dataset final, com registros referentes de 2018 a 2022.

desafio1


Desafio 2/7: Data Visualization & Storytelling

Investigar os dados e gerar visualizações para identificar padrões estranhos ou estatísticas interessantes.

Entre os padrões estranhos, haviam registros de 2002 cadastrados em 2022 e também de datas posteriores à última atualização do CEAPS.

image


Desafio 3/7: Forecasting

Utilizar técnicas de Machine Learning e ferramentas estatísticas para prever o futuro.

Neste caso, criar um modelo que irá prever quanto os senadores vão gastar nos próximos três meses.

Para fazer este desafio, utilizei o dataset disponibilizado, que é composto por duas colunas: ‘ds’ (datas) e ‘y’ (valor acumulado daquele dia). As datas vão do dia 01/01/2018 até 31/12/2022, acumulando o total de 1461 registros. Para solucionar este desafio, foi apresentada duas opções:

Com o Prophet, o resultado foi o seguinte:

image


Desafio 4/7: Sistemas de recomendação

A proposta deste desafio é simples e atual, pois, diante os diversos streams no mercado, devo desenvolver um código que recomende 5 filmes de acordo com o histórico de consumo/avaliação de um usuário, a partir do banco de dados da MovieLens.

Fiz o upload do notebook aqui, mas ele também está disponível no Kaggle.

Ao final, consegui as seguintes recomendações para um novo usuário:

image


Desafio 5/7: Servindo modelos em API

Criar uma API que irá consumir o modelo de recomendação de filmes, desenvolvido no último desafio, e receber requisições.


Desafio 6/7: Teste A/B e Testes de Hipótese

Partindo para um outro contexto, neste desafio eu tive que analisar o resultado de um teste A/B de uma página. Verificando se houve maior conversão dos clientes que tiveram acesso à nova página, ou não, ao realizar um teste de hipótese.

image

A proposta do teste é simples: Verificar se a mudança na página provocou maior conversão de clientes. Em que considerei que:

  • Hipótese nula = a conversão de clientes é igual nas duas páginas (p-valor > 0.05)
  • Hipótese alternativa = uma das páginas teve um melhor desempenho (p-valor < 0.05)

image

O retorno da função mostrou que a página nova não apresentou maior conversão do que a versão antiga.

O teste completo também está disponível nesta página no Kaggle.


Desafio 7/7: Documente e crie seu portfólio

E para concluir os desafios, o último é para compartilhar o que desenvolvi nos dias anteriores.

Ferramentas utilizadas 🧰

python pandas seaborn numpy statsmodels

About

Desafios propostos no #7DaysOfCode sobre ciência de dados

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published