Pesquisar

Dispersão de bactérias com machine learning

25/09/2024 às 08:35

Descrição do Projeto:

Descrição: Evitando armadilhas no aprendizado de máquina: modelagem preditiva com PyCaret

VENCIMENTO: 01/10/24

Objetivo:

Desenvolver uma compreensão crítica sobre as armadilhas comuns do aprendizado de máquina e aplicar boas práticas no desenvolvimento de modelos preditivos. Para isso, você utilizará a biblioteca PyCaret, explorando todas as fases de um pipeline preditivo, desde o pré-processamento até a avaliação final e a otimização de hiperparâmetros, sempre se referindo aos pontos abordados no artigo de Michael A. Lones, "How to avoid machine learning pitfalls: a guide for academic researchers", disponível em:

https://arxiv.org/pdf/2108.02497

Variável dependente: dispersion_factor

Etapas do trabalho:

1 - Exploração de dados:
Utilizando o conjunto de dados de fator de dispersão de bactéria, disponível no endereço: https://github.com/alvaroriz/datascience_datasets/raw/refs/heads/main/bacteria_dispersion_factor_10_K.xlsx, realize uma análise exploratória, identificando possíveis problemas como valores ausentes, outliers e variáveis irrelevantes.
Faça uma análise crítica da qualidade dos dados e suas limitações, referenciando as boas práticas mencionadas no artigo de Lones.

2 - Pré-processamento e divisão de dados:
Implemente técnicas de pré-processamento, como tratamento de valores ausentes, caso existam, escalonamento de variáveis e codificação de variáveis categóricas.
Garanta que não haja vazamento de informações entre os conjuntos de treinamento e teste, justificando a estratégia de divisão de dados que adotou, conforme discutido no artigo.

3 - Construção de modelos:
Utilize a funcionalidade de "compare_models" do PyCaret para testar diferentes algoritmos de aprendizado supervisionado, como Regressão Linear, Random Forest, SVM, entre outros.
Avalie o desempenho do modelo utilizando métricas adequadas (como RMSE, AUC, Accuracy), discutindo a importância da escolha de métricas apropriadas com base nas características do conjunto de dados. Originalmente, a variável dependente do conjunto de dados é uma variável contínua. Comente a importância de cada uma das métricas geradas e faça uma análise pertinente ao conjunto de dados.
Justifique a seleção do modelo e como evitou o uso de modelos inadequados, conforme descrito no artigo.

4 - Otimização de hiperparâmetros:
Utilize a função "tune_model" do PyCaret para realizar a otimização dos hiperparâmetros do modelo que obteve o melhor desempenho.
Compare os resultados antes e depois da otimização, explicando como a otimização dos hiperparâmetros melhorou o modelo, caso tenha melhorado.

5 - Aplique a base de testes no modelo treinado:
Exiba o resultado dos testes, com as métricas, data frame com os dados reais e previstos, resultado das previsões.

6 - Relatório final:
Apresente um relatório detalhado documentando todo o processo de construção e avaliação do modelo, justificando cada decisão com base no artigo de Lones.
Explique quais armadilhas foram evitadas e como as boas práticas do artigo foram aplicadas, incluindo gráficos e tabelas que ajudem a ilustrar os resultados.
Inclua suas recomendações sobre qual modelo escolheria para ser implementado em um cenário real.

Entregáveis:

Um relatório em PDF com as justificativas solicitadas, fazendo citação aos pontos do artigo.
Link do Colab no relatório. Não esqueça de compartilhar o Colab.

Importante:

Abuse do uso das IAs, use o ChatGPT, Gemini, Perplexity... o que puder para te ajudar a fazer o melhor projeto possível. Mas lembre-se, você é o responsável pelo resultado das IAs, não confie cegamente, pesquise, se certifique de que as IAs não estão respondendo de forma incorreta.

Atividades do cliente nesse projeto:

Última visualização: 07/10/2024 às 13:59

Última interação: 26/09/2024 às 08:33

Informações adicionais

Categoria: Web, Mobile & Software
Subcategoria: Outra - Web, Mobile & Software
Orçamento: Aberto
Nível de experiência: Iniciante
Visibilidade: Público
Propostas: 2
Interessados: 3
Valor Mínimo: R$ 50,00

Cliente

Freelancer vencedor

Propostas (2)
  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

Nenhuma proposta foi encontrada.

Carregando...
Projetos semelhantes no 99Freelas

Robô para Bac Bo via Telegram - Gostaria de um robô para Bac Bo, via Telegram, que operasse de dois modos, com estratégias que eu criar no bot: estratégia por cores que poderiam usar as bolinhas de emoji (?, ?...

Adicionar link do checkout na landing page - Um freelancer fez isso, mas de forma incompleta. O link do checkout só funciona no desktop. Preciso que alguém faça funcionar no mobile também.

Criar software para replicação de operações na B3 - Preciso criar um software que conecte com a API das corretoras, inicialmente podendo ser apenas uma, como a XP Investimentos. O software deve replicar todas as operações que ocorrerem...

Gestor de IA para construção de agentes - Busco um profissional com experiência na criação de agentes de IA. A tarefa consiste em criar dois agentes conversacionais (pré-venda e pós-venda) e um agente de ...

Projeto de integração contínua e DevOps - Preciso fazer um projeto para a faculdade. É para entrega até amanhã, 23:59. A aplicação pode ser a mais simples possível, mas precisa ter esses passos: D...

Carregando...

Carregando...

Pesquisar

FREELANCERS
PROJETOS
Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.