Análise Comparativa Entre Regressão Logística E Random Forest Na Previsão de Níveis Críticos de Pm 2.5 Em Beijing

Este artigo explora o uso de técnicas de machine learning e data mining para analisar o risco de partículas PM2.5 no meio atmosférico de Beijing entre 2010 e 2014. Com base nos dados obtidos, foi realizado um estudo sobre o seu potencial impacto na saúde humana, recorrendo à aprendizagem supervisionada e à análise de atributos temporais e ambientais, como temperatura, pressão atmosférica, velocidade do vento, entre outros. Este estudo formula o problema como uma tarefa de classificação binária de risco, com o objetivo de identificar dias de elevada exposição a PM2.5, contribuindo para sistemas de apoio à decisão em saúde pública. Na fase de treino e teste, foram criados dois modelos, um com o algoritmo Logistic Regression e outro com o algoritmo Random Forest. Os modelos foram avaliados através de métricas adequadas a problemas de classificação binária com potencial desbalanceamento, nomeadamente Precision, Recall, F1-Score e AUC-ROC.

João Silva
ESTIG/IPBeja
Portugal

Rui Pereira
ESTIG/IPBeja
Portugal

Isabel Sofia Brito
ESTIG/IPBeja
Portugal