@MASTERSTHESIS{ 2025:1647233129, title = {CATCH-UP ESTATURAL EM CRIANÇAS NOS PRIMEIROS MIL DIAS DE VIDA: UM ESTUDO DE PREDIÇÃO USANDO APRENDIZAGEM DE MÁQUINA}, year = {2025}, url = "https://tedebc.ufma.br/jspui/handle/tede/6149", abstract = "Introdução: Apesar dos estudos de fatores associados, pouco se sabe sobre predições de catch-up estatural nos primeiros mil dias de vida, especialmente por Aprendizagem de Máquina (AM). Objetivo: Predizer a não ocorrência de catch-up estatural até 24 meses, de crianças que nasceram com comprimento abaixo do esperado para idade, por meio de técnicas de AM, a partir de dados sociodemográficos, do pré-natal, nascimento, hábitos, características dos pais e primeiro ano da criança. Métodos: Utilizaram-se os dados de pré-natal e nascimento Brazilian Ribeirão Preto and São Luís cohorts (BRISA), de duas cidades brasileiras. 659 crianças classificadas em baixa ou muito baixa estatura para idade ao nascer, segundo gráfico INTERGROWTH-21st, não gemelares, foram selecionadas e avaliadas. Aspectos hormonais, marcadores químicos de crescimento ou outras variáveis de difícil acesso/coleta não foram incluídos. No programa R studio, os algoritmos Linear Discriminant Analysis (LDA), Regularized Logistic Regression (RLR), Support Vector Machine (SVM) e Extreme Gradient Boosting (XGBoost) foram empregados para construir modelos de predição, com e sem o selecionador de atributos Boruta, em 5 diferentes cenários. Resultados: Neste estudo, a especificidade foi uma importante medida de desempenho. No cenário com junção de ambas as cidades para treino e teste (validação cruzada), os modelos em LDA e RLR com Boruta tiveram os melhores desempenhos em sensibilidade (72,8% e 72,7%), porém sem ganhos expressivos para acurácia≅ 68 e 69%, especificidade≅ 64% e 65%, precisão≅ 68%, F1 score≅70% e AUC ≅75%, cada. Entre todos, o cenário de São Luís, utilizando o LDA com Boruta teve o melhor desempenho de modo geral: acurácia de 70,9%, sensibilidade de 75%, precisão de 70,5%, F1 Score de 72,5% e AUC de 74,4%, porém com especificidade de 66,5%. A maior especificidade foi em RP, como treino, e SL, como teste (variando de 78,3% a 87,3%), no qual o LDA sem Boruta teve o maior valor obtido. Todos os modelos testados foram estatisticamente superiores à classe majoritária (até 51,5%). Das variáveis, o peso ao nascer, altura da mãe, estatura para idade ao nascer, peso para idade ao nascer, fumo tiveram grande contribuição para os modelos; grau de prematuridade apareceu em todos os cenários. Conclusão: Variáveis de fácil acesso relativas aos primeiros mil dias de vida foram capazes de predizer, com acurácia, o não catch-up estatural de crianças nascidas com déficit de comprimento até 24 meses. Intervenções precoces se tornam mais estratégicas, podendo causar impacto positivo ao longo da vida dessas crianças.", publisher = {Universidade Federal do Maranhão}, scholl = {PROGRAMA DE PÓS-GRADUAÇÃO EM SAÚDE COLETIVA/CCBS}, note = {COORDENACAO DO CURSO DE ENGENHARIA DA COMPUTACAO/DCCET} }