MACHINE LEARNING E PEQUENAS AMOSTRAS DE DADOS: UM ESTUDO DE CASO COM PROFISSIONAIS DE CONTABILIDADE E APLICAÇÃO DO MÉTODO DE BOOTSTRAP
Resumo
Seja pelo elevado custo da aquisição de dados, seja pela presença de ruídos
amostrais, as dificuldades relacionadas à obtenção de dados úteis, mesmo no
contexto do big data, podem inviabilizar pesquisas no campo do machine learning.
Pois, apesar de reproduzir o sistema de aprendizado humano, as máquinas
demandam maiores quantidades de casos (observações) para reconhecer padrões
implícitos. Nesse contexto, esta investigação buscou avaliar como o método bootstrap
poderia auxiliar na melhora do desempenho do aprendizado de máquina baseado em
redes neurais artificiais (RNA). Para tanto, foi desenvolvido um estudo de caso único
acerca de certo fenômeno social, na área de contabilidade, composto por 1 variável
dependente e 13 possíveis variáveis explicativas; por meio do qual se aplicou o
método de reamostragem, com sorteio por randomização e reposição de dados em
uma amostra inicialmente formada por 44 observações, cuja representatividade era
inferior a 1% da respectiva população de interesse. Após construir e avaliar o
desempenho de seis RNA, uma delas pesquisada com base naquela “amostra
original” e outras cinco com base em amostras de bootstrap com tamanhos diversos,
foi possível constatar que a metodologia em questão se mostrou uma ferramenta
muito promissora. Assumindo especial relevância naquelas situações em que a
obtenção de grandes amostras pode constituir-se em um fator de insucesso; além da
possibilidade de sua utilização para a detecção de problemas relacionados à presença
de overfitting, assim como, para a seleção de variáveis relevantes para o processo de
machine learning e/ou para eliminação de parâmetros de entradas inexpressivos.
Copyright (c) 2024 Revista Científica e-Locução
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.