image

Acesse bootcamps ilimitados e +650 cursos pra sempre

60
%OFF
Article image
Ana Fernandes
Ana Fernandes30/06/2023 10:45
Compartilhe

A linguagem Python como ferramenta para salvar vidas

  • #Python

Olá, devs!

A limpeza, processamento, manipulação e extração de informações de dados da população fornece inúmeros subsídios à criação de políticas públicas.

Esta demanda, fomenta o debate sobre as diversas soluções de tratamento e visualização de dados disponíveis no mercado. Neste contexto, a linguagem Python destaca-se pela sintaxe enxuta e curva de aprendizado rápida.

Para ilustrar este processo será apresentado o tratamento dos dados de mortalidade infantil do município de Pirapora (MG), referente ao período de 2010 a 2021.

INTRODUÇÃO

A necessidade de adequar as formas de avaliação da mortalidade infantil aos distintos contextos socioeconômicos, impõe a observação do nível de desenvolvimento e da disponibilidade de dados estatísticos. O presente estudo buscou evidenciar a possibilidade de contribuição da ciência de computação à matéria, reforçando seu caráter interdisciplinar.

A esse respeito, uma inquietação serviu de inspiração ao presente trabalho: a linguagem Python permite evidenciar os fatores de risco associados à mortalidade infantil? Isto é, a ferramenta em discussão, pode ser útil para direcionar políticas púlblicas de intervenção?

Para tanto, se busca disponibilizar um método de análise, tratamento e compatibilização de dados por meio de tecnologias disponíveis em linguagem Python. Apresenta-se como um artigo descritivo/explicativo, dividido em duas partes, nas quais: i) pressupostos operacionais e importação de bibliotecas; ii) tratamento e análise estatística dos dados.

1 - PRESSUPOSTOS OPERACIONAIS E IMPORTAÇÃO DE BIBLIOTECAS

1.1 - Seleção do mix de ferramentas

Foram utilizadas ferramentas livres para gerenciamento das bibliotecas e execução dos experimentos; formalmente optou-se pelo Anaconda e pelo Jupyter Notebook.

As bibliotecas empregadas neste ensaio foram: Pandas, para a manipulação de tabelas e séries temporais; Plotly.express, para criação de gráficos e visualizações de dados em geral.

image

1.2 - Preparando o ambiente de trabalho

Inicialmente, foi realizada a instalação da biblioteca ‘plotly.express’. Para tanto, foi empregado o comando ‘!pip install’, que permite instalar, desinstalar e atualizar bibliotecas no Python:

image

Em seguida, o pacote foi importado para a plataforma Jupyter Notebook, junto com a biblioteca Pandas, que faz parte da instalação padrão do Anaconda. Para esse fim, foi utilizado o comando “import”, que possibilita importar módulos em sua totalidade ou parcialmente:

image

2 - LIMPEZA E ANÁLISE DE DADOS

2.2 - Carregando dados para o ambiente de trabalho

Para a análise e tratamento de dados recorreu-se às séries históricas do Sistema de Informações sobre Mortalidade (SIM), disponibilizado pelo Ministério da Saúde, em formato XLSX. Inicialmente, foi chamada a função ‘read_excel( )’, da biblioteca pandas, que possibilita importar dados de planilhas do Excel para o script Python. Oportunamente, o conjunto de dados foi atribuído à variável ‘df’, sendo o resultado retornado apresentado abaixo:

image

image

2.3 - Inspecionando o dado

Tratando-se de dados associados aos óbitos infantis segundo determinantes, identificam-se as colunas com relevância de informação para análise:

  • EVITABILIDADE: contendo a classificação de redutibilidade do óbito, segundo a Lista de Causas de Mortes Evitáveis por Intervenções no Âmbito do SUS;
  • OCUPMAE: contendo a ocupação da mãe;
  • BAIRES: contendo o bairro de residência materna;
  • ESCMAE: contendo a escolaridade materna em anos;
  • IDADEMAE: contendo a idade da mãe;
  • SEXO: contendo o sexo das crianças;
  • RACACOR: contendo a raça/cor das crianças falecidas;
  • DTOBITO: contendo a data do óbito.

Chamando a função ‘.info( )’ verifica-se o tipo de dado contido em cada coluna, como reportado a seguir:

image

A observação das informações presentes na estrutura de dados e seus atributos indicavam a necessidade de algumas etapas para sua limpeza e preparação:

a) exclusão das colunas desnecessárias;

image

b) renomear as colunas, conforme convenções de nomenclatura do Python Enhancement Proposal 8;

image

c) Remoção dos valores omissos.

image

Após a remoção dos registros com valores ausentes, o modelo apresentava 83 casos. Neste ponto, o dataframe apresentava as informações necessárias à análise exploratória, possibilitando a apreciação descritiva dos dados para identificação de possíveis padrões e relações.

O campo ‘evitabilidade’, que contém a classificação dos óbitos, segundo a Lista de Causas de Mortes Evitáveis por Intervenções no Âmbito do Sistema Único de Saúde, é a informação mais relevante para o desenvolvimento da análise. Pois seus números implicam a reflexão sobre o percentual de “mortalidade consentida” de crianças.

Em função do exposto, foi calculada a frequência e percentual de cada categoria de evitabilidade, utilizando a função ‘.value_counts()’, sendo os resultados atribuídos às variáveis ‘frequencia’ e ‘percentual’. Posteriormente, foi declarada a variável ‘dist_freq_qualitativas’ para receber a estrutura de dados:

image

O resultado retornado, evidencia que aproximadamente 75% das mortes (n = 62) poderiam ter sidos evitadas. Sendo que o presente estudo revela um maior número de óbitos redutíveis por adequada atenção à mulher na gestação, o que sugere a necessidade de investimento prioritário na qualificação do pré-natal oferecido.

image

Em consonância com o objetivo do trabalho, se buscou avaliar a distribuição espacial dos casos evitáveis, segundo o endereço domiciliar das genitoras. Para tanto, foram removidos da análise os óbitos por causas mal definidas e pelas demais causas (não claramente evitáveis), por intermédio do método ‘.drop’:

image

image

Em seguida, foram calculadas a distribuição de frequência para os campos ‘baires’, ‘ocup_mae’, ‘raca_cor’ e ‘sexo’. Para este fim, foi utilizado o método ‘.value_counts()’, que permite calcular a quantidade de cada ocorrência, retornando sua frequência. Oportunamente, foram construídos gráficos para ganho na compreensão global dos dados:

image

image

O retorno do método, insinua que as crianças nascidas em bairros predominantemente habitados por população de baixa renda tinham até 10 vezes mais risco de morrer, por causas evitáveis, antes de completar um ano de idade, do que as residentes em espaços habitados por famílias de classe média e alta.

image

Destaca-se que os conjuntos habitacionais São Francisco e Shekináh, construídos em parceria com o Programa Minha Casa, Minha Vida, foram inaugurados somente a partir de 2016. Desta forma é relevante salientar que a configuração do município sofreu alterações durante o período abrangido pelo estudo.

Similarmente, foi analisada a ocupação das mães que perderam seus filhos por causas evitáveis, por intermédio dos métodos ‘.value_counts()’ , ‘.mode()’ e ‘.plot()’.

image

Os resultados sugerem que o trabalho mais frequente na coorte era “Dona de Casa”. Acrescenta-se ao exposto que 72,6% das participantes do estudo não exerciam atividade remunerada.

image

A literatura especializada aponta que o fenômeno em tela compromete a qualidade de vida da mãe e do bebê, constituindo fator de risco para a mortalidade de menores de um ano (MAIA, SOUZA, MENDES, 2020; LIMA, SAMPAIO, 2004; SAVASSI, LAGE, COELHO, 2012).

Em sequência, foi analisada a idade das mães que perderam seus filhos por causas evitáveis. Para este fim, foi utilizado o método de representação de dados ‘.boxplot()’, disponível na biblioteca Seaborn.

O resultado evidencia que a distribuição é assimétrica negativa, o que indica uma maior concentração de valores entre mulheres mais velhas. A idade média observada foi de 23,8 ±5,76 anos (N = 62), sendo esse valor variável no intervalo de 14 anos a 38 anos.

image

Por fim, ao avaliar-se a distribuição dos óbitos evitáveis por raça/cor, padrões de desigualdade racial foram observados. O percentual de morte de crianças não brancas (85,5%) foi maior que o registrado em outros grupos, excedendo em 7,9% a participação desta minoria étnica na população piraporense.

image

Resultados semelhantes aos apresentados foram encontrados em outros trabalhos que apontam o diferencial de mortalidade entre brancos e negros, elucidando as desigualdades em saúde segundo raça, cor e etnia no Brasil (MAIA, SOUZA, MENDES, 2012; HAUCK, TANABE, MOON, 2011; MATIJASEVICH et al., 2008; MENEZES et al., 2005).

Acrescenta-se ao discutido que a cor parda foi a mais frequente entre as crianças falecidas, segundo o cálculo da moda. Sobre a temática a antropóloga Lilia Moritz Schwarcz, (2013, p.105) comenta: “Nesse ‘status racial’, pardo não é preto nem branco, já que na prática se aproxima, na representação popular dos negros.”

CONSIDERAÇÕES FINAIS

Em relação à pergunta de partida, a linguagem de programação em tela permitiu executar o tratamento, análise e visualização dos dados de forma dinâmica.Para além dos objetivos explícitos, este trabalho procurou demonstrar os desafios abertos à sociedade, sem a pretensão de apontar soluções definitivas para a discussão.

Espera-se que as inferências apresentadas estimulem um maior enfoque nos serviços prestados pelos órgãos públicos desta área de abrangência, a fim de melhorar as condições de reprodução social desta população.

REFERÊNCIAS

ANACONDA. Guia de uso do Anaconda. Disponível em: <https://docs.anaconda.com/anaconda/user-guide/>. Acesso em: 14 ago. 2022.

FERNANDES ALVES, Taytiellen; BRAGANÇA COELHO, Alexandre. Mortalidade infantil e gênero no Brasil: uma investigação usando dados em pai. Revista Ciência & Saúde Coletiva, v. 26, n. 4, 2021.

HAUCK, Fern R.; TANABE, Kawai O.; MOON, Rachel Y. Racial and ethnic disparities in infant mortality. In: Seminars in perinatology. WB Saunders, 2011. p. 209-220.

LIMA, Geânia de Sousa Paz; SAMPAIO, Helena Alves de Carvalho. Influência de fatores obstétricos, socioeconômicos e nutricionais da gestante sobre o peso do recém-nascido: estudo realizado em uma maternidade em Teresina, Piauí. Revista Brasileira de Saúde Materno Infantil, v. 4, p. 253-261, 2004.

MAIA, Lívia Teixeira de Souza; SOUZA, Wayner Vieira de; MENDES, Antonio da Cruz Gouveia. Determinantes individuais e contextuais associados à mortalidade infantil nas capitais brasileiras: uma abordagem multinível. Cadernos de saúde publica, v. 36, p. e00057519, 2020.

MAIA, Lívia Teixeira de Souza; SOUZA, Wayner Vieira de; MENDES, Antonio da Cruz

Gouveia. Diferenciais nos fatores de risco para a mortalidade infantil em cinco cidades brasileiras: um estudo de caso-controle com base no SIM e no SINASC. Cadernos de saúde pública, v. 28, p. 2163-2176, 2012.

MATIJASEVICH, Alicia et al. Widening ethnic disparities in infant mortality in southern Brazil: comparison of 3 birth cohorts. American Journal of Public Health, v. 98, n. 4, p.

692-698, 2008.

MENEZES, Ana Maria Baptista et al. Infant mortality in Pelotas, Brazil: a comparison of risk factors in two birth cohorts. Revista panamericana de salud pública, v. 18, n. 6, p. 439-446, 2005.

PANDAS. Documentação operacional da biblioteca. Disponível em: <https://pandas.pydata.org/docs/>. Acesso em: 17 ago. 2022.

PLOTY.EXPRESS. Documentação operacional da biblioteca. Disponível em: <https://plotly.com/python-api-reference/plotly.express.html>. Acesso em: 19 ago. 2022.

PYTHON. Documentação da linguagem Python. Disponível em: <https://docs.python.org/pt-br/3/>. Acesso em: 17 ago. 2022.

RIBEIRO, Rayssa Gabriele Vieira; DE MELLO MENDO, Cristina Teodoro. MORTALIDADE INFANTIL NO ESTADO DE MATO GROSSO: UMA ANÁLISE DA INCIDÊNCIA E FATORES ASSOCIADOS. Revista Ciência e Estudos Acadêmicos de Medicina, v. 1, n.16, 2022.

SANTOS, José Augustinho Mendes; DE SOUZA LIMA, Beatriz Santana. Perfil epidemiológico da mortalidade infantil no estado de alagoas, 2011 a 2015. Revista de Saúde Dom Alberto, v. 4, n. 1, p. 3-29, 2019.

SAVASSI, Leonardo Cançado Monteiro; LAGE, Joana Lourenço; COELHO, Flávio Lúcio Gonçalves. Sistematização de instrumento de estratificação de risco familiar: a Escala de Risco Familiar de Coelho-Savassi. JMPHC| Journal of Management & Primary Health Care| ISSN 2179-6750, v. 3, n. 2, p. 179-185, 2012.

SCHWARCZ, Lilia Moritz. Nem preto nem branco, muito pelo contrário: cor e raça na

sociabilidade brasileira. Editora Companhia das Letras, 2013.

Compartilhe
Comentários (0)