image

Acesse bootcamps ilimitados e +650 cursos pra sempre

60
%OFF
Article image

GM

Giovanna Motta29/06/2023 17:19
Compartilhe

Da Mágica ciência de dados à Biotecnologia:explorando o Python.

    What’s up devs??

    O mundo dos dados se apresenta em uma crescente,no qual quem está na frente de uma tela avalia e contabiliza itens como : números,notas e palavras a todo instante.Os usuarios da tecnologia podem desconhecer a imensa rede de ciência que pode-se realizar com esses.Atualmente,temos tantas aplicações e benefícios com essa prática que dificilmente a mesma fica estagnada: a modelagem e uso computacional mais que facilita a visualização e previsão dos dados,ela revoluciona as aplicações em vendas,prognósticos,público-alvo,marketing e até mesmo aplicações na descoberta de drogas, inseticidas e outros,no ramo biotecnológico.Juntamente com a inteligência artificial e a linguagem intuitiva e de linguagem fácil advinda do python,é possível analisar facilmente diversas métricas com suas bibliotecas .

    image

    CASTRO,2015

    Uma ideia inicial que pode ajudar no entendimento da mágica ciência de dados são os dados propriamente ditos em grande escala,que são usados para automatizar processos,reduzir custos e aumentar a produtividade.Para empresas,por exemplo, é extremamente útil identificar padrões e realizarem diagnósticos que aumentarão vendas,apontarem possíveis problemas e visar as pessoas interessadas em seus trabalhos.Afinal tais dados são ‘’o símbolos que representam propriedades dos objetos ou eventos e, que podem ser coletados de diferentes fontes’’(SIEGEL,2018).Como em um ''passe de mágica'',a ciência de dados manipula e agrupa as estatísticas necessárias para um ou mais objetivos.

    image

    MARQUESONE,200-

    BIG DATA É UM AMIGO QUE SE QUER POR PERTO

    Começou-se a experimentar e observar as análises estatísticas,nesse quesito a ciência de dados prevê e descobre tais parâmetros.Junto com ela temos as informações a respeito das navegações mundiais das redes de computadores, a ‘’Big Data’’.O termo BIG DATA foi utilizado pela primeira vez em 1997 e seu volume,velocidade e variedade são suas principais características(denominado os 3 vs).Atualmente temos conhecimento suficiente para lidar com a velocidade e quantidade de dados,que são gerados todos os dias,a todo momento, e podem até ser divididos em:

    DATA LAKE: é armazenado de forma bruta,sem passar por algum processamento

    DATA WAREHOUSE: passam por processos de transformação e integração.

    A Big Data pode parecer abstrata,porém se trata da fluidez de informações armazenadas assim como sua qualidade e possibilidade de manejo.

    image

    Marquesone,200-

    Mesmo com os ‘’3vs’’ da BIG DATA ,é possível obter os dados e não realizar nenhuma análise relevante,sem um valor consequente.

    Ao contrário dos mitos de que grandes empresas a usam,pequenas e médias também.(Marquesone,200-).Atualmente,muito é estudada e relevante para construir metas e construir ,de fato, a tecnologia como facilitadora de processos.

    BIG DATA E INTELIGÊNCIA ANALÍTICA

    Há maneiras e sequências para trabalhar efetivamente com a Big Data:

    a)Objetivos e tipos de dados requeridos

    b)Capturar os dados

    c)Processamento e análise dos dados

    d)Visualização dos dados com gráficos interativos

    A mineração de conhecimento,técnicas de regressão e algoritmos podem ser usados com plataformas como o Azure.Todas essas e muitas outras são o que se chama de inteligência analítica. 

    image

    Got It All

    image

    Marquesone,200-

    PYTHON E CIÊNCIA DE DADOS

    A linguagem Python, teve seu desenvolvimento iniciado em 1989 e é considerada ‘’uma linguagem interpretada, orientada a objetos e interativa, sendo possível sua utilização em propósitos distintos, de diferentes natureza e complexidade’’.Siegel,2018. 

    Pydata stack é termo que se refere ao conjunto de funções e linhas de código advindas de bibliotecas,que com o python irão realizar a ciência de dados em si.

    Pandas

    Realiza agrupamento de dados,análises estatísticas,similar com planilhas,manipula e limpa dados. Um exemplo de linha de código é:

    para ler o arquivo csv (arquivo com valores separados por vírgulas, do inglês comma-separated values).

    df = pd.read_csv(“url gerada”)
    

    com essa linha pode-se visualizar os dados

    NumPy

    Faz análises matemáticas de matrizes mais avançadas,pode ser utilizado em geoprocessamento,por exemplo,pela função de manipular imagens coloridas. Algumas funcionalidades do python como arrays podem se correlacionar com essa biblioteca.

     

    Matplotlib

    Gráficos que podem ser muito úteis para visualização da big data ou dados no geral(linhas, circular, colunas, gráficos estatísticos,

    histograma)

    image

    (TECH,2022)

    import matplotlib as plt
    plt.scatter(x,y)
    plt.show()
    

    Scikit-learn

    Inteligência analítica como regressão,clusterização e classificação (algoritmos funcionais que trabalharão com os dados),aprendizado de maquina no geral,por exemplo a função predict( ) , a qual avalia a precisão do modelo testado.

    CIÊNCIA DE DADOS NA BIOTECNOLOGIA

    A biotecnologia abordada com a ciência de dados desse artigo exemplifica a manipulação genética,e esse é só um exemplo do que pode ser feito com algoritmos.

    a)Pode -se mapear geograficamente animais,espécies ,processos bióticos e abióticos pelo app iNaturalist( ciência cidadã) que guarda diversas informações utilizando BIG DATA e afere ,inclusive,a precisão do nível de pesquisa e dos dados via metadados.O banco de dados Species têm mais de um milhão de espécies.

    b)Previsão de safras : predição via inteligência analítica de acordo com as mudanças climáticas,fertilização,possíveis problemas ja enfrentados,época do ano,dados do solo .

    c) Sequências genéticas de Big Data que podem ser analisadas e manejadas via algoritmos e programas,python é uma ferramenta muito usada em sequência de genes e automatização de processos com seus laços,variáveis e condicionais.A biblioteca Biopython é integrado ao BioSQL e suporta o Genbank,FASTA etc.. ela têm diversas funções que ajudam nesse quesito,eis algumas:

    image

    Castro,2015

    Também existem diversas aplicações para a bioecologia,já abordada no tópico a),com projetos como o ECOLOG,o qual é um sistema que armazena e gerencia dados de saídas de campo ecológicas utilizando inclusive o NumPy,falado anteriormente.

    c) Análises bioquímicas que contribuem para sociedade: Na biotecnologia,temos diversas proteínas inclusive virais que usam o Python e outras bibliotecas e programas para modelagem de proteínas,como o HADDOCK,Itasser,Blast e outros.

    image

    https://compsysbio.ornl.gov/nonstructural-protein-3-nsp3-papain-like-proteinase/ acessado 12/08

    REFERÊNCIAS

    MARQUESONE, Rosangela. Big Data: Técnicas e tecnologias para extração de valor dos dados. S.L: Alura, 200-.

    SIEGEL, Idaltchion Fabricio. LINGUAGEM PYTHON E SUAS APLICAÇÕES EM CIÊNCIA DE DADOS. 2018. 57 f. TCC (Graduação) - Curso de E Tecnologia em Sistemas de Computação, Universidade Federal Fluminense, Niterói, 2018. Disponível em: https://app.uff.br/riuff/bitstream/handle/1/8946/TCC_IDALTCHION_FABRICIO_SIEGEL.pdf?sequence=1&isAllowed=y. Acesso em: 28 jun. 2023.

    ACADEMY, Ia Expert. Programação em Python aplicada a Problemas de Biologia. Disponível em: https://www.udemy.com/course/programacao-em-python-para-biologos/. Acesso em: 28 jun. 2023.

    TECH, Didatica. A biblioteca scikit-learn – Python: o que é, para que serve. 2022. Disponível em: https://didatica.tech/a-biblioteca-scikit-learn-pyhton-para-machine-learning/. Acesso em: 28 jun. 2023.

    CASTRO, Marcos. Bioinformática com Biopython. [S.L]: Marcos Castro, 2015. P&B. Disponível em: https://pt.slideshare.net/mcastrosouza/bioinformtica-com-biopython. Acesso em: 28 jun. 2023.

    Compartilhe
    Comentários (0)