Vida artificial detecta padrões em 'Big Data'
voltar
Seg, 24 de Abril de 2017 04:22

Pesquisa

Life-like Network Automata - ou simplesmente LLNA - é o nome de uma nova metodologia que consiste em reconhecer padrões em redes complexas, que envolvem uma quantidade enorme de dados (conceito conhecido como Big Data), e que pode ser aplicada, por exemplo, na análise de diversas relações (sociais, biológicas, matemáticas, etc.), bem como no reconhecimento de autoria de texto.

Em um artigo publicado no segundo semestre modelos_matemticos_-250de 2016, na Scientific Reports, o Prof. Dr. Odemir Martinez Bruno e as doutorandas Gisele Helena Barboni Miranda e Jeaneth Machicao, do Grupo de Computação Interdisciplinar do Instituto de Física de São Carlos (IFSC/USP), associaram o uso de redes complexas ao de autômatos celulares - modelos matemáticos, ou "seres artificiais" que evoluem em centenas de gerações -, para simular diferentes interações, como, por exemplo, o contato entre indivíduos em redes sociais.

Até há pouco tempo, os cientistas podiam separar informações importantes, usando um modelo clássico de reducionismo, extraindo as informações que interferem de modo substancial no objeto de estudo e obtendo um modelo minimalista de dados relevantes. Contudo, há muitos experimentos na ciência moderna, em que esse modelo clássico não é aplicável, sobretudo pela quantidade enorme de informações que pode haver. "Existem vários exemplos disso, e o mais clássico na ciência é a previsão meteorológica, que fez surgir a Teoria do Caos [que propõe que um simples fenômeno pode dar origem a consequências imprevisíveis]. Como vou usar um modelo minimalista para predizer se choverá na próxima semana, em um determinado local, por exemplo? Têm muitos agentes envolvidos nesse tipo de fenômeno, e é por isso que precisamos utilizar outras matemáticas para estudá-los", explica Odemir.

O LLNA é, segundo os pesquisadores do IFSC/USP, um método superior aos demais utilizados no reconhecimento de padrões em redes complexas. Isso porque, para extrair padrões em Big Data, o método proposto modela dados - sejam eles imagens, textos, áudios, vídeos, equações, códigos, etc. - em redes que representam as relações entre as informações. As redes são habitats para a vida artificial. Interagindo com o meio ambiente de redes, os "seres vivos artificiais" nascem, crescem, se reproduzem e morrem. Ao final de centenas de gerações, a forma como os seres vivos se adaptam ao meio virtual revela peculiaridades das redes e, assim, os padrões são identificados.

A vida artificial surge como um modelo matemático inspirado nos seres vivos. Alan Turing, criador do computador moderno, introduziu esse conceito no século XX, por meio da Teoria dos Autômatos, que consiste na criação de uma representação de seres virtuais que seguem regras específicas para interagir com o meio ambiente, como se fossem seres biológicos.

O LLNA no reconhecimento de redes sociais e redes de estômatos

Os mecanismos de interação que permitem que usuários se relacionem no Google Plus e no Twitter foram modelados, de modo que o LLNA pudesse reconhecer quais mecanismos correspondiam ao de cada site. Embora a metodologia tenha diferenciado e reconhecido as redes de interação de ambas as redes sociais, resta agora compreender quais são as características - os padrões - que as tornam tão distintas. Entre as hipóteses, os pesquisadores do IFSC/USP destacam a interface e a proposta desses sites.

Mas as redes sociais não foram os únicos objetos de estudo do Grupo. Além delas, os pesquisadores analisaram padrões em redes extraídas a partir de imagens de estômatos, pequenas aberturas através das quais as plantas respiram. No último caso, observaram que a posição dos estômatos se altera na superfície das plantas, de acordo com a duração de captação de luz solar, o que permitiria saber, por exemplo, a quantidade de horas em que uma planta recebeu luz.

O LLNA no reconhecimento de autoria de texto

Em colaboração com o Instituto de Ciências Matemáticas e de Computação (ICMC/USP), os pesquisadores do IFSC realizaram outro trabalho, descrevendo o uso do LLNA no reconhecimento de autoria de texto.

Os cientistas usaram correlações entre as palavras de obras literárias de oito autores*, tendo as introduzido em uma rede complexa e, enfim, extraído características que permitiram que o LLNA reconhecesse, com cerca de 70% de precisão, quem era o autor de cada livro analisado, distinguindo as diferenças que há entre as escritas.

A possibilidade de aplicação da técnica é imensa. Jeaneth Machicao explica que o uso do novo sistema também poderia ser utilizado na área de segurança cibernética. "Em uma investigação forense, por exemplo, o LLNA poderia ajudar a descobrir se uma mensagem eletrônica, peça-chave em uma suposta investigação criminal, teria sido escrita pela pessoa cujo nome estivesse na assinatura do e-mail".

FOTO_1_JEANETH_E_ODEMIR_500

Jeaneth Machicao e Odemir Bruno

Segundo o Prof. Odemir, o LLNA poderia ser aplicado também em recomendações de vendas. Com base na análise do comportamento de um usuário na internet, seria possível encontrar padrões que sugerissem um produto no qual o indivíduo estivesse interessado em adquirir. Há diversos outros exemplos de aplicações do LLNA, inclusive na área médica, em que se poderia identificar uma doença de modo precoce, a partir de um grande volume de dados gerados por exames médicos de um paciente.

Desde o final de 2016, a doutoranda Gisele Miranda tem desenvolvido parte de seu doutorado na Universidade de Guent, na Bélgica, onde há pesquisadores parceiros do IFSC/USP. O intuito da doutoranda é apresentar a técnica do LLNA aos cientistas belgas, de modo que estes possam desenvolver novos trabalhos em conjunto com o grupo brasileiro.

*Arthur Conan Doyle, Bram Stoker, Charles Darwin, Charles Dickens, Thomas Hardy, Pelham Grenville Wodehouse, Edgar Allan Poe e Alice Munro.

A pesquisa descrita nesta matéria de divulgação pode se encontrar em fase inicial de desenvolvimento. A eventualidade de sua aplicação para uso humano, animal, agrícola ou correlatas deverá ser previamente avaliada e receber aprovação oficial dos órgãos federais e estaduais competentes. A responsabilidade pelas informações contidas na reportagem é de inteira responsabilidade do pesquisador responsável pelo estudo, que foram devidamente conferidas pelo mesmo, após editadas por jornalista responsável devidamente identificado, não implicando, por isso, em responsabilidade da instituição.

(Créditos - Foto 1: Forbes)

Assessoria de Comunicação - IFSC/USP