28 de set. de 2012

Mecanismo de busca com nova tecnologia


Fonte: Inovação Tecnológica. Data: 4/09/2012.


Informações contextualizadas

Inspirados pelas ideias propostas por um bibliotecário indiano há quase um século, uma equipe europeia desenvolveu um novo sistema de buscas para a internet que leva em conta fatores como opinião, contexto, tempo e localização.

A nova tecnologia, que promete chegar ao mercado rapidamente, consegue mostrar tendências na opinião pública sobre um determinado assunto, companhia ou pessoa, e como essa tendência muda com o tempo.

A equipe do projeto LivingKnowledge (conhecimento vivo, em tradução livre) acredita que seus algoritmos permitirão até mesmo fazer previsões sobre o futuro.

"Faça uma busca pela palavra 'clima' no Google, ou em outro motor de busca qualquer, e o que você receberá de volta será basicamente uma lista de resultados que caracterizam a palavra: não há categorização, nenhuma ordem específica, nenhum contexto.

"Os motores de busca atuais não levam em conta as dimensões da diversidade: fatores como quando a informação foi publicada, se há uma tendência de favorecer uma ou outra opinião, quem publicou e quando," explica Fausto Giunchiglia, professor de ciência da computação na Universidade de Trento, na Itália.

Google da diversidade

Mas será que a tecnologia de buscas na internet poderá ser capaz de abarcar a diversidade? Poderá um mecanismo de buscas dizer-lhe, por exemplo, como a opinião pública sobre as mudanças climáticas mudaram na última década? Ou como a temperatura poderá estar daqui a um século, agregando estimativas atuais e do passado a partir de fontes diferentes?

Giunchiglia garante que não apenas é possível, como isso já pode ser feito a partir dos resultados do projeto.

Os pesquisadores foram buscar inspiração no sistema de classificação de livros criado por Sirkali Ramamrita Ranganathan nos anos 1930, que permite atribuir múltiplas características a um livro, revista ou artigo.

Em vez de uma posição taxonômica fixa, o sistema permite, por exemplo, que um texto sobre os efeitos das mudanças climáticas na agricultura escrito no Brasil em 2010 seja classificado como "Geografia; Clima; Mudança Climática; Agricultura; Pesquisa; Brasil; 2010".

O que os cientistas fizeram foi transformar o pseudo-algoritmo de Ranganathan em um algoritmo codificado em um programa para minerar dados na internet.

Isso permite extrair de cada texto um significado e um contexto, associando-lhe as chamadas "facetas" da classificação bibliográfica. "E usar essas facetas para estruturar a informação com base nas dimensões da diversidade," completa o professor Giunchiglia.

Conhecimento aberto

O programa básico será disponibilizado como software de código aberto, e vários parceiros do projeto LivingKnowledge afirmaram que pretendem implementar a tecnologia em produtos comerciais.

O professor Giunchiglia, por sua vez, anunciou que pretende criar uma fundação sem fins lucrativos para implementar os resultados do projeto, um de cada vez, conforme surjam demandas para isso.

Nenhum comentário: