Memex é o motor de busca para o lado negro da web

A DARPA está a desenvolver um motor de busca diferente dos já conhecidos devido ao tipo de informações que permite encontrar. As pesquisas serão realizadas na dark web, a parte da internet que não está visível para todos e onde grande parte dos negócios criminosos são realizados.

O Memex é um motor de busca que poderá ser comparado ao Google ou ao Bing, exceto na fonte das suas informações. Este projeto está a ser desenvolvido pela DARPA, a agência de projetos de investigação avançada e defesa dos EUA, e pretende ser uma ferramenta para as forças de segurança na medida em que vai permitir a pesquisa de conteúdos naquele que é considerado o lado negro da internet, a dark web.

Já é habitual que a DARPA surpreenda pela inovação, uma vez que a primeira experiência mais a sério de algo semelhante àquilo a que hoje chamamos Internet sugiu, precisamente, com esta agência. A ARPANET foi desenvolvida aquando da Guerra Fria para responder às necessidades de comunicação do país, e a mesma linha orientadora tem sido mantida. O Memex é a evolução natural deste tipo de preocupação com a melhoria do quadro nacional e internacional através do aproveitamento das novas tecnologias.

O Memex está a ser desenvolvido por 17 equipas, há já um ano, e visa explorar os conteúdos que são ignorados pelos motores de busca mais comerciais. Esta semana, a DARPA esteve no programa 60 Minutes para falar sobre o assunto e desvendou também à revista Scientific American as ferramentas que este projeto inclui.

As potencialidades do Memex passam pela descoberta de padrões potencialmente perigosos através da análise de dados escondidos na internet e pela revelação daquilo que não pode ser visto, com explicou Dan Kaufman, diretor do departamento de informação e inovação da DARPA, no programa de televisão. Na mesma entrevista, Chris White, responsável de programação da DARPA, afirmou que “por algumas estimativas, o Google, Microsoft Bing e Yahoo apenas dão acesso a cerca de cinco por cento dos conteúdos na Web”.

Isto acontece porque esses motores de busca, considerados mais comerciais, baseiam os seus resultados em rankings de popularidade, deixando de parte os dados que não preenchem esses requisitos como é o caso de dados desestruturados, conteúdos que não estejam conectados ou páginas temporárias. Sabe-se que esta dark web é muito maior do que o inicialmente pensado, contendo mais de 30 mil páginas em vez de apenas mil.

Numa primeira fase, o Memex foi utilizado para detetar a circulação de organizações de tráfico humano mas, nos próximos testes, que deverão começar dentro de semanas, a DARPA deverá focar-se também em atividades de contraterrorismo, pessoas desaparecidas ou na resposta a desastres.

Este “Google em esteróides”, como foi apelidado por Cyrus Vance Jr, procurador de Manhattan, deverá respeitar a privacidade dos utilizadores tal como qualquer outro motor de busca já que conteúdos que estejam protegidos por palavras passe não poderão ser acedidos.