Projeto Memex: O motor de buscas que vasculha a Deep Web para combater crimes

em 23/07/2015


Em 2014, a DARPA – agência do governo americano que desenvolve tecnologias militares – anunciou uma missão inspirada pela ficção científica: criar um motor de busca que pudesse encontrar coisas na deep web, que rastreadores do Google não conseguem ver.

O projeto Memex já está em andamento e, pela primeira vez, pudemos ver em ação esta ferramenta para combate ao crime. A DARPA demonstrou a tecnologia para a Scientific American e ao programa de TV 60 Minutes, e os recursos parecem alucinantes. O Memex – combinação das palavras “memória” e “índice” em inglês – parece vagamente algo que você veria em Minority Report.

O objetivo do Memex é conseguir também “ler” as páginas da Dark Web, em sites mais ocultos. Estas páginas têm um endereço a terminar em .onion, estão acessíveis apenas pelo browser TOR e só podem ser vistas por quem saiba a sua morada específica. A maior parte destas páginas é considerada um Hidden Service e passa despercebida aos radares da Internet convencional, noticia a Wired.

Chris White, responsável pelo Memex, estima que existam cerca de 30 a 40 mil páginas Hidden Services abertas, no sentido em que não precisam de password, mas que não são catalogadas pelos motores de busca já existentes na Dark Web, nem pelo Google ou pelo Bing.

Deep web

Na superfície, o Memex funciona como um motor de busca qualquer. A diferença é que ele espalha seus tentáculos pela deep web: isto é, pelos 90% a 95% da web pública que Google e Bing não indexam. Isso inclui de tudo, desde páginas temporárias inofensivas até conteúdo pirata e sinais de atividade ilegal.


São informações que podem não importar muito para um usuário comum, mas podem ser cruciais para investigadores. Dessa forma, o Memex consegue acompanhar criminosos, especialmente os traficantes de pessoas que se mantêm tão discretos quanto possível.

Tráfico de pessoas

Por que focar no tráfico de pessoas? Chris White explica que criminosos usam essa atividade para financiar outras atividades ilícitas; e como eles se movimentam pelos EUA, estão dispostos a transportar drogas e armas.
Além disso, este tipo de crime é muito difícil de provar às autoridades, devido ao uso de anúncios temporários e conexões peer-to-peer dentro da deep web – é difícil coletar as provas necessárias. Por isso, as condenações são poucas.

Isso já está mudando. Em 2012, uma mulher ficou presa em cativeiro em Nova York; no ano passado, um dos homens responsáveis foi condenado à prisão – a pena vai variar entre 50 anos e perpétua. Isso aconteceu graças a evidências descobertas na deep web. Isso mostra o quanto é importante o desenvolvimento de uma ferramenta capas de indexar conteúdos da Deep Web.

Atualmente o Memex está sendo usado cerca de 20 investigações.

Como funciona

Imagine esta situação: se um investigador criminal tem o link para um anúncio publicado por um traficante de pessoas, seria difícil encontrar pistas de outros traficantes, porque estes anúncios são eliminados antes que o Google tenha a chance de indexá-los. O Memex contorna isso.

A tecnologia consulta uma amostra muito mais ampla da internet, incluindo links da deep web, para encontrar conexões entre o termo de pesquisa e os seus resultados, além de conexões entre um resultado e outro.

Após a pesquisa inicial, o Memex então produz uma “esteira de dados”, que mostra todas as outras páginas relacionadas aos links em que você clicou, mas que não veria de outra forma. É assim:


Chris White, inventor do Memex, explica ao 60 Minutes:

"Todos esses pequenos círculos são links nos quais não clicamos. Clicamos em cinco, e o Memex encontrou outros cinquenta links. Então, de forma instantânea, passamos de uma pista – um endereço de e-mail – e encontramos um número de telefone de forma automática; ele estava conectado a todas as cinco páginas que visitamos. Esse telefone estava associado a centenas de anúncios, não a apenas cinco."

Isso é apenas um dos truques. Os crawlers turbinados também são capazes de acompanhar os movimentos de traficantes de pessoas observando onde eles postam anúncios. Mais uma vez, estes são links que o Google não consegue guardar.

A atividade deles pode ser compilada em mapas de calor ou mapas de movimentos de um criminoso:



Busca de imagens

Tudo fica realmente futurista quando você leva em conta o mais recente recurso do Memex: a busca de imagens. A tecnologia em beta está sendo testada por duas promotorias, um departamento de polícia e uma organização não-governamental.


A próxima fase de testes deve começar com um grupo mais amplo de beta testers, em poucas semanas – aí é quando as coisas começam a soar mais como Minority Report. DaScientific American:

"Um dos principais objetivos desta rodada é testar novos recursos de busca de imagens que possam analisar as fotos, mesmo quando partes não estiverem nítidas – isso inclui os rostos de traficantes ou uma tela de televisão no fundo, que podem auxiliar os investigadores. Outro objetivo é experimentar diferentes interfaces de usuário, e experimentar arquiteturas de streaming que avaliem dados de forma urgente."

Sim, a DARPA quer capturar criminosos vendo reflexos em telas de TV. A ideia é que a tecnologia impeça traficantes de pessoas antes que eles prejudiquem mais gente.

Como diz Dan Kaufman, da DARPA, ao 60 Minutes: “a maioria das pessoas na internet faz coisas benignas e boas, mas há parasitas vivendo lá, e nós tiramos a capacidade deles de usar a internet contra nós”.



Quando amanhecer, você já será um de nós...


CONFIRA OUTRAS POSTAGENS DO BLOG NOITE SINISTRA




2 comentários:

  1. Péssima ideia eles divulgarem isso.... Só dá tempo para os criminosos se esconderem....

    ResponderExcluir
    Respostas
    1. Pois é Paty, vai que em breve esse povo aprende a "enganar" o programa de rastreamento.

      Excluir

Topo