Seres humanos a serviço das máquinas

Recentemente o Google postou em seu blog a aquisição da empresa reCAPTCHA. Eles prometem matar dois coelhos com uma só cajadada: filtrar bots e auxiliar na conversão de imagens para texto (“stop spam. read books“). Esse último processo chama-se OCR (optical character recognition) e é um assunto estudado em inteligência artificial.

Exemplo de um recaptcha

Durante o primeiro semestre de 2008, participei de um projeto no qual uma das tarefas era fazer o reconhecimento ótico de uma placa de carro. O processo mais eficaz para fazê-lo foi através de inteligência artificial. A técnica é conhecida como aprendizado assistido. Nela você passa um conjunto de treinamento, ou seja, um monte de imagens de placa e diz qual o número da placa para cada uma dessas imagens. Aí a máquina “aprende” e é capaz de dizer o número de uma placa que não está no conjunto de treinamento. O problema é que esse conjunto de placas de treinamento geralmente é grande, e quem tem que dizer o número da placa é um ser humano (por isso o nome aprendizado assistido).

Enfim, não sei como funciona o esquema do reCAPTCHA, mas dá para ter uma noção e ver que a ideia deles é interessante. Eles pegam algumas palavras de um livro scaneado. Isso pode ser feito facilmente através de processamento de imagens. Dão uma distorcida nessas palavras e jogam para o usuário quando ele estiver logando em algum site, por exemplo. Obviamente ele vai tentar acertar a palavra e como a capacidade de um ser humano reconhecer uma palavra é infinitamente maior do que uma máquina, provavelmente vai acertar. Eis que temos usuários de todo o mundo ajudando a construir um conjunto de treinamento para fazer o OCR de um dado livro.

Piada genial do Apokalips

Mas ainda falta uma coisa: se eles querem que a gente diga a palavra correta, então eles não sabem a resposta. Logo, se um bot vier e digitar qualquer coisa, ele não só vai passar pelo sistema de segurança como irá poluir o conjunto de treinamento com informações erradas. Uma ideia é colocar uma outra imagem que eles já sabem qual é a palavra. Se o usuário acertar essa palavra, assumem que ele é um ser humano e que a outra palavra que ele digitou está certa!

Um outro lugar que se usa aprendizado assistido é no reconhecimento de rosto em fotos. Essa tarefa também fica bem fácil se você tem um conjunto de treinamento. Há algum tempo o Orkut reconhece rostos em fotos que você coloca nos seus álbuns. Mas antes disso, você é que tinha que marcar os rostos manualmente. Querendo ou não, os usuários do Orkut podem (não sei se eles utilizaram essa informação) ter prestado serviço ao site de relacionamentos, construindo o conjunto de treinamento para eles.

Os comentários estão fechados.

%d bloggers like this: