Contagem de carros substitui censos com eficácia

27/12/2017

Uma equipa de investigadores de Stanford recorreu à inteligência artificial para, com a análise aos carros que surgiam em 50 milhões de imagens do Google Street View, fazer um censo populacional. Avaliando a raça e preferência política, esta investigação bem mais veloz revelou ser bastante certeira e com resultados próximos dos oficiais.

Os censos populacionais são um processo moroso e dispendioso, o que ajuda a explicar porque não são feitos com grande frequência. Mas uma equipa de investigadores da Universidade de Stanford encontrou uma alternativa para traçar o quadro social de uma cidade com base na análise aos carros que surgem no Google Street View. Para tal foram utilizadas cinquenta milhões de imagens deste programa informático, nas quais foram descobertos um total de 22 milhões de automóveis em 200 cidades.

De seguida, foi trabalhada esta base de dados. Este foi um processo alargado e moroso, pois significou a divisão em 2657 categorias com base no fabricante, modelo, carroçaria e ano de produção das viaturas. Depois, partindo das informações recolhidas nos censos anteriores e nas votações eleitorais de 2008, foi utilizada uma amostra composta por 35 das 200 cidades referidas. E, utilizando um programa de inteligência artificial desenvolvido para o efeito, procuraram saber se era possível associar o automóvel à raça e preferência eleitoral das pessoas.

Pode parecer um pouco preconceituoso, mas os Honda e os Toyota foram associados aos cidadãos de ascendência asiática. Já os afroamericanos eram representados pelos Chrysler, Buick e Oldsmobile, enquanto os americanos brancos preferiam os VW, as pick-ups e os Aston Martin. Relativamente às preferências de carroçaria, os sedan são maioritariamente conduzidos pelos democratas, enquanto as pick-ups de cabina longa são aquelas onde os republicanos têm maior representatividade.

No final, foi possível verificar que na referida amostra existia uma grande similaridade entre os dados dos censos e eleições de 2008 e os valores que o software de inteligência artificial apresentava. E, após a investigação ser alargada aos outros 165 polos urbanos, a correlação manteve-se. E, ao contrário do que acontece com os censos, que levam meses ou anos a ser finalizados, este programa demorou apenas duas semanas a catalogar os 50 milhões de imagens.

Os investigadores afirmam que gostariam de alargar a base de dados e poder agora utilizar formas de captação de dados mais avançados e com mais variáveis. Mas, segundo indicam, as preocupações éticas relativas à privacidade e proteção das informações são o principal entrave à implementação desta nova forma de traçar um panorama sobre a composição do tecido social nas cidades. Afinal, um software que permitisse fazer este tipo de estudos teria claramente um grande valor comercial…

Fonte: GizModo