O Google Street View se tornou uma maneira surpreendentemente útil de aprender sobre o mundo sem precisar sair de dentro de casa. As pessoas o usam para planejar viagens, explorar destinos de férias e perseguir amigos e inimigos de forma virtual.
Mas os pesquisadores descobriram usos mais ardilosos. Em 2017, uma equipe de pesquisadores usou as imagens para estudar a distribuição dos tipos de carros nos EUA e, em seguida, usou esses dados para determinar a composição demográfica do país. Acontece que o carro que você dirige é um indicador surpreendentemente confiável de seu nível de renda, educação, ocupação e até mesmo a forma como você vota nas eleições.
Agora, um grupo diferente de pesquisa foi ainda mais longe. Łukasz Kidziński da Universidade de Stanford na Califórnia e Kinga Kita-Wojciechowska da Universidade de Varsóvia na Polônia usaram imagens do Street View de casas de pessoas para determinar a probabilidade de elas se envolverem em um acidente de carro. Essas são informações valiosas que uma seguradora poderia usar para definir os prêmios.
O resultado levanta questões importantes sobre como as informações pessoais podem vazar de conjuntos de dados aparentemente inocentes e se as organizações devem ser capazes de usá-las para fins comerciais.
Seguro de dados
O método dos pesquisadores é simples. Eles começaram com um conjunto de dados de 20.000 registros de pessoas que fizeram seguro de automóveis na Polônia entre 2013 e 2015. Estes foram selecionados aleatoriamente a partir do banco de dados de uma seguradora não divulgada.
Cada registro incluía o endereço do titular da apólice e o número de reclamações de danos que ele fez durante o período de 2013-15. A seguradora também compartilhou sua própria previsão de sinistros futuros, calculada usando seu modelo de risco de última geração que leva em consideração o código postal do segurado e a idade do motorista, sexo, histórico de sinistros e assim por diante.
A questão que Kidziński e Kita-Wojciechowska investigaram é se eles poderiam fazer uma previsão mais precisa usando uma imagem do Google Street View da casa do segurado.
Para descobrir, os pesquisadores inseriram o endereço de cada segurado no Google Street View e baixaram uma imagem da residência. Classificaram esta moradia de acordo com o seu tipo (individual, geminada, bloco de apartamentos, etc.), a idade das construções e o seu estado. Finalmente, os pesquisadores analisaram os números desse conjunto de dados para ver como ele se correlacionava com a probabilidade de um segurado fazer uma reclamação.
Os resultados foram surpreendentes. Acontece que a residência do segurado é um indicador surpreendentemente eficaz da probabilidade de ele fazer uma reclamação. “Descobrimos que as características visíveis da foto de uma casa podem ser preditivas do risco de acidente de carro, independentemente de variáveis classicamente usadas, como idade ou código postal”, dizem Kidziński e Kita-Wojciechowska.
Quando esses fatores são adicionados ao modelo de risco de última geração da seguradora, eles melhoram seu poder preditivo em 2%. Para colocar isso em perspectiva, o modelo da seguradora é apenas 8% mais preciso que os demais e é baseado em um conjunto de dados muito maior que inclui variáveis como idade, sexo e histórico de sinistros.
Assim, a técnica do Google Street View tem o potencial de melhorar significativamente a previsão. Mas o trabalho atual é apenas uma prova de princípio. Os pesquisadores dizem que sua precisão poderia ser melhorada usando conjuntos de dados maiores e melhores análises de dados.
Consentimento informado e ciente
A abordagem dos pesquisadores levanta uma série de questões importantes sobre como os dados pessoais devem ser usados. Os segurados na Polônia podem se surpreender ao saber que seus endereços residenciais foram inseridos no Google Street View para obter e analisar uma imagem de sua residência.
Uma questão interessante é se eles deram consentimento estando cientes dessa atividade e se uma seguradora pode usar os dados dessa forma, dadas as rígidas leis de privacidade de dados da Europa. “O consentimento dado pelos clientes à empresa para armazenar seus endereços não significa necessariamente um consentimento para armazenar informações sobre suas casas”, afirmam Kidziński e Kita-Wojciechowska.
E isto poderia abrir uma caixa de Pandora de análise de dados. Se as seguradoras podem se beneficiar, por que não outras empresas? “O setor de seguros poderia ser rapidamente seguido pelos bancos, pois há uma correlação comprovada entre os modelos de risco de seguro e a pontuação de risco de crédito”, afirmam Kidziński e Kita-Wojciechowska.
A capacidade de coletar, analisar e explorar informações aumentou drasticamente nos últimos anos. Ela ultrapassou a compreensão da maioria das pessoas sobre o que é possível fazer com seus dados e, certamente, a velocidade com que a legislação pode ser aprovada para controlá-la.
Obviamente, o Google não é a única empresa a coletar imagens de ruas. “Tal prática, no entanto, levanta preocupações sobre a privacidade dos dados armazenados no Google Street View publicamente disponível, no Bing Maps Streetside da Microsoft, Mapillary ou em conjuntos de dados privados equivalentes como CycloMedia”, afirmam Kidziński e Kita-Wojciechowska.
Esse tipo de trabalho provavelmente levantará a questão de se essas empresas devem ser capazes de coletar e armazenar essas imagens. Na Alemanha, onde a privacidade é uma questão importante de debate público, o Google já foi proibido de coletar imagens do Street View. Pode não ser o último lugar para estabelecer tal proibição.
Ref: arxiv.org/abs/1904.05270: A imagem do Google Street View de uma casa prevê o risco de acidente de carro de seu residente