É possível  medir o nível de felicidade de uma população?
Data decisioning por SASGovernança

É possível medir o nível de felicidade de uma população?

Por meio da coleta e da análise de dados em redes sociais é possível estudar a opinião pública sobre empresas, instituições e governos.

As redes sociais mudaram a forma pela qual as pessoas interagem e se comunicam com seus familiares, amigos, empresas e órgãos governamentais. Não é por acaso que instituições públicas e privadas têm adotado diversas estratégicas de comunicação baseadas em mídias sociais. Governos e empresas têm utilizado essa forma de comunicação para se aproximar dos cidadãos e clientes, aumentando a transparência e dando voz à sociedade, que passou a ter um papel cada vez mais ativo nessa relação.

Contudo, para que essas manifestações sejam usadas como insumos para as instituições melhorarem sua relação com clientes e cidadãos, é importante que sejam utilizadas técnicas inovadoras para a análise desse grande volume de dados não estruturados e variados, gerados com grande velocidade, disponíveis nas mídias sociais. Somente no Twitter, são postados mais de 500 milhões de tweets a cada dia. Com tais inovações, as instituições poderão transformar as manifestações em oportunidades de evolução e fonte de conhecimento de modo a alavancar os negócios, tornando-se um diferencial competitivo.

A Análise de Sentimento é uma dessas técnicas. Pode ser definida como uma técnica que utiliza estatística, algoritmos Natural Language Processing (NLP) e Machine Learning para entender o contexto emocional das comunicações, principalmente sobre grandes quantidades de dados não estruturados, como as redes sociais. Sua finalidade é basicamente identificar a opinião das pessoas sobre determinado tema, sendo uma ferramenta muito utilizada pelas empresas para avaliar as mensagens e interações de clientes com suas centrais de atendimento e publicações em redes sociais sobre a própria companhia ou seus produtos.

A análise de sentimento acaba sendo muito útil para monitorar as ações de marketing, especialmente a reação do público sobre o lançamento de um novo produto ou serviço. Por meio do rastreamento de mudanças no comportamento dos clientes, busca identificar e extrair informações subjetivas de grandes volumes de dados não estruturados, utilizando uma combinação de técnicas de mineração de dados, processamento de linguagem natural, recuperação da informação e gestão do conhecimento.

Análise de Sentimento durante a pandemia

Em um artigo recentemente publicado, pesquisadores utilizaram a técnica para analisar o sentimento das pessoas em relação ao avanço da Covid-19, por meio de seleção de tweets que continham as hashtags #COVID-19, #FiqueEmCasa e suas variações. Os pesquisadores da Universidade Federal de Alfenas, Universidade Federal de São Carlos e Lancaster University concluíram que a análise de sentimentos pode ser uma “potencial ferramenta a ser utilizada pela vigilância de surtos e epidemias” e que pode ser usada para aprimorar o sistema de alerta dos sistemas de vigilância sanitária e saúde. Eles constataram que o sentimento negativo foi dominante na pesquisa e que houve “uma relação entre as publicações do Twitter e o movimento de disseminação do novo coronavírus no Brasil”.

O projeto de confiança de vacinas da Organização Mundial de Saúde usa a técnica de análise de sentimento, buscando publicações em redes sociais, notícias, blogs e outras plataformas online, para responder adequadamente qualquer ação de desinformação e “oferecer uma oportunidade de construir e sustentar a confiança nas vacinas e na imunização”.

Uso da técnica como instrumento para a Gestão Pública

A análise de sentimento pode ser usada para refletir a opinião pública e trazer contribuições valiosas para a gestão social. Os pesquisadores Daniel José Silva Oliveira, Paulo Henrique de Souza Bermejo, José Roberto Pereira e Daniely Aparecida Barbosa publicaram um artigo aplicando a técnica para avaliar a opinião dos cidadãos sobre quatro programas sociais desenvolvidos no Brasil durante o governo Dilma Rousseff: Bolsa Família, Minha Casa, Minha Vida, Mais Médicos e Programa Nacional de Acesso ao Ensino Técnico em Emprego (Pronatec).

Os pesquisadores concluíram que as mídias sociais possuem um “grande potencial para aumentar a participação social e fortalecer a democracia” e que os resultados obtidos pela aplicação da técnica foram capazes de identificar com precisão as opiniões positivas, negativas e neutras quanto aos programas sociais selecionados para o estudo.

Para os autores, a análise de sentimento se mostrou uma técnica vantajosa para governos que utilizam a estratégia de rede nas mídias sociais e um catalisador para as práticas de gestão social.

É possível medir o nível de felicidade de uma população? 

Seria possível usar a análise de sentimento para medir o nível de felicidade das pessoas? Esse é o objetivo do site hedonometer.org. Baseado no trabalho de uma equipe de pesquisadores liderada por Peter Dodds e Chris Danforth da Universidade de Vermont nos Estados Unidos, o projeto busca medir o nível de felicidade da população quase em tempo real. Além disso, o site vincula notícias e eventos à sua medição, dando indicadores da razão do sentimento identificado naquele momento. Segundo o site do projeto, o termo hedonometer (hedonômetro, em tradução livre) foi usado pela primeira vez pelo economista Francis Edgeworth e descreve “um instrumento idealmente perfeito, uma máquina psicofísica, registrando continuamente a altura do prazer experimentado por um indivíduo”.

E como esse medidor de felicidade funciona? Inicialmente, os pesquisadores identificaram em torno de 10.000 palavras comumente utilizadas nas publicações do Twitter. Em seguida, por meio da ferramenta de inteligência coletiva Amazon Mechanical Turk a equipe recrutou pessoas para pontuarem cada uma dessas palavras em uma escala de felicidade de um (triste) a nove (feliz). A lista das palavras (em nove idiomas, inclusive português) e a pontuação de cada uma delas está disponível no site do projeto. Essa abordagem de usar uma lista de palavras é chamada de “saco de palavras” (bag-of-words), uma representação simplificada muito utilizada no processamento de linguagem natural na qual o texto analisado é representado por um multiconjunto de suas palavras — as que estão no saco de palavras —, desconsiderando a ordenação e estrutura gramatical delas, mas mantendo sua multiplicidade. São feitos pequenos ajustes para evitar um cálculo enviesado, especialmente na importância relativa das palavras mais carregadas de emoção e remoção das palavras neutras ao determinar a felicidade de um determinado dia.

A partir daí, com a lista de palavras e suas respectivas pontuações, a equipe do projeto utiliza algoritmos de captura e de processamento de linguagem natural (NLP) para analisar automaticamente mais de 50 milhões de tweets, todos os dias, fazendo a identificação das palavras e somando a pontuação delas, gerando o resultado diário da felicidade. Por fim, os pesquisadores vinculam notícias, lançamentos de filmes e músicas tentando estabelecer um relacionamento entre o nível de felicidade e esses eventos. Esta última parte é feita principalmente para os tweets em inglês.

Analisando o gráfico de felicidade média para o Twitter na língua portuguesa, podemos identificar alguns fatos interessantes. Nos últimos dezoito meses, o dia mais “triste” foi 17 de março de 2020, data da primeira morte por Covid-19 registrada no Brasil e o dia mais feliz foi a véspera de Natal, 24 de dezembro, seguido pelo dia de Natal. No gráfico dos tweets em inglês, o dia mais “triste” foi 31 de maio de 2020, quando aconteceram os protestos pela morte de George Floyd e o dia mais “feliz” foi o Natal seguido pela véspera de Natal de 2020.

Outras datas “tristes” que podem ser destacadas no gráfico do hedometer.org são o dia 31 de maio de 2020, dia de manifestações pró-democracia; 1º de fevereiro de 2021, relacionado à notícia sobre a criança de 11 anos encontrada acorrentada em um barril; 3 de novembro de 2020, quando foi divulgado o caso Mariana Ferrer. As datas “felizes”, além do Natal de 2020, que merecem destaque são os dias 31 de dezembro e 1º de janeiro de 2021, pelo réveillon, 12 de junho de 2020 e 2021, dia dos namorados, e 10 de maio de 2020 e 9 de maio de 2021, dia das mães.

E as pessoas que não usam o twitter? 

As redes sociais são muito interessantes para como insumos para a realização de análise de Big Data, com várias aplicações no mundo real. Uma grande quantidade de dados é gerada continuamente quando os usuários publicam suas opiniões enquanto se comunicam entre si por meio de vários canais sociais. Além disso, possuem uma característica única conhecida como ‘semântica’, que se refere ao fato de serem gerados manualmente e conterem informações simbólicas com significado subjetivo inerente. Essa característica única do big data social leva a vários desafios e oportunidades para a análise de sentimento.

Contudo, é evidente que ferramentas como o hedonometer.org não conseguem captar o sentimento de quem não utiliza redes sociais como o Twitter. Apesar disso, é possível ter uma indicação de viés do nível de felicidade, uma vez que existem centenas de milhões de pessoas que atualmente publicam tweets para expressar suas atividades e interesses e, como tal, acaba se transformando em um importante indicativo social. Assim, a análise de sentimento em plataformas sociais pode ser usada para medir a opinião pública sobre instituições, empresas, produtos e assuntos diversos e, inclusive, para termos uma métrica do nível de felicidade médio de uma população.


Este artigo foi produzido por Fabio Correa Xavier, Diretor do Departamento de Tecnologia da Informação do TCESP, Mestre em Ciência da Computação, Professor e Colunista da MIT Technology Review.

Último vídeo

Nossos tópicos