Clusterização com os dados de votação da Câmara dos Deputados

A polêmica da semana foi sobre onde devemos posicionar certa deputada federal no espectro político direita–esquerda. Já há algum tempo, vinha pensando em usar os dados das votações no Congresso para uma análise dos grupos e partidos políticos no Brasil. Decidi usar a oportunidade para conhecer os dados e fazer um aquecimento com uma brincadeira rápida.

A base de dados está em Dados Abertos da Câmara dos Deputados e o meu código está em https://github.com/gabrielrega/congresso-brasil-cluster. Os dados são os votos de cada deputado em cada votação de 2019. Resumidamente o que eu fiz: primeiro, usei um algoritmo para determinar o número ideal de divisões dos deputados, identifiquei os grupos (pela experiência pessoal) e depois testei outras divisões.

O resultado foi que a divisão ideal seria em dois clusters: oposição (165) contra governo (366). Isso é um pouco mais do que eu esperava para oposição, estava pensando em uns 140. Dois pontos interessantes: não existe um centrão ideológico relevante e, a deputada em questão, ficou na oposição. Essa divisão tão clara pode ser efeito dos temas em votação em 2019, extremamente divisivos, sem muito espaço para composições e terceiras vias.

Divisão em 2 clusters

Em seguida forcei para termos 3 e depois 4 clusters. O que acontece. O governo cresce em cima da oposição, capturando 55 deputados (governo rebelde? oposição light?) e ficando com dois grupos de deputados (287 em grupo e 134 no outro). A deputada ainda está na oposição.

Divisão em 3 clusters

Conforme se aumenta o número de clusters daqui pra frente, é sempre o grupo do governo que se divide, permanecendo a oposição relativamente do mesmo tamanho. Experimente o código no link no começo.

O que eu queria ver feito: uma análise anual de 2015-2018, com as mudanças de grupo e o realinhamento de forças nesse período. Vocês fazem ou eu faço?

Análise de sentimento do COPOM com R (parte 1: usando a base de dados)

Inspirado no artigo “Quando as palavras contam a história”, do Terraço Econômico, resolvi elaborar minha própria implementação do método, contribuindo para a comunidade. Vou mostrar então como eu fiz em alguns posts dessa série:

  1. Usando a base de dados
  2. Replicando a base de dados
  3. Analisando o sentimento

Resolvi começar pelo final, divulgando a base de dados já pronta, para que os colegas possam já começar a criar suas próprias análise, nuvem de termos, contagem de palavras, etc.

Continuar lendo

Análise de sentimento do COPOM com R (parte 3: analisando o sentimento)

Inspirado no artigo “Quando as palavras contam a história”, do Terraço Econômico, resolvi elaborar minha própria implementação do método, contribuindo para a comunidade. Vou mostrar então como eu fiz em alguns posts dessa série:

  1. Usando a base de dados
  2. Replicando a base de dados
  3. Analisando o sentimento

Nesse post eu vou explicar como fazer uma análise de sentimento básica.

Continuar lendo

Análise de sentimento do COPOM com R (parte 2: replicando a base de dados)

Inspirado no artigo “Quando as palavras contam a história”, do Terraço Econômico, resolvi elaborar minha própria implementação do método, contribuindo para a comunidade. Vou mostrar então como eu fiz em alguns posts dessa série:

  1. Usando a base de dados
  2. Replicando a base de dados
  3. Analisando o sentimento

Nesse post eu vou explicar como eu fiz para baixar as atas do copom e ler elas no R.

Continuar lendo