Skip to content

Latest commit

 

History

History
112 lines (67 loc) · 5.94 KB

README.md

File metadata and controls

112 lines (67 loc) · 5.94 KB

Quebra-Quebra

Os orçamentos da Câmara dos Deputados e do Senado, juntos, para 2017 totalizam R$ 10,2 bilhões. As despesas com "pessoal e encargos sociais somam cerca de R$ 8 bilhões!!! Um dos objetivos do HackFest contra a corrupção é o aprimoramento do uso dos recursos públicos .É essencial termos todas as remunerações abertas ( e não uma a uma) para uma análise mais aprofundada da estrutura de cargos e salários para eventuais correções. Os cidadãos, que pagam os salários, têm o direito de saber quanto ganham os seus empregados.

Nesse sentido, este projeto não só obteve as informações de remuneração de todos os servidores da câmara de deputados (2016/2017) e senado (2017) como também realizou várias análises e visualizações dessas informações para ajudar o cidadão a melhor entendê-las.

Scripts PHP

O diretório php contém os seguintes arquivos:

  • deputados.json - JSON com o perfil de todos os deputados, resultado da conversão de um arquivo de XML disponível no site da Câmara dos Deputados.
  • dep-nomes-encode.php - Retorna os nomes de todos os deputados a partir do arquivo deputados.json.
  • dep-links.php - Retorna o link de acesso às informações remunerações de cada deputado de acordo com o nome e o período informados via QueryString.
    • Exemplo: dep-links.php?periodoFolha=201704&nome=NOME-DO-DEPUTADO

Para executar os scripts acima, basta executá-los em um servidor web (local ou remoto) com suporte a PHP.

No diretório senado, foi iniciada a implementação de scripts para a listagem das folhas de pagamento de todos os servidores do Senado Federal.

Website

A branch ph-pages contém os arquivos responsáveis pela criação do site. Para exevutar o mesmo localmente basta:

  1. Clone o repositório com:
git clone https://github.com/tatianass/quebra-quebra.git
  1. Abra o arquivo index.html em seu navegador.

Crawler e scrapping dos dados da camara de deputados

Entrando na pasta camara_deputados você vai encontrar diferentes programas para acessar os dados da Câmara de Deputados.

lotacoes.sh

Gera um arquivo data/lotacoes.txt que tem todas as lotações (departamentos) da Câmara.

outro_servidores.sh

Gera um arquivo data/outros_servidores.txt com a lista de nomes de todos os servidores (não deputados) que trabalham na Câmara de deputados.

remuneracao_deputados_ano.sh

Gera arquivos SQL com comandos INSERT INTO data/deputados_inserts_${ANO}${MES}.sql que contem todas as remunerações de todos os deputados durante um ano.

remuneracao_funcionario.sh

Gera comandos SQL INSERT INTO das remunerações para um deputado num periodo especifico (YYYYMM).

remuneracao_outros_servidores_ano.sh

Gera arquivos SQL com comandos INSERT INTO data/outros_inserts_${ANO}${MES} que contem todas as remunerações de todos os servidores (não deputados) durante um ano.

servidores_lotacao.sh

Gera uma lista de nomes de servidores que trabalham numa especifica lotação da câmara.

sqls_txt.py

Converte todos os dados baixados para um txt, que será usado na análise dos dados da câmara.

Tutorial para dados do Senado

Segue os passos utilizados para o download dos dados do site do senado.leg.gov:

  1. Adicionar a extensão de baixar cookies no Mozilla: https://addons.mozilla.org/pt-BR/firefox/addon/export-cookies/?src=api . Ou use esta extensão no Google Chrome: https://chrome.google.com/webstore/detail/cookiestxt/njabckikapfpffapmjgojcnbfjonfjfg?utm_source=chrome-app-launcher-info-dialog

  2. Entrar no site: http://www.senado.gov.br/transparencia/rh/servidores/nova_consulta.asp

  3. Selecionar um servidor qualquer

  4. Escolher a data para a qual quer obter os dados

  5. Colocar o captcha e clicar em mais informações

  6. Vá em Ferramentas, na barra superior do Mozilla, e clique em baixar cookies OBS: As informaçes que serão baixadas serão apenas do mês e ano do cookie que você baixou, ou seja, para baixar informaçes de outro mês e ano, você precisará baixar um novo cookie

  7. Baixe os dados utilizando o shell do linux com o comando (há comandos semelhantes em outros sistemas operacionais, porém não foram testados):

cat codigos.txt | xargs -i wget "http://www.senado.gov.br/transparencia/rh/servidores/remuneracao.asp?fcodigo={}&fvinculo=&mes=01/01/2017" --load-cookies=cookies.txt

OBS: codigos.txt está disponível no github do projeto, a data deve ser conforme a selecionada no passo 4 e, os cookies são os que foram baixados no passe 6

Ou em Paralelo:

mywget() {
    wget "http://www.senado.gov.br/transparencia/rh/servidores/remuneracao.asp?fcodigo=$1&fvinculo=&mes=$2" --load-cookies=cookies.txt;
}


export -f mywget
parallel mywget :::: codigos.txt datas.txt

Tutorial para carregar as análises feitas no Tableau

As nossas análises de dados foram feitas no software de vizualização de dados chamado Tableau. Abaixo os passos para abrir e fazer uso dessas análises:

  1. Se ainda não tiver, baixe a última versão do Tableau Public (versão free do Tableau) em: https://public.tableau.com/en-us/s/download.
  2. Após isso, baixe o workbook (arquivo com todas as análises que fizemos) da pasta /workbook tableau.
  3. Finalmente, inicie o Tableau e abra o arquivo baixado no passo anterior.

Scripts em R

Esses códigos analisam as remunerações dos deputados federais do Brasil. Os dados foram coletados por meio de uma interface (R-MySQL), permitindo observar alguns salários com remuneracao adicional elevadas. Para executar esses códigos e necessário instalar os pacotes dependentes (listados na parte superior “library”) por meio do comando install.package. Dessa maneira, e possível gerar os gráficos exibidos nas paginas html do site.

Links de exemplos