Conjunto de dados - Dataset template
Este dataset template é um conjunto de automatizações desenvolvidas pela Diretoria Central de Transparência Ativa - DCTA/CGE para criação, documentação, validação e publicação (criação e atualização em instâncias do CKAN) de conjunto de dados ou datasets..
Funcionalidades:
- Documentação de acordo com especificação de qualidade de metadados sem fricção (fricitonless).
- Controle de versões da documentação e dos dados via Git e GitHub.
- Conversão automatizada de base de dados em Excel para formato tabular aberto (csv), caso necessário.
- Validação automatizada dos metadados e dos dados do conjunto, com demonstração de erros de validação, caso haja.
- Publicação automatizada (criação e atualização em instâncias do CKAN) do conjunto criado, documentado e validado.
- Arquivo de configuração
scripts/config.py
para cadastro de abas a serem convertidas para csv
dentro de arquivos Excel.
Como participar
A configuração deste dataset template está sendo feita de forma aberta e colaborativa no GitHub.
Existem duas alternativas para enviar sua contribuição:
- Issues: Para iniciar uma discussão sobre melhorias de funcionalidades.
- Pull requests: Para sugerir uma alteração concreta na ferramenta.
Todas as contribuições são bem vindas. Alguns exemplos são:
- Indicação de expressões imprecisas presentes na documentação;
- Sugestões para inclusão de descrições em campos específicos;
- Sugestões para clareza na organização das ideias;
- Correção de erros de ortografia e gramática.
Fluxo de execução
graph TD;
1(Início)-->2;
2[Forcar dataset template]-->3;
3[Cadastrar secrets]-->4;
4[Configurar github pages]-->5;
5[Incluir arquivo .xls na pasta upload]-->6;
6[Script publica novo conjunto no CKAN]-->7;
7(Fim)
Setup do projeto
Acesse aqui e veja o passo a passo da elaboração e publicação dos dados Setup do Projeto