Skip to content

Princípios e Diretrizes⚓︎

Leis dos Dados Abertos - por David Eaves:

São proposições amplamente difundidas sobre as características mínimas esperadas para uma base aberta de dados. Gestores governamentais e publicadores devem cuidar para que essas características estejam asseguradas, de modo a promover o acesso, uso e reuso dos dados.

  1. Se o dado não pode ser encontrado e indexado na web, ele não existe.

    Ex: bases de dados de datawarehouses ou sistemas internos de acesso restrito não são abertos

  2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado.

    Ex: arquivos não-estruturados, como boletins (em pdf) não são compreendiddos por programas

  3. Se algum dispositivo legal não permitir sua reaplicação, ele não é útil.

    Ex: dado disponível na web, em formato aberto e estruturado, mas tem uma licença restringindo seu uso

Formatos

Conforme a Cartilha Técnica para Publicação de Dados Abertos no Brasil, os principais formatos de dados abertos são os arquivos com as seguintes extensões:

.csv, .xml, .ods, .rdf, .json

Os formatos de dados mais utilizados no Portal de Dados Abertos de Minas Gerais são:

  • o csv, para os dados. O CSV (valores separados por vírgulas) é um arquivo de texto com formato específico para possibilitar o salvamento dos dados em um formato estruturado de tabela.

  • o json, para os metadados. O JSON, que significa JavaScript Object Notation, é uma formatação utilizada para estruturar dados em formato de texto e transmiti-los de um sistema para outro

Ambos têm uma característica essencial, que é ser tabular, ou seja, dados estruturados em formato de tabela.

Representação do dado tabular:

campo     campo
  |         |
  |         |
  V         V

 A     |    B    |    C    |    D      <--- linha (cabeçalho)
 ------------------------------------
 valA  |   valB  |  valC   |   valD    <--- linha

csv:

  • Um bom exemplo de definição, características e exemplos do dado em formato .csv encontra-se no portal de Dados Abertos de Buenos Aires

  • como editar, importar e exportar, pode ser melhor verificado em: https://rockcontent.com/br/blog/csv/

json:

[
  { "A": valor, "B": valor, ... },
  { "A": valor, "B": valor, ... },
  ...
]
  • Uma caracterização desse formato tabular com as especificações utilizadas no Portal de Dados Abertos pode ser encontrada em: https://specs.frictionlessdata.io/table-schema/#concepts

O dialect: como fazer representar o arquivo de dados .csv:

Parte dos metadados são formas de representação lógica dos próprios dados (tal qual um mapa visa descrever um território). Uma informação de metadado necessária para correta leitura, interpretação e reuso dos dados tabulares em formato .csv é a sua descrição lógica num arquivo dialect.json. Um exemplo dessa descrição lógica, da estrutura do arquivo csv:

{
  "dialect": {
    "delimiter": ";",
    "doubleQuote": true,
    "lineTerminator": "\r\n",
    "quoteChar": "\"",
    "skipInitialSpace": true,
    "header": true,
  }
}

Os formatos .PDF, .DOC, .DOCX, .XLS e .XLSX são INCOMPATÍVEIS com a filosofia dos dados abertos!

Escala de Dados Abertos

Uma figura comum nas cartilhas e materiais é esta que apresenta o grau de maturidade dos dados de acordo com um conjunto de atributos necessários, prescritos nas leis e normas (incluindo até a terceira estrela abaixo):

★ : dados disponíveis na web (não importa o formato) sob uma licença aberta. Por exemplo, um PDF.

★ ★ : dados disponíveis de forma estruturada. Por exemplo, excel no lugar de imagem escaneada.

★ ★ ★ : dados disponíveis em formatos não-proprietários. Por exemplo, um CSV e não excel.

★ ★★ ★: identificador uniforme de recurso

★ ★★ ★★ : dados conectados RDF/LOD

image

Nessa escala, o dado é considerado efetivamente aberto quando alcança o nível de três estrelas.

As demais estrelas fornecem mais possibilidades, como navegar mais facilmente por eles e encontrar novas informações e relações.

Aplicação dos pricípios e normativos no Portal de Dados Abertos de MG/PdA:⚓︎

princípio referência legal arquitetura PdA
oportuno, atual Lei nº 12.527/2011, art. 8 § 3º, VI frequência de atualização equivalente à das consultas do Portal da Transparência; versionamento em repositório com controle e informação da periodicidade de atualização como propriedade de metadado no datapackage.json
compreensível Lei nº 12.527/2011, art. 8 § 3º, IV adoção de dicionário de dados com padrão predefinido
acessível Lei 12.527/2011, art. 8 § 3º, III disponibilização dos datasets na plataforma CKAN, com possibilidade de requisições via API
utilizável, processável por máquina Lei nº 12.527/2011, art. 8 § 3º, II formatos abertos e estruturados dos arquivos de recursos dos datasets (csv, json)
comparável Decreto Federal 8.777/2016: art. 2º, IV especificação documentada publicamente através dos datapackage.json
interoperável Lei nº 12.527/2011, art. 8 § 3º, III adoção do padrão Frictionless Data

Saiba Mais⚓︎

Conheça mais um pouco sobre a importância dos dados abertos, suas diferenças e complementaridades com o Portal da Transparência no 17º episódio do PodeFalar!, o nosso podcast da CGE, em que a então Subcontroladora de Transparência e Integridade, Nicolle Bleme, conversou com a Diretora-Executiva da Open Knowledge Brasil, Fernanda Campagnucci.


Last update: May 18, 2023 12:41:38
Created: March 10, 2023 15:05:51