Método transparente
Cada conjunto de dados declara suas fontes upstream, critérios de seleção, transformações aplicadas e a data da extração. O arquivo README mais o CHANGELOG imutáveis garantem reproducibilidade científica.
Dataset abertos italianos com método transparente, versão seguindo a semver, DOI Zenodo opcional e metadados DCAT-AP 2.1 + schema.org/Dataset para indexação automática no Google Dataset Search.
Cada conjunto de dados declara suas fontes upstream, critérios de seleção, transformações aplicadas e a data da extração. O arquivo README mais o CHANGELOG imutáveis garantem reproducibilidade científica.
Versão major para mudanças de esquema, versão menor para dados adicionados, patch para correções. Cada versão tem um hash SHA-256 imutável e pode ser referenciado no tempo.
DOI do Zenodo opcional para versões estáveis: citação APA, BibTex e metadados de dados CitaData pronto para artigos acadêmicos, teses e publicações revisadas por pares.
Dados descarregáveis em formato de arquivo JSON e CSV com versão e DOI (Digital Object Identifier) sempre que possível.
Service temporarily unavailable
Três quick-start para ambientes de análise de dados comuns. Cada conjunto de dados expõe endpoints REST e arquivos estáticos.
import pandas as pd
import requests
r = requests.get(
"https://federicocalo.dev/api/v1/open-data/"
"musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())library(jsonlite)
df <- fromJSON(paste0(
"https://federicocalo.dev/api/v1/open-data/",
"musei-italia/versions/1.0.0/data.json"
))
head(df)# Download CSV con versioning
curl -L -o musei-italia.csv \
"https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"
# Apri in Excel: Dati → Da testo/CSVLicenças, citações, atualizações. Se falta algo abra uma issue ou escreva para [email protected].
Sim. Os meus datasets estão distribuídos com permissões abertas (CC-BY 4.0, ODbL 1.0 ou CC0-1.0), que permitem o uso comercial. A única restrição das licenças de atribuição (CC-BY e ODbL) é citar a fonte original.
Cada conjunto de dados inclui um bloqueio "Referência" no CHANGELONG com o formatao APA e LaTeX-BibTex quando estiver disponível, prefira-o porque é permanente e reconhecido acadêmico.
O ciclo editoriale é trimestral. Major release (versão 2.0), quando o esquema mudar, minor (versão 1.1) para dados adicionados, patch (v1.0.1) para fixação. Cada versão é imutável e pode ser citado via checksum SHA-256.
JSON (API nativa de REST), CSV para análise em tabela, e metadados DCAT-AP 2.1 + schema.org /Dataset JSON-RDF para indexação automática no Google Dataset Search e European Data Portal.
Cada conjunto de dados tem uma seção "Metodologia" no README que especifica: fontes upstream (com URL), critérios de seleção, transformações aplicadas e data da extração. Versionamento semver + CHANGELOG imutável garante a reproducibilidade.
Abra uma Issue no repositório do GitHub de Federico Calò com a etiqueta "open-data". Para revisões pontuais (erros ou outliers) é bem-vinda Pull Request para o arquivo-fonte, que será avaliada em até sete dias.
Todos os conjuntos de dados são publicados com uma licença aberta declarada (CC-BY 4.0, ODbL 1.0 ou CC0 dependendo da compatibilidade das fontes upstream). Cada versão tem um checksum SHA-256, CHANGELOG imutável e, quando disponível, DOI Zenodo citavel academicamente.
Política completa:03_pubblicazione_dataset.md · 04_licenze_attribuzione.md
Se trabalhar com dados abertos italianos e procurar uma plataforma com metadados DCAT-AP, DOI do Zenodo e o esquema org já configurado, escreva-me: avaliemos juntos se pode encontrar um lugar aqui.