Metodologia trasparente
Ogni dataset dichiara fonti upstream, criteri di selezione, trasformazioni applicate e data di estrazione. README + CHANGELOG immutabili garantiscono riproducibilità scientifica.
Dataset aperti italiani con metodologia trasparente, versioning semver, DOI Zenodo opzionale e metadata DCAT-AP 2.1 + schema.org/Dataset per indicizzazione automatica su Google Dataset Search.
Ogni dataset dichiara fonti upstream, criteri di selezione, trasformazioni applicate e data di estrazione. README + CHANGELOG immutabili garantiscono riproducibilità scientifica.
Major per cambi schema, minor per dati aggiunti, patch per fix. Ogni versione ha checksum SHA-256, è immutabile e citable nel tempo.
DOI Zenodo opzionale per le versioni stabili: citazione APA, BibTeX e metadata DataCite pronti per paper, tesi e articoli peer-reviewed.
Dati scaricabili in JSON e CSV, con versioning e DOI quando disponibile.
Service temporarily unavailable
Tre quick-start per ambienti data-analysis comuni. Ogni dataset espone endpoint REST e file statici.
import pandas as pd
import requests
r = requests.get(
"https://federicocalo.dev/api/v1/open-data/"
"musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())library(jsonlite)
df <- fromJSON(paste0(
"https://federicocalo.dev/api/v1/open-data/",
"musei-italia/versions/1.0.0/data.json"
))
head(df)# Download CSV con versioning
curl -L -o musei-italia.csv \
"https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"
# Apri in Excel: Dati → Da testo/CSVLicenze, citazioni, aggiornamenti. Se manca qualcosa apri una issue o scrivi a [email protected].
Sì. I dataset sono distribuiti con licenze aperte (CC-BY 4.0, ODbL 1.0 o CC0-1.0) che permettono uso commerciale. L'unico vincolo delle licenze con attribuzione (CC-BY, ODbL) è citare la fonte originale.
Ogni dataset include un blocco "Citazione" nel CHANGELOG con formato APA e BibTeX. Quando disponibile un DOI Zenodo, preferiscilo perché è persistente e accademicamente riconosciuto.
Il ciclo editoriale è trimestrale. Major release (v2.0) quando lo schema cambia, minor (v1.1) per dati aggiunti, patch (v1.0.1) per fix. Ogni versione è immutabile e citable via checksum SHA-256.
JSON (nativo API REST), CSV per analisi tabellare, e metadata DCAT-AP 2.1 + schema.org/Dataset RDF-JSON per indicizzazione automatica su Google Dataset Search ed European Data Portal.
Ogni dataset ha una sezione "Metodologia" nel README che specifica: fonti upstream (con URL), criteri di selezione, trasformazioni applicate, data di estrazione. Versioning semver + CHANGELOG immutabile garantiscono riproducibilità.
Apri una issue sul repository GitHub federicocalo/portfolio con label "open-data". Per correzioni puntuali (errori, outlier), una Pull Request sul file sorgente è benvenuta e viene valutata entro 7 giorni.
Tutti i dataset sono pubblicati con una licenza aperta dichiarata (CC-BY 4.0, ODbL 1.0, o CC0 a seconda della compatibilità con le fonti upstream). Ogni versione ha un checksum SHA-256, un CHANGELOG immutabile e, quando disponibile, un DOI Zenodo citabile accademicamente.
Policy complete:03_pubblicazione_dataset.md · 04_licenze_attribuzione.md
Se lavori con dati aperti italiani e cerchi una piattaforma con metadata DCAT-AP, DOI Zenodo e schema.org già configurati, scrivimi: valutiamo insieme se può trovare casa qui.