Salta al contenuto principale

Open Data citabili

Dataset aperti italiani con metodologia trasparente, versioning semver, DOI Zenodo opzionale e metadata DCAT-AP 2.1 + schema.org/Dataset per indicizzazione automatica su Google Dataset Search.

0dataset liveCC-BY 4.0 · ODbL · CC0licenze aperteDCAT-AP 2.1metadata UEZenodoDOI ready

Metodologia trasparente

Ogni dataset dichiara fonti upstream, criteri di selezione, trasformazioni applicate e data di estrazione. README + CHANGELOG immutabili garantiscono riproducibilità scientifica.

Versioning semver

Major per cambi schema, minor per dati aggiunti, patch per fix. Ogni versione ha checksum SHA-256, è immutabile e citable nel tempo.

Citazione accademica

DOI Zenodo opzionale per le versioni stabili: citazione APA, BibTeX e metadata DataCite pronti per paper, tesi e articoli peer-reviewed.

Catalogo dataset

Dati scaricabili in JSON e CSV, con versioning e DOI quando disponibile.

Come usare i dataset

Tre quick-start per ambienti data-analysis comuni. Ogni dataset espone endpoint REST e file statici.

Pythonpandas + requests
import pandas as pd
import requests

r = requests.get(
  "https://federicocalo.dev/api/v1/open-data/"
  "musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())
Rjsonlite
library(jsonlite)

df <- fromJSON(paste0(
  "https://federicocalo.dev/api/v1/open-data/",
  "musei-italia/versions/1.0.0/data.json"
))
head(df)
CSVExcel / LibreOffice
# Download CSV con versioning

curl -L -o musei-italia.csv \
  "https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"

# Apri in Excel: Dati → Da testo/CSV

Domande frequenti

Licenze, citazioni, aggiornamenti. Se manca qualcosa apri una issue o scrivi a [email protected].

Posso usare i dataset anche commercialmente?

Sì. I dataset sono distribuiti con licenze aperte (CC-BY 4.0, ODbL 1.0 o CC0-1.0) che permettono uso commerciale. L'unico vincolo delle licenze con attribuzione (CC-BY, ODbL) è citare la fonte originale.

Come cito correttamente un dataset?

Ogni dataset include un blocco "Citazione" nel CHANGELOG con formato APA e BibTeX. Quando disponibile un DOI Zenodo, preferiscilo perché è persistente e accademicamente riconosciuto.

Con che frequenza vengono aggiornati?

Il ciclo editoriale è trimestrale. Major release (v2.0) quando lo schema cambia, minor (v1.1) per dati aggiunti, patch (v1.0.1) per fix. Ogni versione è immutabile e citable via checksum SHA-256.

Quali formati sono disponibili?

JSON (nativo API REST), CSV per analisi tabellare, e metadata DCAT-AP 2.1 + schema.org/Dataset RDF-JSON per indicizzazione automatica su Google Dataset Search ed European Data Portal.

Qual è la metodologia di costruzione?

Ogni dataset ha una sezione "Metodologia" nel README che specifica: fonti upstream (con URL), criteri di selezione, trasformazioni applicate, data di estrazione. Versioning semver + CHANGELOG immutabile garantiscono riproducibilità.

Come posso proporre un nuovo dataset o una correzione?

Apri una issue sul repository GitHub federicocalo/portfolio con label "open-data". Per correzioni puntuali (errori, outlier), una Pull Request sul file sorgente è benvenuta e viene valutata entro 7 giorni.

Licenze e citazioni

Tutti i dataset sono pubblicati con una licenza aperta dichiarata (CC-BY 4.0, ODbL 1.0, o CC0 a seconda della compatibilità con le fonti upstream). Ogni versione ha un checksum SHA-256, un CHANGELOG immutabile e, quando disponibile, un DOI Zenodo citabile accademicamente.

Hai un dataset italiano da pubblicare?

Se lavori con dati aperti italiani e cerchi una piattaforma con metadata DCAT-AP, DOI Zenodo e schema.org già configurati, scrivimi: valutiamo insieme se può trovare casa qui.