Méthodologie transparente
Chaque ensemble de données déclare des sources d'origine, des critères de sélection, des transformations appliquées et la date d'extraction. README + CHANGELOG immuables garantissent la réplicabilité scientifique.
Ensemble de données ouverts italiens avec une méthodologie transparente, versionnement semver, DOI Zenodo optionnel et métadonnées DCAT-AP 2.1 + schema.org/Dataset pour l'indexation automatique sur Google Dataset Search.
Chaque ensemble de données déclare des sources d'origine, des critères de sélection, des transformations appliquées et la date d'extraction. README + CHANGELOG immuables garantissent la réplicabilité scientifique.
Majeure pour changer le schéma, mineure pour les données ajoutées, patch pour les corrections. Chaque version a un checksum SHA-256, elle est immuable et citable au fil du temps.
DOI Zenodo optionnel pour les versions stables : citation APA, BibTeX et métadonnées DataCite prêts pour les articles, mémoires et publications peer-reviewed.
Données téléchargeables en JSON et CSV, avec versionnement et DOI quand disponible.
Service temporarily unavailable
Trois guides rapides pour les environnements d'analyse de données courants. Chaque ensemble de données expose des points de terminaison REST et des fichiers statiques.
import pandas as pd
import requests
r = requests.get(
"https://federicocalo.dev/api/v1/open-data/"
"musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())library(jsonlite)
df <- fromJSON(paste0(
"https://federicocalo.dev/api/v1/open-data/",
"musei-italia/versions/1.0.0/data.json"
))
head(df)# Download CSV con versioning
curl -L -o musei-italia.csv \
"https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"
# Apri in Excel: Dati → Da testo/CSVLicences, citations, mises à jour. Si quelque chose manque, ouvrez une issue ou écrivez à [email protected].
Oui. Les ensembles de données sont distribués avec des licences ouvertes (CC-BY 4.0, ODbL 1.0 ou CC0-1.0) qui permettent un usage commercial. L'unique contrainte des licences avec attribution (CC-BY, ODbL) est de citer la source originale.
Chaque ensemble de données comprend un bloc "Citation" dans le CHANGELOG au format APA et BibTeX. Lorsqu'un DOI Zenodo est disponible, préférez-le car il est persistant et académiquement reconnu.
Le cycle d'édition est trimestriel. Major release (v2.0) lorsqu'un schéma change, minor (v1.1) pour des données ajoutées, patch (v1.0.1) pour des corrections. Chaque version est immuable et citable via checksum SHA-256.
JSON (native API REST), CSV pour l'analyse tabulaire, et metadata DCAT-AP 2.1 + schema.org/Dataset RDF-JSON pour l'indexation automatique sur Google Dataset Search et European Data Portal.
Chaque ensemble de données a une section "Méthodologie" dans le README qui spécifie : sources upstream (avec URL), critères de sélection, transformations appliquées, date d'extraction. Le versionnement semver + CHANGELOG immuable garantit la répétibilité.
Ouvrez une issue sur le dépôt GitHub federicocalo/portfolio avec l'étiquette "open-data". Pour les corrections ponctuelles (erreurs, outliers), une Pull Request sur le fichier source est bienvenue et sera évaluée dans les 7 jours.
Tous les ensembles de données sont publiés avec une licence ouverte déclarée (CC-BY 4.0, ODbL 1.0, ou CC0 selon la compatibilité avec les sources upstream). Chaque version a un checksum SHA-256, un CHANGELOG immuable et, quand disponible, un DOI Zenodo citable académiquement.
Politique complète :03_pubblicazione_dataset.md · 04_licenze_attribuzione.md
Si vous travaillez avec des données ouvertes italiennes et que vous cherchez une plateforme avec des métadonnées DCAT-AP, DOI Zenodo et schema.org déjà configurées, écrivez-moi : nous évaluons ensemble si elle peut trouver sa place ici.