Aller au contenu principal

Données ouvertes citables

Ensemble de données ouverts italiens avec une méthodologie transparente, versionnement semver, DOI Zenodo optionnel et métadonnées DCAT-AP 2.1 + schema.org/Dataset pour l'indexation automatique sur Google Dataset Search.

0dataset en directCC BY 4.0 · Odbl · cc0licences ouvertesDCAT-AP 2.1Métadonnées de l'UE (Union européenne)ZenodoDOI prêt

Méthodologie transparente

Chaque ensemble de données déclare des sources d'origine, des critères de sélection, des transformations appliquées et la date d'extraction. README + CHANGELOG immuables garantissent la réplicabilité scientifique.

Versionnement semver

Majeure pour changer le schéma, mineure pour les données ajoutées, patch pour les corrections. Chaque version a un checksum SHA-256, elle est immuable et citable au fil du temps.

Citation académique

DOI Zenodo optionnel pour les versions stables : citation APA, BibTeX et métadonnées DataCite prêts pour les articles, mémoires et publications peer-reviewed.

Catalogue de données

Données téléchargeables en JSON et CSV, avec versionnement et DOI quand disponible.

Comment utiliser les ensembles de données

Trois guides rapides pour les environnements d'analyse de données courants. Chaque ensemble de données expose des points de terminaison REST et des fichiers statiques.

PythonPandas + requêtes HTTP avec Requests
import pandas as pd
import requests

r = requests.get(
  "https://federicocalo.dev/api/v1/open-data/"
  "musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())
RJSON Lite (ou JSONL) est un format de fichier qui permet d'importer des données en mode streaming, c'est-à-dire sans avoir besoin de charger tout le contenu du fichier dans la mémoire. Il s’
library(jsonlite)

df <- fromJSON(paste0(
  "https://federicocalo.dev/api/v1/open-data/",
  "musei-italia/versions/1.0.0/data.json"
))
head(df)
CSVMicrosoft Excel / Calc de Librairie Office
# Download CSV con versioning

curl -L -o musei-italia.csv \
  "https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"

# Apri in Excel: Dati → Da testo/CSV

Questions fréquentes

Licences, citations, mises à jour. Si quelque chose manque, ouvrez une issue ou écrivez à [email protected].

Peux-je utiliser les ensembles de données commercialement ?

Oui. Les ensembles de données sont distribués avec des licences ouvertes (CC-BY 4.0, ODbL 1.0 ou CC0-1.0) qui permettent un usage commercial. L'unique contrainte des licences avec attribution (CC-BY, ODbL) est de citer la source originale.

Comment citer correctement un ensemble de données ?

Chaque ensemble de données comprend un bloc "Citation" dans le CHANGELOG au format APA et BibTeX. Lorsqu'un DOI Zenodo est disponible, préférez-le car il est persistant et académiquement reconnu.

À quelle fréquence sont-ils mis à jour ?

Le cycle d'édition est trimestriel. Major release (v2.0) lorsqu'un schéma change, minor (v1.1) pour des données ajoutées, patch (v1.0.1) pour des corrections. Chaque version est immuable et citable via checksum SHA-256.

Quels formats sont disponibles?

JSON (native API REST), CSV pour l'analyse tabulaire, et metadata DCAT-AP 2.1 + schema.org/Dataset RDF-JSON pour l'indexation automatique sur Google Dataset Search et European Data Portal.

Quelle est la méthodologie de construction?

Chaque ensemble de données a une section "Méthodologie" dans le README qui spécifie : sources upstream (avec URL), critères de sélection, transformations appliquées, date d'extraction. Le versionnement semver + CHANGELOG immuable garantit la répétibilité.

Comment puis-je proposer un nouveau jeu de données ou une correction ?

Ouvrez une issue sur le dépôt GitHub federicocalo/portfolio avec l'étiquette "open-data". Pour les corrections ponctuelles (erreurs, outliers), une Pull Request sur le fichier source est bienvenue et sera évaluée dans les 7 jours.

Licenses and citations

Tous les ensembles de données sont publiés avec une licence ouverte déclarée (CC-BY 4.0, ODbL 1.0, ou CC0 selon la compatibilité avec les sources upstream). Chaque version a un checksum SHA-256, un CHANGELOG immuable et, quand disponible, un DOI Zenodo citable académiquement.

Avez-vous un jeu de données italien à publier?

Si vous travaillez avec des données ouvertes italiennes et que vous cherchez une plateforme avec des métadonnées DCAT-AP, DOI Zenodo et schema.org déjà configurées, écrivez-moi : nous évaluons ensemble si elle peut trouver sa place ici.