Spring zum Hauptinhalt

Offene Daten zu lesen

Öffentliche italienische Datenmengen mit transparenter Methode, SemVer-Versionierung, optionaler DOI bei Zenodo und Metadaten DCAT-AP 2.1 + schema.org/Dataset für automatische Indizierung auf Google Dataset Search.

0Datensatz lebtCC BY 4.0 · Odb-Lizenz · CC0licenzen öffentlichDCAT-AP 2.1metadata EUZenodoDOI bereit

Transparente Methode

Jeder Dataset gibt Quellen上游, Auswahlkriterien, angewendete Transformationen und Extraktionsterminus an. README + CHANGELOG sind unveränderbar, um Wissenschaftliche Reproduzierbarkeit zu gewährleisten.

Semver-Versionierung

Major für Schemaänderungen, Minor für hinzugefügte Daten, Patch für Fixes. Jede Version hat einen SHA-256-Checksumm, ist unveränderlich und zeitlich zitierbar.

Akademische Zitate

DOI Zenodo optional für die stabilen Versionen: Zitation in APA, BibTeX und Metadaten für DataCite bereit für Artikel, Abschlussarbeiten und wissenschaftliche Arbeiten.

Katalog-Dataset

Daten herunterladbar in JSON und CSV, mit Versionskontrolle und DOI, wenn verfügbar.

Wie die Datensätze verwenden

3 Schnellstartleitfäden für häufige Datenanalyse-Umgebungen. Jeder Datensatz bietet Endpunkte REST und statische Dateien.

PythonPandas + Requests
import pandas as pd
import requests

r = requests.get(
  "https://federicocalo.dev/api/v1/open-data/"
  "musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())
RJSON-Lite
library(jsonlite)

df <- fromJSON(paste0(
  "https://federicocalo.dev/api/v1/open-data/",
  "musei-italia/versions/1.0.0/data.json"
))
head(df)
CSVMicrosoft Excel / Libre Office Calc
# Download CSV con versioning

curl -L -o musei-italia.csv \
  "https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"

# Apri in Excel: Dati → Da testo/CSV

Häufig gestellte Fragen

Lizenzen, Zitate, Aktualisierungen. Wenn etwas fehlt, öffne ein Issue oder schreibe an [email protected].

Kann ich die Datenmengen auch kommerziell nutzen?

Die Datensätze sind unter offenen Lizenzen (CC-BY 4.0, ODbL 1.0 oder CC0-1.0) verbreitet, die kommerzielle Nutzung erlauben. Die einzige Einschränkung der Lizenzen mit Urheberrechtserklärung (CC-BY, ODbL) ist die Zitierung der ursprünglichen Quelle.

Wie zitiere ich einen Datensatz korrekt?

Jeder Datensatz enthält einen "Zitierblock" im CHANGELOG im APA- und BibTeX-Format. Wenn ein DOI Zenodo verfügbar ist, bevorzugen Sie ihn, da er persistent und akademisch anerkannt ist.

Mit welcher Häufigkeit werden aktualisiert?

Der Editzyklus ist trimestral. Major Release (v2.0), wenn das Schema ändert, Minor (v1.1) für hinzugefügte Daten, Patch (v1.0.1) für Fixes. Jede Version ist unveränderlich und zitierbar über den SHA-256-Checksum.

Welche Formate sind verfügbar?

JSON (nativer API REST), CSV für tabellarische Analyse, und metadata DCAT-AP 2.1 + schema.org/Dataset RDF-JSON für automatische Indizierung auf Google Dataset Search und European Data Portal.

Welche Baustelle gibt es?

Jeder Dataset hat eine "Methodologie"-Sektion im README, die angibt: upstream-Quellen (mit URL), Auswahlkriterien, angewendete Transformationen, Extraktionstermin. Semver-Versionierung + unveränderliches CHANGELOG gewährleisten Reproduzierbarkeit.

Wie kann ich einen neuen Datensatz oder eine Korrektur vorschlagen?

Öffne eine Issue im Repository GitHub federicocalo/portfolio mit der Label "open-data". Für korrekturwürdige Änderungen (Fehler, Ausreißer) ist eine Pull Request auf dem Quelldatei sehr willkommen und wird innerhalb von 7 Tagen bewertet.

Lizenzen und Zitate

Alle Datensätze wird eine offene Lizenz angegeben (CC-BY 4.0, ODbL 1.0 oder CC0 je nach Kompatibilität mit den upstream-Quellen). Jede Version hat einen SHA-256-Checksumm, ein unveränderliches CHANGELOG und, wenn verfügbar, einen citierbaren DOI von Zenodo.

Haben Sie ein italienisches Dataset zum Veröffentlichen?

Wenn Sie mit italienischen offenen Daten arbeiten und nach einer Plattform suchen, die DCAT-AP, DOI Zenodo und schema.org bereits konfiguriert hat, schreiben Sie uns: Wir evaluieren gemeinsam, ob hier Platz für Sie ist.