Metodología transparente
Cada conjunto de datos declara fuentes upstream, criterios de selección, transformaciones aplicadas y fecha de extracción. README + CHANGELOG inmutables garantizan la reproducibilidad científica.
Conjunto de datos italianos abiertos con metodología transparente, control de versiones semver, DOI Zenodo opcional y metadatos DCAT-AP 2.1 + schema.org/Dataset para indexación automática en Google Dataset Search.
Cada conjunto de datos declara fuentes upstream, criterios de selección, transformaciones aplicadas y fecha de extracción. README + CHANGELOG inmutables garantizan la reproducibilidad científica.
Mayor para cambiar el esquema, menor para datos adicionales, parche para soluciones. Cada versión tiene un checksum SHA-256, es inmutable y citable en el tiempo.
DOI Zenodo opcional para las versiones estables: cita APA, BibTeX y metadatos DataCite listos para artículos, tesis y trabajos revisados por pares.
Datos descargables en JSON y CSV, con versionado y DOI cuando estén disponibles.
Service temporarily unavailable
3 guías rápidas para entornos de análisis de datos comunes. Cada conjunto de datos expone endpoints REST y archivos estáticos.
import pandas as pd
import requests
r = requests.get(
"https://federicocalo.dev/api/v1/open-data/"
"musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())library(jsonlite)
df <- fromJSON(paste0(
"https://federicocalo.dev/api/v1/open-data/",
"musei-italia/versions/1.0.0/data.json"
))
head(df)# Download CSV con versioning
curl -L -o musei-italia.csv \
"https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"
# Apri in Excel: Dati → Da testo/CSVLicencias, citas, actualizaciones. Si falta algo, abre una incidencia o escribe a [email protected].
Sí. Los conjuntos de datos están distribuidos con licencias abiertas (CC-BY 4.0, ODbL 1.0 o CC0-1.0), que permiten el uso comercial. El único requisito de las licencias con atribución (CC-BY, ODbL) es citar la fuente original.
Cada conjunto de datos incluye un bloque "Cita" en el CHANGELOG con formato APA y BibTeX. Cuando esté disponible un DOI Zenodo, prefiera usarlo porque es persistente y académicamente reconocido.
El ciclo editorial es trimestral. Major release (v2.0) cuando el esquema cambia, minor (v1.1) para datos adicionales, patch (v1.0.1) para correcciones. Cada versión es inmutable y citable mediante SHA-256.
JSON (nativo API REST), CSV para análisis tabular, y metadatos DCAT-AP 2.1 + schema.org/Dataset RDF-JSON para indexación automática en Google Dataset Search y European Data Portal.
Cada conjunto de datos tiene una sección "Metodología" en el README que especifica: fuentes upstream (con URL), criterios de selección, transformaciones aplicadas, fecha de extracción. Versionado semver + CHANGELOG inmutable garantizan reproducibilidad.
Abre una issue en el repositorio GitHub federicocalo/portfolio con etiqueta "open-data". Para correcciones específicas (errores, outliers), una Pull Request al archivo fuente es bienvenida y se evalúa dentro de 7 días.
Todos los conjuntos de datos están publicados con una licencia abierta declarada (CC-BY 4.0, ODbL 1.0, o CC0 según la compatibilidad con las fuentes upstream). Cada versión tiene un checksum SHA-256, un CHANGELOG inmutable y, cuando esté disponible, un DOI Zenodo citable académicamente.
Política completa:03_pubblicazione_dataset.md · 04_licenze_attribuzione.md
Si trabaja con datos abiertos italianos y busca una plataforma con metadatos DCAT-AP, DOI Zenodo y schema.org ya configurados, escríbeme: evaluaremos juntos si puede encontrar un lugar aquí.