Salta al contenido principal

Datos abiertos citables

Conjunto de datos italianos abiertos con metodología transparente, control de versiones semver, DOI Zenodo opcional y metadatos DCAT-AP 2.1 + schema.org/Dataset para indexación automática en Google Dataset Search.

0conjunto de datos en vivoCC BY 4.0 · Odbl · CC0licencias abiertasDCAT-AP 2.1Metadata de la U.E.ZenodoDOI listo

Metodología transparente

Cada conjunto de datos declara fuentes upstream, criterios de selección, transformaciones aplicadas y fecha de extracción. README + CHANGELOG inmutables garantizan la reproducibilidad científica.

Versionado semver

Mayor para cambiar el esquema, menor para datos adicionales, parche para soluciones. Cada versión tiene un checksum SHA-256, es inmutable y citable en el tiempo.

Cita académica

DOI Zenodo opcional para las versiones estables: cita APA, BibTeX y metadatos DataCite listos para artículos, tesis y trabajos revisados por pares.

Catálogo de conjuntos de datos

Datos descargables en JSON y CSV, con versionado y DOI cuando estén disponibles.

Cómo usar los conjuntos de datos

3 guías rápidas para entornos de análisis de datos comunes. Cada conjunto de datos expone endpoints REST y archivos estáticos.

PythonPandas + solicitudes
import pandas as pd
import requests

r = requests.get(
  "https://federicocalo.dev/api/v1/open-data/"
  "musei-italia/versions/1.0.0/data.json"
)
df = pd.DataFrame(r.json())
print(df.head())
RJSON Lite
library(jsonlite)

df <- fromJSON(paste0(
  "https://federicocalo.dev/api/v1/open-data/",
  "musei-italia/versions/1.0.0/data.json"
))
head(df)
CSVLibre Office/ Excel
# Download CSV con versioning

curl -L -o musei-italia.csv \
  "https://federicocalo.dev/api/v1/open-data/\
musei-italia/versions/1.0.0/data.csv"

# Apri in Excel: Dati → Da testo/CSV

Preguntas frecuentes

Licencias, citas, actualizaciones. Si falta algo, abre una incidencia o escribe a [email protected].

¿Puedo usar los conjuntos de datos también comercialmente?

Sí. Los conjuntos de datos están distribuidos con licencias abiertas (CC-BY 4.0, ODbL 1.0 o CC0-1.0), que permiten el uso comercial. El único requisito de las licencias con atribución (CC-BY, ODbL) es citar la fuente original.

¿Cómo citar correctamente un conjunto de datos?

Cada conjunto de datos incluye un bloque "Cita" en el CHANGELOG con formato APA y BibTeX. Cuando esté disponible un DOI Zenodo, prefiera usarlo porque es persistente y académicamente reconocido.

¿Con qué frecuencia se actualizan?

El ciclo editorial es trimestral. Major release (v2.0) cuando el esquema cambia, minor (v1.1) para datos adicionales, patch (v1.0.1) para correcciones. Cada versión es inmutable y citable mediante SHA-256.

¿Cuáles formatos están disponibles?

JSON (nativo API REST), CSV para análisis tabular, y metadatos DCAT-AP 2.1 + schema.org/Dataset RDF-JSON para indexación automática en Google Dataset Search y European Data Portal.

¿Cuál es la metodología de construcción?

Cada conjunto de datos tiene una sección "Metodología" en el README que especifica: fuentes upstream (con URL), criterios de selección, transformaciones aplicadas, fecha de extracción. Versionado semver + CHANGELOG inmutable garantizan reproducibilidad.

¿Cómo puedo proponer un nuevo conjunto de datos o una corrección?

Abre una issue en el repositorio GitHub federicocalo/portfolio con etiqueta "open-data". Para correcciones específicas (errores, outliers), una Pull Request al archivo fuente es bienvenida y se evalúa dentro de 7 días.

Licencias y citas

Todos los conjuntos de datos están publicados con una licencia abierta declarada (CC-BY 4.0, ODbL 1.0, o CC0 según la compatibilidad con las fuentes upstream). Cada versión tiene un checksum SHA-256, un CHANGELOG inmutable y, cuando esté disponible, un DOI Zenodo citable académicamente.

¿Tienes un conjunto de datos italiano que publicar?

Si trabaja con datos abiertos italianos y busca una plataforma con metadatos DCAT-AP, DOI Zenodo y schema.org ya configurados, escríbeme: evaluaremos juntos si puede encontrar un lugar aquí.