Bună! Sunt

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

Contactează-mă

Despre Mine

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

Competențele Mele

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

Automatizarea Proceselor

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

Sisteme Personalizate

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

Misiunea Mea

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

Democratizarea Tehnologiei

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

Unirea IT și Economiei

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

Crearea de Soluții Personalizate

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

Transformă-ți Afacerea cu Tehnologia

Che tu gestisca un negozio, uno studio professionale o un'azienda, posso aiutarti a sfruttare le potenzialità dell'informatica per lavorare meglio, più velocemente e in modo più intelligente.

Hai să Vorbim →

Unisciti alla Community

Entra nella community di sviluppatori dove discutiamo di software, AI, architettura e DevOps. Condividi idee, fai domande e cresci insieme a noi.

Canale

FC Dev Blog

Ricevi notifiche su nuovi articoli, serie complete, tips settimanali e tool in evidenza. Contenuti bilingui IT/EN direttamente nel tuo Telegram.

Nuovi articoli appena pubblicati
Tips e code snippets settimanali
Sondaggi sugli argomenti futuri

Iscriviti al Canale

Gruppo

FC Dev Community

Una community bilingue IT/EN per sviluppatori. Discussioni, Q&A, aiuto reciproco e networking con altri professionisti del settore.

Discussioni su articoli e tecnologie
Help coding e code review
Opportunità di lavoro e collaborazione

Unisciti al Gruppo

Topic di Discussione

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

Linguaggi & Tecnologie

Java

Python

JavaScript

Angular

React

TypeScript

SQL

PHP

CSS/SCSS

Node.js

Docker

Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

Contactează-mă

Ai un proiect în minte? Hai să vorbim! Completează formularul și îți voi răspunde curând.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

Guvernare ML: conformitate, urmărire de audit și IA responsabilă în producție

Modelul dvs. de predicție a pierderii atinge o acuratețe de 92%, difuzarea FastAPI este stabilă, clusterul Kubernetes se scalează automat. Apoi sosește un e-mail de la departamentul juridic: „A noastră modelul de credit se încadrează în categoria cu risc ridicat din Legea AI UE. Trebuie să dovedim că nu discriminează după sex sau vârstă. Unde sunt jurnalele de decizie pentru ultimele 6 luni? Cine a aprobat implementarea în producție?"

Dacă nu aveți răspunsuri imediate la aceste întrebări, proiectul dumneavoastră ML este în pericol. The Regulamentul UE privind inteligența artificială (Legea AI), a intrat parțial în vigoare în august 2025, cu termenul final pentru sistemele cu risc ridicat stabilit pentru 2 august 2026, a a transformat guvernarea ML dintr-o bună practică opțională într-o obligație legală cu amenzi de până la 6%. cifra de afaceri globala anuala. Piața MLOps, în valoare de 4,38 miliarde USD în 2026, în creștere cu 39,8% CAGR și pentru că companiile trebuie să se doteze cu o infrastructură de guvernanță pentru a rămâne conforme.

În această lucrare construim un cadru cuprinzător de guvernare ML open-source: din analiza cerințelor Legii AI, la generarea automată de carduri model, la pista de audit cu MLflow, la detectarea corectitudinii cu Fairlearn, până la explicabilitate cu SHAP. Toate cu cod Python funcțional și aplicabil imediat, chiar și cu un buget limitat.

Ce vei învăța

Cerințe practice ale EU AI Act pentru sistemele ML cu risc ridicat (termen limită august 2026)
Generați modele automate de carduri cu documentație standardizată
Implementați piste de audit cuprinzătoare cu MLflow și jurnalele structurate
Măsurați și reduceți părtinirea cu Fairlearn (paritate demografică, cote egalizate)
Explicabilitate cu SHAP: importanța caracteristicilor globale și explicații locale
Model de registru de guvernare: tranziții de etapă cu aprobări urmărite
Cadrul de evaluare a riscurilor pentru a vă clasifica modelele AI
Lista de verificare AI responsabilă pentru IMM-urile cu bugete sub 5.000 EUR/an

EU AI Act: Ce se schimbă pentru modelele dvs. ML

Legea AI clasifică sistemele AI în patru niveluri de risc cu obligații crescânde. Înainte implementați orice cadru de guvernare, trebuie să înțelegeți unde se încadrează modelul dvs. în el taxonomie. Clasificarea nu depinde de tehnologia utilizată (XGBoost-ul tău nu este intrinsec mai mult sau mai puţin riscant decât un transformator) dar dinutilizarea prevăzută și domeniul de aplicare.

Cele 4 categorii de risc ale Legii AI

Risc inacceptabil (interzis): sisteme de notare socială, manipulare subliminală, exploatarea vulnerabilității. Nu este posibilă implementarea.
Risc ridicat (cerințe stricte): sisteme de creditare, angajare, educație, infrastructuri critice, dispozitive medicale, migrații. Termen limită de conformitate: 2 august 2026.
Risc limitat (transparență obligatorie): chatbot, deepfake, sisteme de recomandare. Obligația de a informa utilizatorul care interacționează cu AI.
Risc minim (voluntar): filtre de spam, jocuri AI, recomandări standard. Fără obligații specifice de reglementare.

Pentru sisteme cu risc ridicat, Legea AI impune o serie de obligații tehnice și pașii organizaționali pe care echipa ML trebuie să îi implementeze în conducta lor MLOps. Principalele cerințe, în vigoare din august 2026, se referă la:

Sistem de management al riscului: proces continuu de identificare, analiză și atenuare i riscuri de-a lungul întregului ciclu de viață al modelului.
Guvernarea datelor: seturile de date de instruire, validare și testare trebuie să fie documentate; reprezentativ, lipsit de părtinire și adecvat scopului declarat.
Documentatie tehnica: documentație tehnică suficientă pentru a demonstra respectarea autorităților de supraveghere. Include arhitectura, proceduri de instruire, metrici performanță și limitări cunoscute.
Păstrarea automată a înregistrărilor: sistemul trebuie să înregistreze automat evenimentele relevante în timpul operațiunilor, cu jurnalele neschimbabile pentru audit.
Transparență și informații despre utilizator: utilizatorii trebuie să știe cine sunt interacționând cu un sistem AI și primind informații ușor de înțeles despre capacitățile și limitările acestuia.
Supravegherea umană: mecanisme tehnice care să permită supravegherea umană, intervenția și anularea deciziilor automate.
Acuratețe, robustețe, securitate cibernetică: metrici de performanță documentate, Test de robustețe împotriva schimbărilor distribuționale și a intrărilor adverse.

Sancțiunile Actului AI: nu sunt teoretice

Sancțiunile pentru nerespectarea Legii AI sunt severe: până la 30 milioane EUR sau 6% din cifra de afaceri globala anuala pentru încălcări legate de sisteme cu risc inacceptabil; până 20 milioane EUR sau 4% pentru alte obligații; până 10 milioane EUR sau 2% pentru informații incorecte către autorități. Primul termen critic pentru sistemele cu risc ridicat și 2 august 2026: mai puțin de 6 luni de la data prezentului articol. Dacă modelul dvs operează în credit, angajare sau infrastructură critică, planul de conformitate trebuie să înceapă de astăzi.

Carduri model: documentație model standardizată

Le card model, introdus de Google în 2019 și adoptat acum ca standard industrial, sunt documente structurate care descriu un model ML: scop, performanță pentru diferite subgrupe date demografice, limitări cunoscute, utilizare prevăzută și recomandată. Actul AI le cere implicit în secțiunea „documentație tehnică”. Generați-le manual și predispuse la erori: următorul cod se automatizează crearea din metadate de antrenament și rezultatele evaluării.

# model_card_generator.py
# Generatore automatico di Model Card conforme AI Act
# Compatibile con MLflow per tracciamento artefatti

import json
import datetime
from dataclasses import dataclass, field, asdict
from typing import Optional
import mlflow
import pandas as pd
import numpy as np
from sklearn.metrics import (
    accuracy_score, precision_score, recall_score,
    f1_score, roc_auc_score, confusion_matrix
)

@dataclass
class ModelCardMetrics:
    """Metriche di performance del modello."""
    accuracy: float
    precision: float
    recall: float
    f1: float
    auc_roc: Optional[float] = None
    sample_size: int = 0
    evaluation_date: str = ""

@dataclass
class SubgroupMetrics:
    """Metriche per sottogruppo demografico (richieste EU AI Act)."""
    group_name: str
    group_value: str
    accuracy: float
    precision: float
    recall: float
    false_positive_rate: float
    sample_size: int

@dataclass
class ModelCard:
    """Model Card standardizzata conforme alle linee guida EU AI Act."""
    # Identificazione modello
    model_name: str
    model_version: str
    model_type: str
    creation_date: str
    last_updated: str

    # Descrizione
    intended_use: str
    out_of_scope_uses: str
    primary_intended_users: str

    # Dati di training
    training_data_description: str
    training_data_size: int
    feature_names: list
    target_variable: str
    sensitive_features: list

    # Performance complessiva
    overall_metrics: ModelCardMetrics = field(default_factory=ModelCardMetrics)

    # Performance per sottogruppi (fairness)
    subgroup_metrics: list = field(default_factory=list)

    # Limitazioni note
    limitations: list = field(default_factory=list)

    # Avvertenze etiche
    ethical_considerations: str = ""

    # Compliance
    risk_category: str = ""   # "high-risk", "limited-risk", "minimal-risk"
    regulatory_scope: list = field(default_factory=list)

    # Approvazioni e contatti
    model_owner: str = ""
    approved_by: str = ""
    approval_date: str = ""
    contact: str = ""

    def to_json(self) -> str:
        return json.dumps(asdict(self), indent=2, ensure_ascii=False)

    def to_markdown(self) -> str:
        """Genera Model Card in formato Markdown per documentazione."""
        md = f"""# Model Card: {self.model_name} v{self.model_version}

**Tipo:** {self.model_type}
**Data creazione:** {self.creation_date}
**Ultimo aggiornamento:** {self.last_updated}
**Owner:** {self.model_owner}
**Approvato da:** {self.approved_by} ({self.approval_date})
**Categoria di rischio AI Act:** {self.risk_category}

## Uso Previsto
{self.intended_use}

## Uso NON Previsto
{self.out_of_scope_uses}

## Utenti Primari
{self.primary_intended_users}

## Dati di Training
- Descrizione: {self.training_data_description}
- Dimensione: {self.training_data_size:,} campioni
- Features: {', '.join(self.feature_names)}
- Target: {self.target_variable}
- Features sensibili (per fairness): {', '.join(self.sensitive_features)}

## Performance Complessiva
| Metrica | Valore |
|---------|--------|
| Accuracy | {self.overall_metrics.accuracy:.4f} |
| Precision | {self.overall_metrics.precision:.4f} |
| Recall | {self.overall_metrics.recall:.4f} |
| F1 Score | {self.overall_metrics.f1:.4f} |
| AUC-ROC | {self.overall_metrics.auc_roc:.4f} |
| Campioni valutazione | {self.overall_metrics.sample_size:,} |

## Performance per Sottogruppi (Fairness Analysis)
"""
        for sg in self.subgroup_metrics:
            md += f"""
### {sg['group_name']} = {sg['group_value']} (n={sg['sample_size']})
- Accuracy: {sg['accuracy']:.4f}
- Precision: {sg['precision']:.4f}
- Recall: {sg['recall']:.4f}
- False Positive Rate: {sg['false_positive_rate']:.4f}
"""

        md += f"""
## Limitazioni Note
"""
        for lim in self.limitations:
            md += f"- {lim}\n"

        md += f"""
## Considerazioni Etiche
{self.ethical_considerations}

## Contatto
{self.contact}
"""
        return md


def generate_model_card(
    model_name: str,
    model_version: str,
    model,
    X_test: pd.DataFrame,
    y_test: pd.Series,
    sensitive_cols: list,
    intended_use: str,
    config: dict
) -> ModelCard:
    """
    Genera una Model Card completa a partire dal modello e dai dati di test.

    Args:
        model: Modello scikit-learn addestrato
        X_test: Feature set di test
        y_test: Label di test
        sensitive_cols: Colonne sensibili per analisi fairness
        intended_use: Descrizione dell'uso previsto
        config: Configurazione aggiuntiva (owner, contact, etc.)
    """
    y_pred = model.predict(X_test)
    y_proba = model.predict_proba(X_test)[:, 1] if hasattr(model, 'predict_proba') else None

    # Metriche globali
    overall = ModelCardMetrics(
        accuracy=accuracy_score(y_test, y_pred),
        precision=precision_score(y_test, y_pred, zero_division=0),
        recall=recall_score(y_test, y_pred, zero_division=0),
        f1=f1_score(y_test, y_pred, zero_division=0),
        auc_roc=roc_auc_score(y_test, y_proba) if y_proba is not None else None,
        sample_size=len(y_test),
        evaluation_date=datetime.datetime.utcnow().isoformat()
    )

    # Metriche per sottogruppi (RICHIESTO EU AI Act per High-Risk)
    subgroup_list = []
    for col in sensitive_cols:
        if col not in X_test.columns:
            continue
        for val in X_test[col].unique():
            mask = X_test[col] == val
            if mask.sum() < 30:  # Skip gruppi troppo piccoli
                continue

            y_sub_true = y_test[mask]
            y_sub_pred = y_pred[mask]
            cm = confusion_matrix(y_sub_true, y_sub_pred, labels=[0, 1])

            tn, fp, fn, tp = cm.ravel() if cm.size == 4 else (0, 0, 0, cm[0][0])
            fpr = fp / (fp + tn) if (fp + tn) > 0 else 0.0

            subgroup_list.append({
                "group_name": col,
                "group_value": str(val),
                "accuracy": accuracy_score(y_sub_true, y_sub_pred),
                "precision": precision_score(y_sub_true, y_sub_pred, zero_division=0),
                "recall": recall_score(y_sub_true, y_sub_pred, zero_division=0),
                "false_positive_rate": fpr,
                "sample_size": int(mask.sum())
            })

    card = ModelCard(
        model_name=model_name,
        model_version=model_version,
        model_type=type(model).__name__,
        creation_date=config.get("creation_date", datetime.date.today().isoformat()),
        last_updated=datetime.date.today().isoformat(),
        intended_use=intended_use,
        out_of_scope_uses=config.get("out_of_scope_uses", "Non specificato"),
        primary_intended_users=config.get("primary_users", "Team Data Science"),
        training_data_description=config.get("data_description", ""),
        training_data_size=config.get("training_size", 0),
        feature_names=list(X_test.columns),
        target_variable=config.get("target", "label"),
        sensitive_features=sensitive_cols,
        overall_metrics=overall,
        subgroup_metrics=subgroup_list,
        limitations=config.get("limitations", []),
        ethical_considerations=config.get("ethical_considerations", ""),
        risk_category=config.get("risk_category", "minimal-risk"),
        regulatory_scope=config.get("regulatory_scope", []),
        model_owner=config.get("owner", ""),
        approved_by=config.get("approved_by", ""),
        approval_date=config.get("approval_date", ""),
        contact=config.get("contact", "")
    )

    return card


def log_model_card_to_mlflow(card: ModelCard, run_id: str):
    """Registra la model card come artefatto MLflow per tracciabilita."""
    with mlflow.start_run(run_id=run_id):
        # Log come JSON
        json_path = f"/tmp/model_card_{card.model_name}_v{card.model_version}.json"
        with open(json_path, "w") as f:
            f.write(card.to_json())
        mlflow.log_artifact(json_path, artifact_path="governance")

        # Log come Markdown
        md_path = f"/tmp/model_card_{card.model_name}_v{card.model_version}.md"
        with open(md_path, "w") as f:
            f.write(card.to_markdown())
        mlflow.log_artifact(md_path, artifact_path="governance")

        # Log metriche di fairness come tag MLflow per ricerca rapida
        mlflow.set_tag("governance.risk_category", card.risk_category)
        mlflow.set_tag("governance.model_owner", card.model_owner)
        mlflow.set_tag("governance.approved_by", card.approved_by)
        mlflow.set_tag("governance.has_subgroup_analysis", str(len(card.subgroup_metrics) > 0))

    print(f"Model Card registrata in MLflow run {run_id} sotto artifacts/governance/")

Detectarea corectitudinii și a părtinirii cu Fairlearn

Corectitudinea în ML nu este un singur concept: există mai multe definiții din punct de vedere matematic incompatibile unele cu altele. Legea AI nu prescrie ce măsurători să folosească, dar impune acele sisteme cu risc ridicat sunt evaluate și documentate în comparație cu grupurile protejate. Cele două cele mai multe valori comune și complementare sunt cele Paritatea demografică (egalitatea demografică) e celCote egalizate (egalitatea cotelor condiționată de etichetele adevărate).

La Paritatea demografică impune ca probabilitatea de a obține un rezultat pozitiv este aceeași pentru toate grupurile: P(Y_pred=1 | A=0) = P(Y_pred=1 | A=1). Și cea mai intuitivă metrică dar poate ascunde diferențele de performanță reală dacă grupurile au rate de etichetă diferite. THE'Cote egalizate și mai strict: necesită atât TPR, cât și FPR să fie egal între grupuri, asigurându-se că modelul face erori cu aceeași frecvență indiferent de apartenenţa la un grup sensibil.

# fairness_checker.py
# Analisi completa di fairness con Fairlearn
# pip install fairlearn scikit-learn pandas

import pandas as pd
import numpy as np
from fairlearn.metrics import (
    MetricFrame,
    demographic_parity_difference,
    demographic_parity_ratio,
    equalized_odds_difference,
    equalized_odds_ratio,
    false_positive_rate,
    false_negative_rate,
    selection_rate
)
from fairlearn.reductions import ExponentiatedGradient, DemographicParity, EqualizedOdds
from sklearn.metrics import accuracy_score, f1_score
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
import mlflow


def run_fairness_analysis(
    y_true: pd.Series,
    y_pred: np.ndarray,
    sensitive_feature: pd.Series,
    y_proba: np.ndarray = None,
    threshold: float = 0.1
) -> dict:
    """
    Analisi completa di fairness per un modello.

    Args:
        y_true: Etichette vere
        y_pred: Predizioni del modello
        sensitive_feature: Feature sensibile (es. genere, eta_group)
        y_proba: Probabilità predette (opzionale)
        threshold: Soglia di accettabilita per le differenze di fairness

    Returns:
        dict con metriche di fairness e flag di conformità
    """
    results = {}

    # ---- 1. Demographic Parity ----
    dp_diff = demographic_parity_difference(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )
    dp_ratio = demographic_parity_ratio(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )

    results["demographic_parity_difference"] = float(dp_diff)
    results["demographic_parity_ratio"] = float(dp_ratio)
    results["demographic_parity_pass"] = abs(dp_diff) <= threshold

    # ---- 2. Equalized Odds ----
    eo_diff = equalized_odds_difference(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )
    eo_ratio = equalized_odds_ratio(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )

    results["equalized_odds_difference"] = float(eo_diff)
    results["equalized_odds_ratio"] = float(eo_ratio)
    results["equalized_odds_pass"] = abs(eo_diff) <= threshold

    # ---- 3. MetricFrame: metriche disaggregate per gruppo ----
    metrics_dict = {
        "accuracy": accuracy_score,
        "f1": lambda y_t, y_p: f1_score(y_t, y_p, zero_division=0),
        "false_positive_rate": false_positive_rate,
        "false_negative_rate": false_negative_rate,
        "selection_rate": selection_rate,
    }

    metric_frame = MetricFrame(
        metrics=metrics_dict,
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )

    results["by_group"] = metric_frame.by_group.to_dict()
    results["overall"] = metric_frame.overall.to_dict()
    results["difference"] = metric_frame.difference().to_dict()
    results["ratio"] = metric_frame.ratio().to_dict()

    # ---- 4. Flag conformità complessiva ----
    results["is_fair"] = (
        results["demographic_parity_pass"] and
        results["equalized_odds_pass"]
    )

    # Messaggi esplicativi
    messages = []
    if not results["demographic_parity_pass"]:
        messages.append(
            f"ATTENZIONE: Demographic Parity Difference = {dp_diff:.4f} "
            f"(soglia: {threshold}). Il gruppo svantaggiato riceve outcome positivi "
            f"meno frequentemente del {abs(dp_diff)*100:.1f}%."
        )
    if not results["equalized_odds_pass"]:
        messages.append(
            f"ATTENZIONE: Equalized Odds Difference = {eo_diff:.4f} "
            f"(soglia: {threshold}). I tassi di errore variano significativamente tra gruppi."
        )
    if results["is_fair"]:
        messages.append("OK: Tutte le metriche di fairness rientrano nella soglia accettabile.")

    results["messages"] = messages

    return results


def mitigate_bias_with_reductions(
    estimator,
    X_train: pd.DataFrame,
    y_train: pd.Series,
    sensitive_train: pd.Series,
    constraint: str = "demographic_parity"
) -> object:
    """
    Mitigazione del bias tramite Exponentiated Gradient (Fairlearn).
    Restituisce un modello fairness-aware.

    Args:
        constraint: "demographic_parity" o "equalized_odds"
    """
    if constraint == "demographic_parity":
        fairness_constraint = DemographicParity(difference_bound=0.05)
    else:
        fairness_constraint = EqualizedOdds(difference_bound=0.05)

    mitigator = ExponentiatedGradient(
        estimator=estimator,
        constraints=fairness_constraint,
        max_iter=50,
        nu=1e-6
    )

    mitigator.fit(
        X_train,
        y_train,
        sensitive_features=sensitive_train
    )

    print(f"Mitigazione completata con constraint: {constraint}")
    print(f"N. classificatori nell'ensemble: {len(mitigator.predictors_)}")

    return mitigator


def log_fairness_to_mlflow(fairness_results: dict, run_id: str):
    """Registra i risultati di fairness in MLflow per audit trail."""
    with mlflow.start_run(run_id=run_id):
        mlflow.log_metrics({
            "fairness.demographic_parity_diff": fairness_results["demographic_parity_difference"],
            "fairness.demographic_parity_ratio": fairness_results["demographic_parity_ratio"],
            "fairness.equalized_odds_diff": fairness_results["equalized_odds_difference"],
            "fairness.equalized_odds_ratio": fairness_results["equalized_odds_ratio"],
        })

        mlflow.set_tag("fairness.is_fair", str(fairness_results["is_fair"]))

        # Log report completo come artefatto
        import json
        report_path = "/tmp/fairness_report.json"
        with open(report_path, "w") as f:
            # Serializza numpy floats
            serializable = {
                k: v for k, v in fairness_results.items()
                if isinstance(v, (dict, list, bool, str, float, int))
            }
            json.dump(serializable, f, indent=2, default=float)
        mlflow.log_artifact(report_path, artifact_path="governance/fairness")

    print("Fairness report loggato in MLflow.")

Paritate demografică vs cote egalizate: pe care să folosiți?

Paritate demografică: ideal atunci când nu se așteaptă nicio diferență în distribuții între grupuri (de exemplu, aprobarea creditului: nu trebuie să existe nicio diferență de tarife între bărbați și femei indiferent de solvabilitatea reală). Poate penaliza precizia generală.
Cote egalizate: ideal atunci când etichetele reale pot diferi între grupuri (de ex. screening medical: rate diferite de îmbolnăvire în funcție de vârstă). Garantează că false pozitive și false negativele sunt distribuite în mod egal.
Avertisment (teorema imposibilității): paritatea demografică și șansele egalizate nu pot fi satisfăcute simultan, cu excepția cazului în care ratele de bază sunt identice între grupuri. Alegeți valoarea adecvată contextului dvs. și documentați-o în cardul model.

Explicabilitate cu SHAP: transparență locală și globală

Explicabilitatea nu este doar o cerință de reglementare: este o cerință practică pentru modelele de depanare, câștigă încrederea părților interesate și detectează părtiniri latente. SHAP (Aditiv SHApley explicații) a devenit standardul de facto pentru explicabilitate în ML, deoarece oferă proprietăți matematică solidă: consistență, acuratețe locală și suport pentru modele bazate pe arbore (cu varianta TreeSHAP, O(TLD^2) în loc de O(TL2^M) a versiunii generice).

SHAP calculează contribuția marginală a fiecărei caracteristici la predicție, pe baza teoriei jocurilor cooperativ (valorile Shapley). Rezultatul este o valoare SHAP pentru fiecare caracteristică a fiecărei probe: valorile pozitive măresc predicția, valorile negative o scad. Suma valorilor SHAP a tuturor caracteristicilor și egală cu diferența dintre predicția modelului și predicția medie (valoarea de bază).

# explainability_shap.py
# Explainability completa con SHAP per modelli ML in produzione
# pip install shap matplotlib pandas scikit-learn

import shap
import numpy as np
import pandas as pd
import matplotlib
matplotlib.use('Agg')  # Backend non-interattivo per ambienti server
import matplotlib.pyplot as plt
import mlflow
import json
from pathlib import Path


class MLExplainer:
    """
    Classe per gestire l'explainability SHAP in produzione.
    Supporta TreeSHAP (XGBoost, LightGBM, RandomForest) e KernelSHAP (any model).
    """

    def __init__(self, model, model_type: str = "tree", background_data=None):
        """
        Args:
            model: Modello addestrato
            model_type: "tree" per modelli tree-based, "linear" per lineari, "kernel" per altri
            background_data: Dati di background per KernelSHAP (sample del training set)
        """
        self.model = model
        self.model_type = model_type

        if model_type == "tree":
            # TreeSHAP: molto più veloce, non richiede background data
            self.explainer = shap.TreeExplainer(model)
        elif model_type == "linear":
            self.explainer = shap.LinearExplainer(model, background_data)
        else:
            # KernelSHAP: universale ma lento, usa un sample piccolo come background
            if background_data is None:
                raise ValueError("KernelSHAP richiede background_data (sample del training set)")
            bg_summary = shap.kmeans(background_data, 50)  # Riduce a 50 cluster
            self.explainer = shap.KernelExplainer(model.predict_proba, bg_summary)

        self.shap_values = None
        self.feature_names = None

    def compute_shap_values(self, X: pd.DataFrame) -> np.ndarray:
        """Calcola i valori SHAP per un dataset."""
        self.feature_names = list(X.columns)
        shap_output = self.explainer(X)

        # Per classificazione binaria, prendi la classe positiva
        if hasattr(shap_output, 'values'):
            values = shap_output.values
            if len(values.shape) == 3:  # [samples, features, classes]
                self.shap_values = values[:, :, 1]  # Classe positiva
            else:
                self.shap_values = values
        else:
            self.shap_values = shap_output

        return self.shap_values

    def global_importance(self, top_n: int = 15) -> pd.DataFrame:
        """
        Feature importance globale: media dei valori SHAP assoluti.
        Questa e la visione che interessa ai regolatori (AI Act, XAI requirement).
        """
        if self.shap_values is None:
            raise RuntimeError("Esegui compute_shap_values() prima.")

        mean_abs_shap = np.abs(self.shap_values).mean(axis=0)
        importance_df = pd.DataFrame({
            "feature": self.feature_names,
            "mean_abs_shap": mean_abs_shap
        }).sort_values("mean_abs_shap", ascending=False)

        return importance_df.head(top_n)

    def explain_single_prediction(
        self, sample: pd.Series, threshold: float = 0.5
    ) -> dict:
        """
        Spiegazione locale per una singola predizione.
        Utile per audit di decisioni individuali (obbligatorio AI Act per High-Risk).
        """
        sample_df = pd.DataFrame([sample])
        single_shap = self.explainer(sample_df)

        if hasattr(single_shap, 'values'):
            values = single_shap.values[0]
            if len(values.shape) == 2:  # [features, classes]
                values = values[:, 1]
            base_value = float(single_shap.base_values[0]) if len(single_shap.base_values.shape) > 1 \
                else float(single_shap.base_values[0])
        else:
            values = single_shap[0]
            base_value = float(self.explainer.expected_value)

        # Predizione del modello
        pred_proba = self.model.predict_proba(sample_df)[0, 1]
        pred_class = int(pred_proba >= threshold)

        # Feature contributions ordinate per importanza
        contributions = sorted(
            zip(self.feature_names, values, sample.values),
            key=lambda x: abs(x[1]),
            reverse=True
        )

        return {
            "prediction_probability": float(pred_proba),
            "prediction_class": pred_class,
            "base_value": base_value,
            "top_contributing_features": [
                {
                    "feature": feat,
                    "shap_value": float(shap_val),
                    "feature_value": float(feat_val) if isinstance(feat_val, (int, float, np.number)) else str(feat_val),
                    "direction": "positive" if shap_val > 0 else "negative"
                }
                for feat, shap_val, feat_val in contributions[:10]
            ]
        }

    def save_summary_plot(self, X: pd.DataFrame, output_path: str):
        """Salva summary plot SHAP per documentazione/governance."""
        if self.shap_values is None:
            self.compute_shap_values(X)

        plt.figure(figsize=(10, 8))
        shap.summary_plot(
            self.shap_values,
            X,
            plot_type="bar",
            show=False,
            max_display=15
        )
        plt.tight_layout()
        plt.savefig(output_path, dpi=150, bbox_inches='tight')
        plt.close()
        print(f"Summary plot salvato in: {output_path}")

    def log_to_mlflow(self, X_sample: pd.DataFrame, run_id: str):
        """Registra explainability artifacts in MLflow per audit trail."""
        if self.shap_values is None:
            self.compute_shap_values(X_sample)

        with mlflow.start_run(run_id=run_id):
            # Global importance come JSON
            importance = self.global_importance()
            importance_path = "/tmp/shap_importance.json"
            importance.to_json(importance_path, orient="records", indent=2)
            mlflow.log_artifact(importance_path, artifact_path="governance/explainability")

            # Summary plot
            plot_path = "/tmp/shap_summary_plot.png"
            self.save_summary_plot(X_sample, plot_path)
            mlflow.log_artifact(plot_path, artifact_path="governance/explainability")

            # Top feature come metric (per dashboard governance)
            for i, row in importance.head(5).iterrows():
                feat_name = row["feature"].replace(" ", "_").replace("-", "_")
                mlflow.log_metric(
                    f"shap.top_feature_importance.{feat_name}",
                    float(row["mean_abs_shap"])
                )

        print(f"Explainability artifacts registrati in MLflow run {run_id}")

Pista de audit: jurnale neschimbabile pentru conformitate

Legea AI cere sistemelor cu risc ridicat să înregistreze automat evenimentele relevante în timpul funcționării lor, cu jurnalele suficient de detaliate pentru a permite autorităților verifica conformitatea. Aceste jurnale trebuie să fie neschimbabil, marcat de timp și trasabil. Un sistem robust de urmărire de audit include trei niveluri: Jurnalul de predicții jurnalele individuale, jurnalul de tranziție a etapei modelului și jurnalul de evenimente de guvernare.

# audit_logger.py
# Sistema di audit trail conforme AI Act per modelli in produzione
# Usa struttura di log immodificabile con hash SHA-256 per integrità

import hashlib
import json
import logging
import datetime
import uuid
from typing import Optional
import structlog  # pip install structlog
import mlflow


# Configurazione structlog per log strutturati in JSON
structlog.configure(
    processors=[
        structlog.processors.TimeStamper(fmt="iso"),
        structlog.processors.add_log_level,
        structlog.processors.JSONRenderer()
    ]
)

audit_log = structlog.get_logger("audit")


class MLAuditLogger:
    """
    Sistema di audit trail per modelli ML in produzione.
    Ogni log entry include un hash SHA-256 del contenuto per rilevare manomissioni.
    """

    def __init__(self, model_name: str, model_version: str, log_file: str = None):
        self.model_name = model_name
        self.model_version = model_version
        self.log_file = log_file or f"audit_{model_name}_v{model_version}.jsonl"

        # Logger Python standard per file locale (append-only)
        self.file_logger = logging.getLogger(f"audit.{model_name}")
        if not self.file_logger.handlers:
            handler = logging.FileHandler(self.log_file, mode='a')
            handler.setFormatter(logging.Formatter('%(message)s'))
            self.file_logger.addHandler(handler)
            self.file_logger.setLevel(logging.INFO)

    def _compute_hash(self, entry: dict) -> str:
        """Calcola hash SHA-256 dell'entry per integrità."""
        content = json.dumps(entry, sort_keys=True, ensure_ascii=False)
        return hashlib.sha256(content.encode()).hexdigest()

    def log_prediction(
        self,
        request_id: str,
        input_features: dict,
        prediction: float,
        prediction_class: int,
        shap_explanation: Optional[dict] = None,
        user_id: Optional[str] = None,
        session_id: Optional[str] = None
    ):
        """
        Log di una singola predizione.
        Per AI Act High-Risk: OGNI decisione deve essere registrata.
        """
        entry = {
            "event_type": "PREDICTION",
            "event_id": str(uuid.uuid4()),
            "timestamp": datetime.datetime.utcnow().isoformat() + "Z",
            "model_name": self.model_name,
            "model_version": self.model_version,
            "request_id": request_id,
            "user_id": user_id or "anonymous",
            "session_id": session_id,
            "input": input_features,
            "output": {
                "prediction_probability": float(prediction),
                "prediction_class": int(prediction_class),
                "decision": "POSITIVE" if prediction_class == 1 else "NEGATIVE"
            },
            "explanation": shap_explanation,  # Top SHAP features per spiegazione
        }

        entry["content_hash"] = self._compute_hash(
            {k: v for k, v in entry.items() if k != "content_hash"}
        )

        self.file_logger.info(json.dumps(entry, ensure_ascii=False))
        audit_log.info("prediction_logged", request_id=request_id, decision=entry["output"]["decision"])

        return entry["event_id"]

    def log_model_stage_transition(
        self,
        from_stage: str,
        to_stage: str,
        approved_by: str,
        justification: str,
        metrics: Optional[dict] = None
    ):
        """
        Log di una transizione di stage del modello (Staging -> Production).
        Crea un audit trail delle approvazioni richiesto dal processo di governance.
        """
        entry = {
            "event_type": "STAGE_TRANSITION",
            "event_id": str(uuid.uuid4()),
            "timestamp": datetime.datetime.utcnow().isoformat() + "Z",
            "model_name": self.model_name,
            "model_version": self.model_version,
            "from_stage": from_stage,
            "to_stage": to_stage,
            "approved_by": approved_by,
            "justification": justification,
            "performance_metrics": metrics or {},
        }

        entry["content_hash"] = self._compute_hash(
            {k: v for k, v in entry.items() if k != "content_hash"}
        )

        self.file_logger.info(json.dumps(entry, ensure_ascii=False))
        audit_log.info(
            "stage_transition",
            model=self.model_name,
            from_stage=from_stage,
            to_stage=to_stage,
            approved_by=approved_by
        )

        # Registra anche in MLflow Model Registry per tracciabilita centralizzata
        client = mlflow.tracking.MlflowClient()
        try:
            client.set_registered_model_alias(
                name=self.model_name,
                alias=to_stage.lower(),
                version=self.model_version
            )
            client.set_model_version_tag(
                name=self.model_name,
                version=self.model_version,
                key="governance.approved_by",
                value=approved_by
            )
            client.set_model_version_tag(
                name=self.model_name,
                version=self.model_version,
                key="governance.approval_date",
                value=datetime.date.today().isoformat()
            )
        except Exception as e:
            audit_log.warning("mlflow_tag_failed", error=str(e))

    def log_governance_event(
        self,
        event_subtype: str,
        details: dict,
        actor: str
    ):
        """
        Log generico per eventi di governance: fairness check, model card update,
        bias detection alert, human override, etc.
        """
        entry = {
            "event_type": "GOVERNANCE",
            "event_subtype": event_subtype,
            "event_id": str(uuid.uuid4()),
            "timestamp": datetime.datetime.utcnow().isoformat() + "Z",
            "model_name": self.model_name,
            "model_version": self.model_version,
            "actor": actor,
            "details": details,
        }

        entry["content_hash"] = self._compute_hash(
            {k: v for k, v in entry.items() if k != "content_hash"}
        )

        self.file_logger.info(json.dumps(entry, ensure_ascii=False))
        audit_log.info("governance_event", subtype=event_subtype, actor=actor)

    def verify_log_integrity(self) -> dict:
        """
        Verifica l'integrita del file di log ricalcolando gli hash.
        Rileva eventuali manomissioni dei log.
        """
        results = {"total": 0, "valid": 0, "tampered": [], "errors": []}

        try:
            with open(self.log_file, 'r') as f:
                for line_num, line in enumerate(f, 1):
                    line = line.strip()
                    if not line:
                        continue
                    results["total"] += 1
                    try:
                        entry = json.loads(line)
                        stored_hash = entry.pop("content_hash", None)
                        recomputed = self._compute_hash(entry)
                        if stored_hash == recomputed:
                            results["valid"] += 1
                        else:
                            results["tampered"].append({
                                "line": line_num,
                                "event_id": entry.get("event_id"),
                                "timestamp": entry.get("timestamp")
                            })
                    except json.JSONDecodeError as e:
                        results["errors"].append({"line": line_num, "error": str(e)})
        except FileNotFoundError:
            results["errors"].append({"error": f"Log file non trovato: {self.log_file}"})

        integrity_ok = len(results["tampered"]) == 0 and len(results["errors"]) == 0
        results["integrity_ok"] = integrity_ok

        if not integrity_ok:
            audit_log.error(
                "log_integrity_violated",
                tampered_count=len(results["tampered"]),
                error_count=len(results["errors"])
            )

        return results

Jurnal de audit: Reținere și protecție

Legea AI nu specifică o perioadă exactă de păstrare pentru jurnalele din sistemele cu risc ridicat, dar liniile directoare indică faptul că acestea trebuie menținute cel puțin pe întreaga durată de funcționare a sistemului, de obicei 3-10 ani. Stocați jurnalele în spațiu de stocare imuabil (de exemplu, S3 cu Blocare obiect, GCS cu politică de păstrare sau o bază de date numai pentru adăugare). Nu utilizați niciodată o bază de date relațional standard ca un singur magazin pentru pista de audit: rândurile pot fi șterse sau modificat. Structura hashed SHA-256 din codul de mai sus permite detectarea falsificării a posteriori, dar nu împiedică ștergerea fizică a fișierelor.

Model de guvernare a registrului cu MLflow

Il Registrul modelului MLflow iar componenta centrală a guvernării: centralizarea toate modelele aflate în producție cu ciclul lor de viață, de la versiuni experimentale până la modele în producție, cu istoric complet al tranzițiilor, comentarii și etichete de guvernare. Cu MLflow 3.0, introdus în 2025, registrul acceptă nativ aliasuri de model (producție, montare, campion, challenger) pentru a înlocui etapele depreciate și se integrează cu Databricks's Unity Catalog pentru guvernanță în spațiul de lucru încrucișat.

# model_registry_governance.py
# Workflow di governance per MLflow Model Registry
# Include: registrazione, review, promozione con approvazione, deprecazione

import mlflow
from mlflow.tracking import MlflowClient
from mlflow.exceptions import MlflowException
import datetime
from typing import Optional
from dataclasses import dataclass

MLFLOW_TRACKING_URI = "http://localhost:5000"
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
client = MlflowClient()


@dataclass
class GovernanceConfig:
    """Configurazione di governance per un modello."""
    model_name: str
    required_min_accuracy: float = 0.80
    required_fairness_threshold: float = 0.10
    required_approvers: list = None
    risk_category: str = "minimal-risk"

    def __post_init__(self):
        if self.required_approvers is None:
            self.required_approvers = ["ml-lead", "compliance-officer"]


def register_model_with_governance(
    run_id: str,
    model_path: str,
    config: GovernanceConfig,
    model_card_path: str,
    fairness_report_path: str,
) -> str:
    """
    Registra un modello nel Model Registry con tutti i tag di governance.

    Returns:
        version: Versione registrata del modello
    """
    # Registra il modello
    model_uri = f"runs:/{run_id}/{model_path}"
    result = mlflow.register_model(
        model_uri=model_uri,
        name=config.model_name
    )
    version = result.version

    # Tag obbligatori per governance
    governance_tags = {
        "governance.risk_category": config.risk_category,
        "governance.registration_date": datetime.date.today().isoformat(),
        "governance.registration_author": "automated-pipeline",
        "governance.status": "PENDING_REVIEW",
        "governance.model_card_logged": "true",
        "governance.fairness_checked": "true",
        "governance.explainability_logged": "true",
        "governance.required_approvers": ",".join(config.required_approvers),
        "source.run_id": run_id,
    }

    for key, value in governance_tags.items():
        client.set_model_version_tag(
            name=config.model_name,
            version=version,
            key=key,
            value=value
        )

    # Alias iniziale: "candidate" (in attesa di review)
    client.set_registered_model_alias(
        name=config.model_name,
        alias="candidate",
        version=version
    )

    print(f"Modello registrato: {config.model_name} v{version} - Status: PENDING_REVIEW")
    return version


def approve_for_staging(
    model_name: str,
    version: str,
    approver: str,
    justification: str,
    performance_metrics: dict,
    config: GovernanceConfig
) -> bool:
    """
    Promuove un modello in Staging dopo review dei gate di qualità.
    Verifica automaticamente accuracy e fairness prima dell'approvazione.
    """
    # ---- Gate 1: Accuracy minima ----
    accuracy = performance_metrics.get("accuracy", 0)
    if accuracy < config.required_min_accuracy:
        print(f"GATE FALLITO: accuracy {accuracy:.4f} < soglia {config.required_min_accuracy}")
        client.set_model_version_tag(
            name=model_name, version=version,
            key="governance.rejection_reason",
            value=f"Accuracy insufficiente: {accuracy:.4f}"
        )
        return False

    # ---- Gate 2: Fairness ----
    dp_diff = performance_metrics.get("demographic_parity_difference", 999)
    if abs(dp_diff) > config.required_fairness_threshold:
        print(f"GATE FALLITO: Fairness violation - DP diff {dp_diff:.4f}")
        client.set_model_version_tag(
            name=model_name, version=version,
            key="governance.rejection_reason",
            value=f"Fairness violation: DP diff {dp_diff:.4f}"
        )
        return False

    # ---- Gate 3: Approvazione umana ----
    # In produzione, questo step richiede un sistema di ticketing/approval workflow
    # Per ora, verifica che l'approver sia autorizzato
    if approver not in config.required_approvers:
        print(f"GATE FALLITO: Approver non autorizzato: {approver}")
        return False

    # Tutti i gate superati: promuovi a Staging
    approval_tags = {
        "governance.status": "STAGING",
        "governance.approved_by": approver,
        "governance.approval_date": datetime.datetime.utcnow().isoformat(),
        "governance.justification": justification,
        f"governance.metrics.accuracy": str(accuracy),
        f"governance.metrics.dp_diff": str(dp_diff),
    }

    for key, value in approval_tags.items():
        client.set_model_version_tag(
            name=model_name, version=version,
            key=key, value=value
        )

    # Aggiorna alias
    client.set_registered_model_alias(
        name=model_name,
        alias="staging",
        version=version
    )

    print(f"Modello {model_name} v{version} promosso in STAGING da {approver}")
    return True


def promote_to_production(
    model_name: str,
    version: str,
    approver: str,
    champion_strategy: str = "blue-green"
) -> bool:
    """
    Promuove il modello in Production.
    Implementa champion/challenger: mantiene la versione precedente come challenger.
    """
    # Trova versione production corrente (champion)
    try:
        current_champion = client.get_model_version_by_alias(model_name, "production")
        old_champion_version = current_champion.version

        # Marca il vecchio champion come challenger
        client.set_registered_model_alias(
            name=model_name,
            alias="challenger",
            version=old_champion_version
        )
        client.set_model_version_tag(
            name=model_name, version=old_champion_version,
            key="governance.status", value="CHALLENGER"
        )
    except MlflowException:
        # Nessun champion precedente (primo deploy)
        old_champion_version = None

    # Promuovi nuova versione a champion
    production_tags = {
        "governance.status": "PRODUCTION",
        "governance.production_date": datetime.datetime.utcnow().isoformat(),
        "governance.production_approver": approver,
        "governance.deployment_strategy": champion_strategy,
        "governance.previous_version": str(old_champion_version) if old_champion_version else "none",
    }

    for key, value in production_tags.items():
        client.set_model_version_tag(
            name=model_name, version=version,
            key=key, value=value
        )

    client.set_registered_model_alias(
        name=model_name,
        alias="production",
        version=version
    )

    print(f"Modello {model_name} v{version} promosso in PRODUCTION (champion)")
    if old_champion_version:
        print(f"Versione precedente v{old_champion_version} mantenuta come CHALLENGER")

    return True


def get_governance_report(model_name: str) -> dict:
    """
    Genera un report di governance completo per un modello registrato.
    Utile per audit esterni e report di compliance.
    """
    registered_model = client.get_registered_model(model_name)
    versions = client.search_model_versions(f"name='{model_name}'")

    report = {
        "model_name": model_name,
        "report_date": datetime.date.today().isoformat(),
        "total_versions": len(versions),
        "versions_detail": []
    }

    for v in versions:
        tags = v.tags
        report["versions_detail"].append({
            "version": v.version,
            "status": tags.get("governance.status", "UNKNOWN"),
            "risk_category": tags.get("governance.risk_category", "UNKNOWN"),
            "registration_date": tags.get("governance.registration_date", ""),
            "approved_by": tags.get("governance.approved_by", ""),
            "approval_date": tags.get("governance.approval_date", ""),
            "fairness_checked": tags.get("governance.fairness_checked", "false"),
            "model_card_logged": tags.get("governance.model_card_logged", "false"),
        })

    return report

Cadru AI responsabil: Lista de verificare pentru proiectele ML

Un cadru operațional de IA responsabilă nu trebuie să fie un document teoretic: trebuie să fie a listă de verificare concretă integrată în procesul de dezvoltare. Următorul cadru se bazează pe principii din Legea AI, orientările NIST AI RMF (cadru de management al riscului) și cele mai bune practici companii ale celor mai avansate echipe ML. Și conceput pentru a fi executabil cu instrumente open-source la cost zero.

# responsible_ai_framework.py
# Framework operativo per Responsible AI
# Integra tutti i componenti precedenti in una pipeline CI/CD-ready

import mlflow
import pandas as pd
import numpy as np
from typing import Optional
from pathlib import Path
import json
import datetime

# Import dei moduli sviluppati in questo articolo
# from model_card_generator import generate_model_card, log_model_card_to_mlflow
# from fairness_checker import run_fairness_analysis, log_fairness_to_mlflow
# from explainability_shap import MLExplainer
# from audit_logger import MLAuditLogger
# from model_registry_governance import GovernanceConfig, register_model_with_governance


class ResponsibleAIPipeline:
    """
    Pipeline completa di Responsible AI per training e deployment di modelli ML.
    Integra: model card, fairness check, explainability, audit trail, governance.
    """

    def __init__(
        self,
        model_name: str,
        model_version: str,
        risk_category: str,
        sensitive_features: list,
        output_dir: str = "./governance_output"
    ):
        self.model_name = model_name
        self.model_version = model_version
        self.risk_category = risk_category
        self.sensitive_features = sensitive_features
        self.output_dir = Path(output_dir)
        self.output_dir.mkdir(parents=True, exist_ok=True)

        self.audit_logger = MLAuditLogger(
            model_name=model_name,
            model_version=model_version,
            log_file=str(self.output_dir / f"audit_{model_name}.jsonl")
        )

        self.governance_report = {
            "model_name": model_name,
            "version": model_version,
            "risk_category": risk_category,
            "evaluation_date": datetime.date.today().isoformat(),
            "checks": {}
        }

    def run_full_governance_check(
        self,
        model,
        X_test: pd.DataFrame,
        y_test: pd.Series,
        run_id: str,
        config: dict
    ) -> dict:
        """
        Esegue tutti i controlli di governance in sequenza.
        Restituisce report completo con esito di ogni check.
        """
        print(f"\n=== RESPONSIBLE AI GOVERNANCE CHECK ===")
        print(f"Modello: {self.model_name} v{self.model_version}")
        print(f"Risk Category: {self.risk_category}\n")

        # ---- 1. Model Card ----
        print("[1/5] Generazione Model Card...")
        try:
            card = generate_model_card(
                model_name=self.model_name,
                model_version=self.model_version,
                model=model,
                X_test=X_test,
                y_test=y_test,
                sensitive_cols=self.sensitive_features,
                intended_use=config.get("intended_use", ""),
                config=config
            )
            log_model_card_to_mlflow(card, run_id)
            self.governance_report["checks"]["model_card"] = "PASS"
            print("  OK: Model Card generata e loggata")
        except Exception as e:
            self.governance_report["checks"]["model_card"] = f"FAIL: {str(e)}"
            print(f"  FAIL: {e}")

        # ---- 2. Fairness Analysis ----
        print("[2/5] Fairness Analysis...")
        fairness_results_all = {}
        fairness_pass = True

        y_pred = model.predict(X_test)
        for feat in self.sensitive_features:
            if feat not in X_test.columns:
                continue
            try:
                results = run_fairness_analysis(
                    y_true=y_test,
                    y_pred=y_pred,
                    sensitive_feature=X_test[feat],
                    threshold=config.get("fairness_threshold", 0.10)
                )
                fairness_results_all[feat] = results
                log_fairness_to_mlflow(results, run_id)

                if not results["is_fair"]:
                    fairness_pass = False
                    for msg in results["messages"]:
                        print(f"  {msg}")
                else:
                    print(f"  OK: Fairness per '{feat}' nei limiti accettabili")
            except Exception as e:
                print(f"  WARNING: Fairness check per '{feat}' fallito: {e}")

        self.governance_report["checks"]["fairness"] = "PASS" if fairness_pass else "FAIL"

        # ---- 3. Explainability ----
        print("[3/5] Explainability (SHAP)...")
        try:
            explainer = MLExplainer(
                model=model,
                model_type=config.get("model_type", "tree")
            )
            # Usa un sample per efficienza
            sample_size = min(500, len(X_test))
            X_sample = X_test.sample(n=sample_size, random_state=42)
            explainer.compute_shap_values(X_sample)
            explainer.log_to_mlflow(X_sample, run_id)

            top_features = explainer.global_importance(top_n=5)
            print(f"  OK: Top 5 features: {', '.join(top_features['feature'].tolist())}")
            self.governance_report["checks"]["explainability"] = "PASS"
        except Exception as e:
            self.governance_report["checks"]["explainability"] = f"FAIL: {str(e)}"
            print(f"  FAIL: {e}")

        # ---- 4. Risk Assessment ----
        print("[4/5] Risk Assessment...")
        risk_assessment = self._run_risk_assessment(config)
        self.governance_report["risk_assessment"] = risk_assessment

        if risk_assessment["risk_score"] > 0.7:
            print(f"  ATTENZIONE: Risk score alto ({risk_assessment['risk_score']:.2f})")
            self.governance_report["checks"]["risk_assessment"] = "HIGH_RISK"
        else:
            print(f"  OK: Risk score accettabile ({risk_assessment['risk_score']:.2f})")
            self.governance_report["checks"]["risk_assessment"] = "PASS"

        # ---- 5. Audit Log dell'evento di governance ----
        print("[5/5] Audit Trail...")
        self.audit_logger.log_governance_event(
            event_subtype="FULL_GOVERNANCE_CHECK",
            details={
                "checks": self.governance_report["checks"],
                "risk_score": risk_assessment["risk_score"],
                "fairness_pass": fairness_pass,
                "run_id": run_id
            },
            actor="automated-pipeline"
        )
        self.governance_report["checks"]["audit_trail"] = "PASS"
        print("  OK: Audit trail registrato")

        # Report finale
        all_pass = all(
            v == "PASS" for v in self.governance_report["checks"].values()
        )
        self.governance_report["overall_status"] = "APPROVED" if all_pass else "REQUIRES_REVIEW"

        print(f"\n=== RISULTATO: {self.governance_report['overall_status']} ===\n")

        # Salva report
        report_path = self.output_dir / f"governance_report_{self.model_name}_v{self.model_version}.json"
        with open(report_path, "w") as f:
            json.dump(self.governance_report, f, indent=2, ensure_ascii=False)

        return self.governance_report

    def _run_risk_assessment(self, config: dict) -> dict:
        """
        Calcola un risk score composito basato sul contesto del modello.
        Segue la tassonomia EU AI Act.
        """
        score = 0.0
        factors = []

        # Categoria rischio
        if self.risk_category == "high-risk":
            score += 0.4
            factors.append("High-risk AI Act category: +0.4")
        elif self.risk_category == "limited-risk":
            score += 0.2
            factors.append("Limited-risk AI Act category: +0.2")

        # Features sensibili
        if len(self.sensitive_features) > 0:
            score += 0.1 * min(len(self.sensitive_features), 3)
            factors.append(f"{len(self.sensitive_features)} sensitive features: +{0.1 * min(len(self.sensitive_features), 3)}")

        # Uso in decisioni automatiche
        if config.get("automated_decisions", False):
            score += 0.2
            factors.append("Decisioni automatiche senza revisione umana: +0.2")

        # Dati personali
        if config.get("processes_personal_data", False):
            score += 0.1
            factors.append("Elabora dati personali: +0.1")

        return {
            "risk_score": min(score, 1.0),
            "risk_level": "HIGH" if score > 0.6 else ("MEDIUM" if score > 0.3 else "LOW"),
            "factors": factors
        }

Cele mai bune practici și anti-modele de guvernare ML

După ce ați văzut instrumentele tehnice, este esențial să înțelegeți cum să integrați guvernanța în viața de zi cu zi a unei echipe de ML fără a crea cheltuieli generale nesustenabile. Guvernarea eficientă trebuie să fie complet automatizat și integrat în conducta CI/CD, nu un proces manual adăugat ulterior.

Cele mai bune practici de guvernare ML

Guvernare ca cod: integrează toate verificările (model de card, corectitudine, explicabilitate) în conducta CI/CD ca pași automati. Dacă verificarea corectitudinii eșuează, implementarea nu are loc. Zero decizii manuale pentru porțile tehnice, supraveghere umană doar pentru porțile organizaționale.
Centralizați în Registrul modelului: MLflow Model Registry este singura sursă de adevăr. Fiecare versiune trebuie să aibă etichete standardizate: risk_category, approved_by, fairness_checked. Interziceți implementarea din orice versiune fără etichetele necesare.
Documentați deciziile, nu doar rezultatele: log, de asemenea, când decideți să acceptați o părtinire reziduală cu o justificare (de exemplu, „DP dif 0,12 acceptat deoarece depășește pragul doar pentru subgrupa X cu n=45, nesemnificativ statistic").
Campion/Provocator întotdeauna: nu eliminați niciodată versiunea anterioară a șablon din registru atunci când îl promovați pe cel nou. Păstrați-l ca un challenger de rollback imediat în caz de corectitudine sau probleme de performanță în producție.
Revizuire periodică pentru deviația echității: părtinirea unui model se poate schimba în timp dacă distribuţia intrărilor se modifică. Reluați lunar analiza echității pe datele de producție, nu doar la implementarea inițială.
Om-in-the-loop pentru risc ridicat: pentru sistemele AI Act High-Risk, implementați un mecanism de semnalare care trimite decizii cu risc ridicat (de exemplu, probabilitate între 0,45 și 0.55) unui operator uman pentru revizuire manuală înainte de a le comunica utilizatorului final.

Anti-modele de evitat

Verificarea corectitudinii numai în timpul antrenamentului: Corectitudinea în producție se modifică în timp. Un model care este echitabil la formare poate deveni nedrept dacă datele de producție se modifică (deriva de date). Monitorizați în mod continuu corectitudinea cu instrumente Evidently sau personalizate.
Card model static: cardul model scris la prima implementare și deja învechit la a doua actualizare. Automatizați generarea cu fiecare antrenament nou: nu poate fi a Document Word actualizat manual.
SHAP pe întregul set de antrenament: TreeSHAP pe seturi de date de milioane de mostre poate dura ore. Utilizați întotdeauna un eșantion reprezentativ (500-2000 de mostre) pentru vederi globale. Pentru explicații locale în producție, calculați SHAP numai pentru predicții care necesită explicații (Risc ridicat sau aproape de pragul de decizie).
Jurnal de audit în baza de date tranzacțională: o bază de date SQL standard permite UPDATE și DELETE. Pentru jurnalele de audit AI Act, nu utilizați tabele SQL editabile: utilizați fișiere numai pentru atașare pe stocare imuabilă cu hash de integritate.
Aprobari prin e-mail/chat: aprobările de guvernare trebuie urmărite în sistem (etichete MLflow, bilete Jira etc.), nu în fire sau e-mailuri Slack. Într-un audit reglementare, „Marco a scris pe Teams că e în regulă” nu este o documentație suficientă.

Buget pentru IMM-uri: Guvernare ML cu mai puțin de 5.000 EUR/an

Guvernarea ML nu necesită bugete ale întreprinderii. Întregul cadru descris în acest articol și 100% open-source:

MLflow: gratuit, auto-găzduit pe un singur server (2 vCPU, 4 GB RAM sunt suficiente pentru echipe mici). Cost: ~15-20 EUR/lună pe cloud.
Fairlearn + SHAP + scikit-learn: Biblioteci Python cu sursă deschisă, cu costuri zero licențiere.
Jurnalele de audit: Fișier JSONL pe stocarea obiectelor compatibile cu S3 (MinIO auto-găzduit sau nor). 100 GB de jurnal: aproximativ 2-3 EUR/lună.
Prometeu + Grafana pentru monitorizarea valorilor de corectitudine în producție: gratuit, instalabil pe K3s sau Docker Compose.

Total: mai puțin de 300 EUR/an pentru un sistem de guvernanță cuprinzător și conforme conform cerințelor Legii AI, cu carduri automate de model, verificarea corectitudinii, explicabilitatea SHAP și pista de audit neschimbată.

Concluzii

Guvernarea ML în 2026 nu mai este opțională pentru cei care dezvoltă sisteme de inteligență artificială în UE: Actul AI a stabilit cerințe concrete cu sancțiuni severe. Dar privind dincolo de conformare, un cadru de bună guvernanță aduce beneficii concrete: modele mai robuste datorită echității analiză, depanare mai rapidă datorită SHAP (31% mai rapid conform datelor din industrie), mai mare încrederea părților interesate și derularea în siguranță în caz de probleme.

Abordarea descrisă în acest articol, complet open-source și automatizată în CI/CD, permite echipelor de orice dimensiune să implementeze guvernarea ML fără cheltuieli generale nesustenabile. Cheia și automatizarea: carduri model generate de cod, verificări de corectitudine ca porți CI, audituri traseu ca sidecar de serviciu, SHAP calculat la fiecare desfășurare. Guvernarea devine parte din proces de inginerie, nu un document de completat înainte de audit.

În următorul și ultimul articol al seriei, the Studiu de caz Predicția abandonului în producție (ID 315), vom integra toate componentele seriei: urmărire experimentală MLflow, DVC pentru versiuni, Servire FastAPI, implementare Kubernetes, monitorizare cu Prometheus și cadrul de guvernare descrise în acest articol, într-o singură conductă de lucru de la capăt la capăt.

Articole similare din această serie MLOps

MLOps: de la experiment la producție - Fundamente și ciclu de viață complet
Conductă ML cu CI/CD: GitHub Actions + Docker - Integrarea porților de guvernare în CI
Urmărirea experimentelor cu MLflow - Registrul model ca bază pentru guvernare
Detectarea derivei modelului și reinstruire automată - Derivarea corectitudinii și monitorizarea
Scalare ML pe Kubernetes - Implementați cadrul de guvernanță pe K8
Testarea A/B a modelelor ML - Guvernare campion/provocator

Cross-Series

Seria Advanced Deep Learning - Guvernare pentru învățare profundă și modele LLM
Seria de afaceri de date și IA - Guvernarea AI în contextul afacerilor