Bună! Sunt

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

Contactează-mă

Despre Mine

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

Competențele Mele

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

Automatizarea Proceselor

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

Sisteme Personalizate

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

Misiunea Mea

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

Democratizarea Tehnologiei

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

Unirea IT și Economiei

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

Crearea de Soluții Personalizate

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

Transformă-ți Afacerea cu Tehnologia

Che tu gestisca un negozio, uno studio professionale o un'azienda, posso aiutarti a sfruttare le potenzialità dell'informatica per lavorare meglio, più velocemente e in modo più intelligente.

Hai să Vorbim →

Unisciti alla Community

Entra nella community di sviluppatori dove discutiamo di software, AI, architettura e DevOps. Condividi idee, fai domande e cresci insieme a noi.

Canale

FC Dev Blog

Ricevi notifiche su nuovi articoli, serie complete, tips settimanali e tool in evidenza. Contenuti bilingui IT/EN direttamente nel tuo Telegram.

Nuovi articoli appena pubblicati
Tips e code snippets settimanali
Sondaggi sugli argomenti futuri

Iscriviti al Canale

Gruppo

FC Dev Community

Una community bilingue IT/EN per sviluppatori. Discussioni, Q&A, aiuto reciproco e networking con altri professionisti del settore.

Discussioni su articoli e tecnologie
Help coding e code review
Opportunità di lavoro e collaborazione

Unisciti al Gruppo

Topic di Discussione

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

Linguaggi & Tecnologie

Java

Python

JavaScript

Angular

React

TypeScript

SQL

PHP

CSS/SCSS

Node.js

Docker

Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

Contactează-mă

Ai un proiect în minte? Hai să vorbim! Completează formularul și îți voi răspunde curând.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

MLOps: de la experiment la producție

Fiecare cercetător de date a experimentat acest moment: modelul funcționează perfect în notebook-ul Jupyter, metricile sunt excelente, echipa aplaudă în timpul demo-ului. Apoi vine întrebarea fatală: „Când punem asta în producție?”. Și începe tăcerea. Conform estimărilor industriei, până la 85% dintre proiectele de învățare automată nu ajung niciodată în mediul de producție. Nu pentru că nu funcționează modelele, ci pentru că infrastructura, procesul și disciplina pentru a le face să lucreze fiabil și continuu.

MLOps (Machine Learning Operations) a fost creat exact pentru a umple acest gol. Nu este o singură tehnologie, ci un set de practici, instrumente și cultură care ele transformă experimentele izolate în sisteme ML de producție robuste. În acest articol vom vedea ce înseamnă MLOps, de ce a devenit indispensabil și cum să începeți să îl aplicați concret, chiar și cu un buget limitat.

Ce vei învăța

de ce majoritatea proiectelor ML nu ajung în producție și cum MLOps rezolvă problema
Diferențele cheie dintre DevOps și MLOps
Cele 3 niveluri de maturitate MLOps conform modelului Google
Ciclul de viață complet al unui model ML în producție
Cum se face urmărirea experimentală cu MLflow
Cum să serviți un model cu FastAPI și Docker
Stiva open-source pentru a începe cu mai puțin de 5.000 EUR/an

Ce este MLOps și de ce este necesar

MLOps și aplicarea principiilor de DevOps la ciclul de viață al învățării automate. Așa cum DevOps a unit dezvoltarea și operațiunile pentru software tradițional, MLOps se unește știința datelor, inginerie și operațiuni pentru sisteme ML. Scopul este automatizarea e faceți reproductibile toate fazele: de la pregătirea datelor până la instruire, de la validare până la implementare, de la monitorizare până la recalificare.

DevOps vs MLOps: diferențele cheie

Cei care vin din lumea software-ului ar putea crede că aplicarea acelorași practici DevOps este suficientă la modelele ML. În realitate, există diferențe fundamentale care fac din MLOps o disciplină în sine.

astept	DevOps	MLOps
Artefact	Cod sursă	Cod + Date + Model
Versiune	Git pentru cod	Git + DVC pentru date și modele
Testare	Teste unitare, teste de integrare	Validarea datelor, validarea modelului, testarea A/B
CI/CD	Creați, testați, implementați cod	Antrenează, validează, implementează modelul
Monitorizare	Latență, erori, timp de funcționare	Derivarea datelor, deriva conceptului, performanța modelului
Degradare	Erori explicite	Degradare silențioasă în timp
Reproductibilitatea	Același cod = aceeași ieșire	Același cod + aceleași date + aceeași sămânță = aceeași ieșire

Cea mai critică diferență este degradare tăcută. Un serviciu software tradițională funcționează sau nu funcționează: dacă există o eroare, se aruncă o eroare. Un model ML poate continuă să returneze predicții fără erori tehnice, dar cu precizie progresivă mai rău deoarece datele de intrare s-au schimbat în comparație cu antrenamentul. Fara monitorizare specific, nimeni nu observă până când utilizatorii încep să se plângă.

Problema „Valea Morții” ML

Gartner estimează că 30% din proiectele AI generative vor fi abandonate după fază de dovadă de concept până la sfârșitul anului 2025, din cauza calității slabe a datelor, controalelor risc inadecvat, costuri în creștere sau valoare comercială neclară. Adresele MLOps fiecare dintre aceste probleme în mod sistematic.

Piața MLOps: cifre și tendințe

Piața MLOps crește într-un ritm impresionant. Conform analizelor din industrie, valoarea globală a pieței MLOps a fost estimată între 2 și 3 miliarde de dolari în 2025, cu proiecții care o văd să ajungă între 25 și 56 de miliarde de dolari până în 2035, cu un CAGR (rata de creștere anuală compusă) între 29% și 42% în funcție de surse.

Aceste cifre reflectă o realitate concretă: companiile investesc masiv pentru a aduce modele ML în producție. Conform estimărilor pieței, peste 70% din Întreprinderile mari din America de Nord rulează sarcini de lucru AI în producție, iar peste 55% au sisteme automate integrate de monitorizare a modelelor. Cu toate acestea, aproape două treimi din organizațiile sunt încă blocate în faza pilot, incapabile să extindă AI la nivel de întreprindere.

Cele 3 niveluri de maturitate MLOps

Google a definit un model de maturitate MLOps pe 3 niveluri care a devenit standard de facto a sectorului. Fiecare nivel reprezintă un grad crescând de automatizare și fiabilitatea în ciclul de viață ML.

Nivelul 0: Proces manual

La nivelul 0, fiecare etapă este manuală. Data scientist lucrează în caietul lui, se antrenează modelul local, îl exportă ca fișier și îl livrează echipei de ingineri care include într-un API. Nu există automatizare, nu există monitorizare, nu există recalificare automată.

Caracteristică	Nivelul 0
Antrenamentul	Manual, în caiet
Implementează	Manual, livrarea fișierului .pkl sau .h5
Monitorizare	Niciuna sau manual
Recalificare	Doar la cerere explicită
Reproductibilitatea	Sărac sau absent

Acest nivel este comun în organizațiile care încep să aplice ML în cazurile lor de utilizare. Acest lucru poate fi suficient atunci când modelele sunt rar actualizate și datele se modifică puțin, dar nu se scalează.

Nivelul 1: ML Pipeline Automation

La nivelul 1, instruirea este automatizată prin a Conducte ML. Nu da nu mai implementează un singur model, ci întreaga conductă care îl produce. Acest lucru permite formare continuă: Când sosesc date noi, conducta se reinstruiește modelul automat.

Caracteristică	Nivelul 1
Antrenamentul	Automat prin conductă
Implementează	Conductă automată
Monitorizare	Performanța modelului + recalificarea declanșatorului
Recalificare	Automat la date noi sau degradare
Reproductibilitatea	Bun (conducte versionate)

Nivelul 1 este suficient atunci când datele se modifică frecvent, dar abordarea ML rămâne stabil. Conducta este aceeași, dar este reluată periodic cu date noi.

Nivelul 2: CI/CD pentru Machine Learning

La nivelul 2 se adaugă un sistem complet CI/CD specific ML. Nu numai datele se schimbă, ci și codul conductei, caracteristicile, hiperparametrii, arhitectura modelului. Fiecare modificare trece prin testare automată, validare și desfășurare controlată.

Caracteristică	Nivelul 2
Antrenamentul	Automat + CI/CD pe conducta în sine
Implementează	Albastru/verde, canar, testare A/B
Monitorizare	Cuprinzător: deriva de date, deriva de concept, performanță, latență
Recalificare	Automat cu validare și rollback
Reproductibilitatea	Complet (cod + date + versiunea mediului)

Atingerea nivelului 2 și a obiectivului pentru organizațiile mature. Este nevoie de investiții semnificativ în infrastructură și cultură, dar este singura modalitate de a gestiona zeci sau sute de modele în producţie durabilă.

Ciclul de viață MLOps

Ciclul de viață al unui model ML în producție este un proces iterativ prin care trece șase faze principale. Spre deosebire de dezvoltarea software tradițională, acest ciclu nu nu se termină niciodată: un model în producție necesită întreținere continuă.

Ciclul de viață MLOps


    +----------+     +---------+     +----------+
    |   DATA   |---->|  TRAIN  |---->| EVALUATE |
    | Collect  |     | Feature |     | Validate |
    | Clean    |     | Train   |     | Compare  |
    | Version  |     | Tune    |     | Approve  |
    +----------+     +---------+     +----------+
         ^                                |
         |                                v
    +----------+     +---------+     +----------+
    | RETRAIN  |<----| MONITOR |<----| DEPLOY   |
    | Trigger  |     | Drift   |     | Stage    |
    | Schedule |     | Metrics |     | Canary   |
    | Auto     |     | Alert   |     | Release  |
    +----------+     +---------+     +----------+

1. Data: Colectare, Curățare și Versiune

Totul începe cu date. În această fază datele brute sunt colectate și curățate (tratând valori lipsă, valori aberante, duplicate), acestea sunt transformate în caracteristici utile și se versionează singuri. Versiunea datelor este fundamentală: pentru a reproduce un model trebuie sa stii exact care date au fost folosite pentru antrenament. Instrumente ca DVC (Controlul versiunii datelor) permite versiunea seturi mari de date similare cu Git.

2. Tren: Inginerie caracteristică și formare

Cu datele gata, construiți funcțiile, alegeți algoritmul și antrenați modelul. Fiecare experiment (combinație de hiperparametri, caracteristici, arhitectură) este urmărit cu parametrii și valorile relevanți. Instrumente ca MLflow face acest proces sistematic și reproductibil.

3. Evaluați: validare și comparare

Modelul antrenat este validat pe baza unor metrici predefinite (acuratețe, scor F1, RMSE, AUC) și comparat cu versiunea aflată în prezent în producție. Dacă noul model nu depășește pragurile minime sau nu se îmbunătățește față de precedentul, nu este promovat.

4. Implementare: Staging, Canary și Release

Modelul aprobat trece prin medii progresive: punere în scenă pentru testare integrare, canary pentru validare cu trafic real limitat și, în final, producție completă. Strategii ca desfășurare albastru/verde e eliberare canar minimiza riscul.

5. Monitor: Drift, Metrics and Alerts

În producție, modelul este monitorizat continuu. Valorile sunt urmărite tehnici (latență, debit, erori) și metrici ML (acuratețea datelor reale, distribuția predicțiilor, deriva de date). Alertele sunt declanșate când valorile ele se încadrează sub praguri.

6. Reantrenați: declanșare și automatizare

Când monitorizarea detectează degradarea, reantrenarea este activată. Acest lucru poate fi programat (de exemplu, săptămânal), bazat pe declanșare (de exemplu, precizie sub 90%) sau manual. Noul model trece din nou prin etapele de evaluare și implementare.

Stiva MLOps open-source

Unul dintre avantajele MLOps este că există un ecosistem open-source matur care îl acoperă fiecare etapă a ciclului de viață. Nu este nevoie să cumpărați platforme costisitoare pentru întreprinderi pentru a începe: cu instrumentele potrivite, puteți construi o conductă MLOps completă.

Fază	Instrument	Funcţie
Versiunea datelor	DVC	Versiune de seturi de date și modele, integrate cu Git
Urmărirea experimentului	MLflow	Parametri de înregistrare, valori, artefacte pentru fiecare experiment
Registrul modelului	Registrul modelului MLflow	Versiune și promovare a modelului (montare/producție)
Pipeline Orchestration	Prefect / Flux de aer	Orchestrarea fluxului de lucru, programare, reîncercare
Servire model	FastAPI + Docker	API REST pentru difuzarea predicțiilor, în containere
Containerizarea	Docker + K8s	Medii reproductibile, scalabilitate orizontală
Monitorizare	Prometeu + Grafana	Valori, tablouri de bord, alerte
Validarea datelor	Mari așteptări	Teste automate de calitate a datelor

De la Notebook la Pipeline: Exemplu practic

Să ne uităm la cel mai comun pas cu care se confruntă fiecare echipă ML: transformarea codului scris într-un caiet Jupyter într-o conductă modulară și reproductibilă. Să luăm o exemplu real de clasificare și să vedem cum să o restructurăm.

Înainte: Caietul monolitic

Iată caietul tipic în care totul trăiește într-un singur fișier, fără separare responsabilitate, fără logare, fără versiuni.

notebook_v1.ipynb - Caietul monolitic clasic


# Cella 1: Tutto nello stesso notebook
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, f1_score
import pickle

# Caricamento dati
df = pd.read_csv("data/customers.csv")

# Feature engineering inline
df["age_group"] = pd.cut(df["age"], bins=[0, 25, 45, 65, 100],
                          labels=["young", "adult", "senior", "elderly"])
df["total_spend"] = df["orders"] * df["avg_order_value"]

# Split
X = df[["age", "total_spend", "visits", "days_since_last"]]
y = df["churned"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Training - parametri hardcoded
model = RandomForestClassifier(n_estimators=100, max_depth=10)
model.fit(X_train, y_train)

# Valutazione - print a schermo
y_pred = model.predict(X_test)
print(f"Accuracy: {accuracy_score(y_test, y_pred)}")
print(f"F1: {f1_score(y_test, y_pred)}")

# Salvataggio - pickle senza versioning
with open("model.pkl", "wb") as f:
    pickle.dump(model, f)
print("Modello salvato!")

Probleme caietul monolitic

Nu se poate juca: fără semințe, fără versiune de date
Nu urmărit: parametrii și valorile trăiesc numai în ieșirea notebook-ului
Nu se poate testa: nu există funcții izolate de testat
Nu se poate implementa: muratul nu este un API
Nu poate fi întreținut: modificarea unei caracteristici necesită reexecuția tuturor

După: Conductă modulară

Restructuram codul in module separate, fiecare cu o responsabilitate specifica. Fiecare funcție poate fi testată, fiecare parametru este configurabil, fiecare măsurătoare este urmărită.

src/data/preprocessing.py - Modul de pregătire a datelor


"""Modulo per la preparazione e trasformazione dei dati."""
import pandas as pd
from pathlib import Path
from typing import Tuple


def load_data(path: str) -> pd.DataFrame:
    """Carica il dataset dal path specificato."""
    filepath = Path(path)
    if not filepath.exists():
        raise FileNotFoundError(f"Dataset non trovato: {path}")
    return pd.read_csv(filepath)


def create_features(df: pd.DataFrame) -> pd.DataFrame:
    """Crea le feature derivate per il modello."""
    result = df.copy()
    result["age_group"] = pd.cut(
        result["age"],
        bins=[0, 25, 45, 65, 100],
        labels=["young", "adult", "senior", "elderly"]
    )
    result["total_spend"] = result["orders"] * result["avg_order_value"]
    return result


def split_data(
    df: pd.DataFrame,
    target_col: str = "churned",
    feature_cols: list = None,
    test_size: float = 0.2,
    random_state: int = 42
) -> Tuple[pd.DataFrame, pd.DataFrame, pd.Series, pd.Series]:
    """Split dei dati in train/test con seed fisso per riproducibilità."""
    from sklearn.model_selection import train_test_split

    if feature_cols is None:
        feature_cols = ["age", "total_spend", "visits", "days_since_last"]

    X = df[feature_cols]
    y = df[target_col]
    return train_test_split(X, y, test_size=test_size, random_state=random_state)

src/models/trainer.py - Modul de instruire


"""Modulo per il training e la valutazione del modello."""
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, f1_score, precision_score, recall_score
from typing import Dict, Any
import pandas as pd


def train_model(
    X_train: pd.DataFrame,
    y_train: pd.Series,
    n_estimators: int = 100,
    max_depth: int = 10,
    random_state: int = 42
) -> RandomForestClassifier:
    """Addestra un RandomForestClassifier con parametri configurabili."""
    model = RandomForestClassifier(
        n_estimators=n_estimators,
        max_depth=max_depth,
        random_state=random_state
    )
    model.fit(X_train, y_train)
    return model


def evaluate_model(
    model: RandomForestClassifier,
    X_test: pd.DataFrame,
    y_test: pd.Series
) -> Dict[str, float]:
    """Valuta il modello e restituisce un dizionario di metriche."""
    y_pred = model.predict(X_test)
    return {
        "accuracy": accuracy_score(y_test, y_pred),
        "f1_score": f1_score(y_test, y_pred),
        "precision": precision_score(y_test, y_pred),
        "recall": recall_score(y_test, y_pred),
    }

src/pipeline.py - Orchestrare pipeline


"""Pipeline principale che orchestra tutte le fasi."""
from src.data.preprocessing import load_data, create_features, split_data
from src.models.trainer import train_model, evaluate_model
import yaml
from pathlib import Path


def run_pipeline(config_path: str = "config.yaml") -> None:
    """Esegue l'intera pipeline ML con configurazione esterna."""
    # 1. Carica configurazione
    with open(config_path) as f:
        config = yaml.safe_load(f)

    # 2. Data preparation
    print("[1/4] Caricamento dati...")
    df = load_data(config["data"]["path"])
    df = create_features(df)

    # 3. Split
    print("[2/4] Split train/test...")
    X_train, X_test, y_train, y_test = split_data(
        df,
        test_size=config["data"]["test_size"],
        random_state=config["data"]["random_state"]
    )

    # 4. Training
    print("[3/4] Training modello...")
    model = train_model(
        X_train, y_train,
        n_estimators=config["model"]["n_estimators"],
        max_depth=config["model"]["max_depth"],
        random_state=config["model"]["random_state"]
    )

    # 5. Evaluation
    print("[4/4] Valutazione...")
    metrics = evaluate_model(model, X_test, y_test)
    for name, value in metrics.items():
        print(f"  {name}: {value:.4f}")


if __name__ == "__main__":
    run_pipeline()

config.yaml - Configurație externalizată


# config.yaml - Tutti i parametri in un unico file
data:
  path: "data/customers.csv"
  test_size: 0.2
  random_state: 42
  feature_cols:
    - age
    - total_spend
    - visits
    - days_since_last

model:
  algorithm: "random_forest"
  n_estimators: 100
  max_depth: 10
  random_state: 42

evaluation:
  metrics:
    - accuracy
    - f1_score
    - precision
    - recall
  min_accuracy: 0.85

Avantajele conductei modulare

Reproductibil: seed fix, configurație externalizată, date versionate
Testabil: fiecare funcție este izolată și poate avea teste unitare dedicate
De întreținut: modificarea caracteristicilor nu afectează antrenamentul și invers
Configurabil: modificați hiperparametrii fără a atinge codul
Automatizat: conducta poate fi condusă de CI/CD

Urmărirea experimentelor cu MLflow

De câte ori ai schimbat un hiperparametru și apoi nu ți-ai amintit ce combinație avea dat cel mai bun rezultat? THE'urmărirea experimentală rezolvă această problemă înregistrând automat parametrii, valorile și artefactele fiecărui experiment.

MLflow și cel mai popular instrument open-source pentru urmărirea experimentală. Oferă un server cu interfață de utilizare web pentru a vizualiza și compara experimentele, un API Python pentru înregistrare și un registru de modele pentru a gestiona ciclul de viață al modelelor.

Configurare și primul experiment

Instalarea MLflow


# Installazione
pip install mlflow

# Avvio del tracking server locale
mlflow server --host 127.0.0.1 --port 5000

src/pipeline_tracked.py - Conductă cu urmărire MLflow


"""Pipeline ML con experiment tracking via MLflow."""
import mlflow
import mlflow.sklearn
from src.data.preprocessing import load_data, create_features, split_data
from src.models.trainer import train_model, evaluate_model


def run_tracked_pipeline(config: dict) -> None:
    """Esegue la pipeline tracciando tutto con MLflow."""

    # Imposta il tracking URI (server locale o remoto)
    mlflow.set_tracking_uri("http://127.0.0.1:5000")
    mlflow.set_experiment("churn-prediction")

    with mlflow.start_run(run_name="rf-baseline") as run:
        # Log dei parametri
        mlflow.log_param("algorithm", "RandomForest")
        mlflow.log_param("n_estimators", config["model"]["n_estimators"])
        mlflow.log_param("max_depth", config["model"]["max_depth"])
        mlflow.log_param("test_size", config["data"]["test_size"])
        mlflow.log_param("random_state", config["data"]["random_state"])

        # Data preparation
        df = load_data(config["data"]["path"])
        df = create_features(df)
        X_train, X_test, y_train, y_test = split_data(
            df,
            test_size=config["data"]["test_size"],
            random_state=config["data"]["random_state"]
        )

        # Log dimensioni dataset
        mlflow.log_param("train_samples", len(X_train))
        mlflow.log_param("test_samples", len(X_test))
        mlflow.log_param("n_features", X_train.shape[1])

        # Training
        model = train_model(
            X_train, y_train,
            n_estimators=config["model"]["n_estimators"],
            max_depth=config["model"]["max_depth"]
        )

        # Evaluation
        metrics = evaluate_model(model, X_test, y_test)

        # Log delle metriche
        for name, value in metrics.items():
            mlflow.log_metric(name, value)

        # Log del modello come artefatto
        mlflow.sklearn.log_model(
            model,
            artifact_path="model",
            registered_model_name="churn-classifier"
        )

        # Log della configurazione come artefatto
        mlflow.log_artifact("config.yaml")

        print(f"Run ID: {run.info.run_id}")
        print(f"Metriche: {metrics}")

După executarea mai multor experimente, deschideți http://127.0.0.1:5000 în browser. Interfața de utilizare MLflow afișează un tabel cu toate experimentele, permițându-vă să comparați valori, sortați în funcție de performanță și vedeți valorile vs. grafice.

Registrul de modele: modele de versiune

La fel cum codul este versionat cu Git, modelele ML trebuie versionate cu a Registrul modelului. MLflow Model Registry oferă un sistem centralizat pentru a gestiona ciclul de viață al modelelor prin trei etape.

Stadion	Descriere	Cine îl folosește
Niciuna / Montare	Model în curs de testare și validare	Cercetător de date, QA
Productie	Model omologat, servește trafic real	Servirea API-ului, utilizatorilor finali
Arhivat	Model scos din funcțiune, păstrat pentru audit	Conformitate, rollback

Promovarea modelului cu MLflow Model Registry


"""Gestione del ciclo di vita del modello con MLflow Model Registry."""
from mlflow.tracking import MlflowClient

client = MlflowClient("http://127.0.0.1:5000")

# Recupera l'ultima versione del modello in staging
latest_versions = client.get_latest_versions(
    name="churn-classifier",
    stages=["Staging"]
)

if latest_versions:
    version = latest_versions[0].version
    print(f"Modello in staging: v{version}")

    # Promuovi a Production dopo validazione
    client.transition_model_version_stage(
        name="churn-classifier",
        version=version,
        stage="Production",
        archive_existing_versions=True  # Archivia versione precedente
    )
    print(f"Modello v{version} promosso a Production")

# Carica il modello in produzione per inference
import mlflow.pyfunc

model = mlflow.pyfunc.load_model("models:/churn-classifier/Production")
prediction = model.predict(new_data)

Implementare: FastAPI + Docker

Un model ML în producție este de obicei expus ca API-ul REST. FastAPI și alegerea ideală pentru Python: și rapid (bazat pe ASGI), generează documentație automată (OpenAPI/Swagger) și are o validare excelentă de date prin Pydantic. Containerizarea cu Docher, primim un artefact care poate fi dislocat oriunde.

src/serving/app.py - FastAPI pentru difuzarea modelelor


"""API REST per servire predizioni del modello ML."""
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel, Field
import mlflow.pyfunc
import pandas as pd
import logging
from typing import List

# Configurazione logging
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

app = FastAPI(
    title="Churn Prediction API",
    description="API per predizioni di churn basata su ML",
    version="1.0.0"
)


class PredictionRequest(BaseModel):
    """Schema della richiesta di predizione."""
    age: int = Field(..., ge=0, le=120, description="Eta del cliente")
    total_spend: float = Field(..., ge=0, description="Spesa totale")
    visits: int = Field(..., ge=0, description="Numero visite")
    days_since_last: int = Field(..., ge=0, description="Giorni dall'ultima visita")


class PredictionResponse(BaseModel):
    """Schema della risposta di predizione."""
    prediction: int
    probability: float
    model_version: str


# Caricamento modello all'avvio
MODEL_NAME = "churn-classifier"
MODEL_STAGE = "Production"
model = None
model_version = "unknown"


@app.on_event("startup")
async def load_model():
    """Carica il modello MLflow all'avvio del server."""
    global model, model_version
    try:
        model_uri = f"models:/{MODEL_NAME}/{MODEL_STAGE}"
        model = mlflow.pyfunc.load_model(model_uri)
        model_version = model.metadata.run_id[:8]
        logger.info(f"Modello caricato: {MODEL_NAME} ({model_version})")
    except Exception as e:
        logger.error(f"Errore caricamento modello: {e}")
        raise


@app.get("/health")
async def health_check():
    """Endpoint di health check."""
    return {"status": "healthy", "model_loaded": model is not None}


@app.post("/predict", response_model=PredictionResponse)
async def predict(request: PredictionRequest):
    """Genera una predizione di churn per un cliente."""
    if model is None:
        raise HTTPException(status_code=503, detail="Modello non caricato")

    try:
        input_data = pd.DataFrame([request.model_dump()])
        prediction = model.predict(input_data)
        probability = float(prediction[0]) if hasattr(prediction[0], '__float__') else 0.0

        return PredictionResponse(
            prediction=int(prediction[0]),
            probability=probability,
            model_version=model_version
        )
    except Exception as e:
        logger.error(f"Errore predizione: {e}")
        raise HTTPException(status_code=500, detail="Errore nella predizione")


@app.post("/predict/batch", response_model=List[PredictionResponse])
async def predict_batch(requests: List[PredictionRequest]):
    """Genera predizioni batch per più clienti."""
    if model is None:
        raise HTTPException(status_code=503, detail="Modello non caricato")

    input_data = pd.DataFrame([r.model_dump() for r in requests])
    predictions = model.predict(input_data)

    return [
        PredictionResponse(
            prediction=int(p),
            probability=float(p),
            model_version=model_version
        )
        for p in predictions
    ]

Dockerfile - Container pentru servire


# Dockerfile per il serving del modello ML
FROM python:3.11-slim

WORKDIR /app

# Dipendenze di sistema
RUN apt-get update && apt-get install -y --no-install-recommends \
    gcc \
    && rm -rf /var/lib/apt/lists/*

# Dipendenze Python
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# Codice applicazione
COPY src/serving/ ./serving/
COPY config.yaml .

# Porta del servizio
EXPOSE 8000

# Healthcheck
HEALTHCHECK --interval=30s --timeout=5s --retries=3 \
    CMD curl -f http://localhost:8000/health || exit 1

# Avvio con uvicorn
CMD ["uvicorn", "serving.app:app", "--host", "0.0.0.0", "--port", "8000"]

Construiți și lansați containerul


# Build dell'immagine
docker build -t churn-api:v1.0.0 .

# Avvio del container
docker run -d \
  --name churn-api \
  -p 8000:8000 \
  -e MLFLOW_TRACKING_URI=http://mlflow-server:5000 \
  churn-api:v1.0.0

# Test dell'API
curl -X POST http://localhost:8000/predict \
  -H "Content-Type: application/json" \
  -d '{"age": 35, "total_spend": 1250.50, "visits": 12, "days_since_last": 45}'

Monitorizare in productie

Desfăşurarea nu este sfârşitul lucrării, ci începutul unei noi etape critice: cel monitorizare. Un model în producție se degradează în timp pentru că lumea modificări și datele cu ele. Monitorizarea trebuie să acopere trei domenii principale.

Valori de urmărit

Categorie	Metrici	Instrument
Infrastructură	Latență (p50, p95, p99), debit, erori HTTP, CPU/RAM	Prometeu + Grafana
Model	Acuratețe, scor F1, distribuție de predicții, încredere	MLflow + valori personalizate
Date	Deriva datelor, deriva caracteristicilor, valori lipsă, distribuția intrărilor	Evident AI / Mari așteptări

Data Drift vs Concept Drift

Este esențial să se facă distincția între două tipuri de degradare a modelului:

Deriva datei: distribuţia datelor de intrare se modifică în raport cu set de antrenament. Exemplu: un model instruit pe clienți de 25-45 de ani începe să primească solicitări pentru clienți 60+.
Derivarea conceptului: se modifică relația dintre intrare și ieșire. Exemplu: după o pandemie, modelele de retragere a clienților sunt complet diferite, dar caracteristicile la intrare au aceeași distribuție.

src/monitoring/drift_detector.py - Detectarea derivei este simplă


"""Rilevamento data drift con test statistici."""
import numpy as np
from scipy import stats
from typing import Dict, Tuple


def detect_drift(
    reference_data: np.ndarray,
    production_data: np.ndarray,
    feature_names: list,
    threshold: float = 0.05
) -> Dict[str, Dict]:
    """
    Rileva data drift confrontando distribuzioni con il test KS.

    Args:
        reference_data: dati di training (riferimento)
        production_data: dati di produzione (attuali)
        feature_names: nomi delle feature
        threshold: soglia p-value per il drift (default 0.05)

    Returns:
        Report di drift per ogni feature
    """
    drift_report = {}

    for i, feature in enumerate(feature_names):
        ref_values = reference_data[:, i]
        prod_values = production_data[:, i]

        # Test Kolmogorov-Smirnov
        ks_stat, p_value = stats.ks_2samp(ref_values, prod_values)

        drift_detected = p_value < threshold
        drift_report[feature] = {
            "ks_statistic": round(ks_stat, 4),
            "p_value": round(p_value, 4),
            "drift_detected": drift_detected,
            "ref_mean": round(float(np.mean(ref_values)), 4),
            "prod_mean": round(float(np.mean(prod_values)), 4),
        }

        if drift_detected:
            print(f"DRIFT RILEVATO su '{feature}': "
                  f"KS={ks_stat:.4f}, p={p_value:.4f}")

    return drift_report

Când să reactivați recalificarea

Nu orice derivă necesită recalificare imediată. Definiți praguri clare: deriva de date privind caracteristicile critice, scăderea preciziei mai mare de 5% sau distribuția predicțiilor semnificativ dezechilibrate. Evitați recalificarea excesivă pe care o poate introduce instabil.

Cum să începeți cu un buget mai mic de 5.000 EUR/an

MLOps nu înseamnă neapărat platforme de întreprindere care costă sute de mii de euro. Pentru un IMM italian sau o echipă mică, este posibil să construiți o infrastructură MLOps eficient cu instrumente open-source și costuri minime.

Stack propus pentru IMM-uri

Componentă	Soluţie	Costul anual
Cod	GitHub Free / GitLab CE	0 EUR
Versiunea datelor	DVC + Google Cloud Storage (5 GB gratuit)	0 - 50 EUR
Urmărirea experimentului	MLflow pe VM ieftine	200 - 500 EUR
Antrenamentul	Google Colab Pro / spot VM	120 - 600 EUR
Servire	FastAPI pe VM (2 vCPU, 4 GB RAM)	300 - 800 EUR
Monitorizare	Prometheus + Grafana (auto-găzduit)	0 EUR (pe același VM)
CI/CD	Acțiuni GitHub (2000 min/lună gratuit)	0 EUR
Registrul containerelor	Registrul Containerului GitHub	0 EUR

Total estimat: 620 - 1.950 EUR/an, cu mult sub pragul de 5.000 EUR. Această stivă acceptă până la 5-10 modele în producție cu volume moderate de trafic (mii de predicții pe zi).

Sfaturi pentru reducerea costurilor

VM spot/preemptibil: economii de până la 70% pentru formarea non-urgentă
Autoscaling: scala la zero atunci când nu există cereri
Compresie model: modele mai mici = mai puține resurse de servire
Inferență în lot: dacă nu aveți nevoie de predicții în timp real, utilizați loturi de noapte
Multi-chiriași: o singură infrastructură MLflow/Grafana pentru toate proiectele

Structura unui proiect MLOps

Pentru a încheia cu ceva imediat utilizabil, iată structura folderului recomandat pentru un proiect MLOps. Această organizare urmează separarea responsabilitate și ușurință în automatizare, testare și colaborare.

Structura de proiect MLOps recomandată


churn-prediction/
  data/
    raw/                  # Dati grezzi (versionati con DVC)
    processed/            # Dati trasformati
    data.dvc              # File di tracking DVC
  src/
    data/
      preprocessing.py    # Pulizia e feature engineering
      validation.py       # Validazione qualità dati
    models/
      trainer.py          # Logica di training
      evaluator.py        # Valutazione e metriche
    serving/
      app.py              # FastAPI application
      schemas.py          # Pydantic schemas
    monitoring/
      drift_detector.py   # Rilevamento drift
      metrics.py          # Metriche custom
    pipeline.py           # Orchestrazione pipeline
  tests/
    test_preprocessing.py
    test_trainer.py
    test_api.py
  config.yaml             # Configurazione pipeline
  Dockerfile              # Container per serving
  docker-compose.yaml     # Stack locale completo
  requirements.txt        # Dipendenze Python
  .dvc/                   # Configurazione DVC
  .github/
    workflows/
      train.yaml          # CI/CD per training
      deploy.yaml         # CI/CD per deployment
  mlflow/                 # Artefatti MLflow (locale)
  README.md

Concluzii și pașii următori

MLOps nu este un lux rezervat marilor companii de tehnologie. Și o necesitate pentru oricine dorește să aducă modele ML în producție într-un mod fiabil și durabil. În acest articol am acoperit elementele fundamentale: de la înțelegerea problemei (de ce proiectele ML eșuează) la soluția concretă (conducte modulare, experiment urmărire, registru model, servire containerizată și monitorizare).

Cheia este să începeți treptat. Nu este nevoie să ajungeți la nivelul 2 al modelului de maturitate Google din prima zi. Începeți de la nivelul 0 cu bune practici:

Imediat: Separați codul notebook-ului în module. Utilizați un config.yaml.
Săptămâna 1: Adăugați MLflow pentru a urmări experimentele.
Săptămâna 2: Containerizați modelul cu FastAPI + Docker.
Luna 1: Implementați o conductă CI/CD cu GitHub Actions.
Luna 2: Adăugați monitorizare cu Prometheus și alerte de bază.
Luna 3: Implementați DVC pentru versiunea datelor.

În următoarele articole ale seriei vom aprofunda fiecare componentă: managementul datelor cu DVC, crearea de conducte CI/CD specifice ML, monitorizare avansată cu Evident, AI și implementare scalabilă pe Kubernetes. Fiecare articol va fi practic, cu Cod de lucru și instrucțiuni pas cu pas.

Foaia de parcurs a seriei

Articolul 2: DVC - Data Versioning for ML
Articolul 3: MLflow Deep Dive - Urmărirea avansată a experimentelor
Articolul 4: CI/CD pentru Machine Learning cu GitHub Actions
Articolul 5: Magazin de caracteristici și Inginerie de caracteristici în producție
Articolul 6: Servire de modele scalabile cu Kubernetes
Articolul 7: Monitorizare avansată: deriva de date și evident AI
Articolul 8: Guvernare, conformitate și ML responsabil