Merhaba! Ben

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

İletişime Geç

Hakkımda

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

Yeteneklerim

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

Süreç Otomasyonu

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

Özel Sistemler

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

Misyonum

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

Teknolojiyi Demokratikleştirmek

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

BT ve İş Dünyasını Birleştirmek

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

Özel Çözümler Oluşturmak

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

İşletmenizi Teknolojiyle Dönüştürün

Che tu gestisca un negozio, uno studio professionale o un'azienda, posso aiutarti a sfruttare le potenzialità dell'informatica per lavorare meglio, più velocemente e in modo più intelligente.

Konuşalım →

Unisciti alla Community

Entra nella community di sviluppatori dove discutiamo di software, AI, architettura e DevOps. Condividi idee, fai domande e cresci insieme a noi.

Canale

FC Dev Blog

Ricevi notifiche su nuovi articoli, serie complete, tips settimanali e tool in evidenza. Contenuti bilingui IT/EN direttamente nel tuo Telegram.

Nuovi articoli appena pubblicati
Tips e code snippets settimanali
Sondaggi sugli argomenti futuri

Iscriviti al Canale

Gruppo

FC Dev Community

Una community bilingue IT/EN per sviluppatori. Discussioni, Q&A, aiuto reciproco e networking con altri professionisti del settore.

Discussioni su articoli e tecnologie
Help coding e code review
Opportunità di lavoro e collaborazione

Unisciti al Gruppo

Topic di Discussione

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

Linguaggi & Tecnologie

Java

Python

JavaScript

Angular

React

TypeScript

SQL

PHP

CSS/SCSS

Node.js

Docker

Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

İletişime Geç

Aklınızda bir proje mi var? Konuşalım! Formu doldurun, en kısa sürede dönüş yapacağım.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

Transformatörlerle Duygu Analizi: Teknikler ve Uygulama

La Duygu Analizi — veya duyarlılık analizi — ve en çok talep edilen NLP görevi kurumsal ortam. Her gün milyonlarca şirket ürün incelemelerini, gönderilerini analiz ediyor İnsanların gerçekte ne düşündüğünü anlamak için sosyal medya, destek biletleri ve müşteri geri bildirimleri. BERT ve Transformer modellerinin ortaya çıkmasıyla bu sistemlerin kalitesi arttı klasik sözlük tabanlı veya TF-IDF yaklaşımlarıyla radikal bir şekilde karşılaştırıldı.

Bu makalede eksiksiz bir duygu analizi sistemi oluşturacağız: anlayıştan başlayarak veri setlerinin HuggingFace ile ince ayardan geçirilerek üretime aktarılması, dengesiz sınıfların yönetimi, metrik ve stratejilerin değerlendirilmesi ironi, inkar ve muğlak dil gibi sınır durumlarıyla başa çıkmak.

Bu serinin üçüncü makalesi Modern NLP: BERT'ten Yüksek Lisans'a. BERT temellerine aşina olduğunu varsayar (Madde 2). Özellikle İtalyanca için Feel-it ve AlBERTo modellerine ayrılmış 4. maddeye bakın.

Ne Öğreneceksiniz

Duyarlılık analizi için klasik yaklaşımlar ve BERT: VADER, sözlük tabanlı, ince ayarlı Transformers
Kamu duyarlılığı veri kümeleri: SST-2, IMDb, Amazon Reviews, SemEval
HuggingFace Transformers ve Trainer API ile uygulamayı tamamlayın
Duygularda sınıf dengesizliğinin yönetimi
Metrikler: doğruluk, F1, hassasiyet, geri çağırma, AUC-ROC
İnce taneli duyarlılık: yönler (ABSA) ve yoğunluk
Zor durumlar: ironi, inkar, muğlak dil
FastAPI ve toplu çıkarımla üretim hattı
Gecikme için optimizasyon: niceleme ve ONNX dışa aktarımı

1. Yaklaşımların Evrimi: VADER'den BERT'e

Transformers uygulamasına dalmadan önce yolculuğu anlamakta fayda var Üretimde sıklıkla kullanıldığı şekliyle duygu analizine yönelik yaklaşımların geçmişi gereksinimleri karşılayan en basit yöntemdir.

1.1 Sözlük Tabanlı Yaklaşımlar: VADER

VADER (Valence Aware Dictionary ve sEntiment Reasoner) ve sözlük tabanlı sosyal medya için optimize edilmiş analizör. Hiçbir eğitim gerektirmez ve çok hızlıdır ve resmi olmayan metinlerde şaşırtıcı derecede iyi çalışıyor.

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer

analyzer = SentimentIntensityAnalyzer()

# Esempi base
texts = [
    "This product is absolutely AMAZING!!!",         # positivo forte
    "The service was okay I guess",                   # neutro ambiguo
    "Worst purchase I've ever made. Complete waste.", # negativo
    "The food wasn't bad at all",                     # negazione tricky
    "Yeah right, as if this would work :)",           # sarcasmo
]

for text in texts:
    scores = analyzer.polarity_scores(text)
    print(f"Text: {text[:50]}")
    print(f"  neg={scores['neg']:.3f}, neu={scores['neu']:.3f}, "
          f"pos={scores['pos']:.3f}, compound={scores['compound']:.3f}")
    label = 'POSITIVE' if scores['compound'] >= 0.05 else \
            'NEGATIVE' if scores['compound'] <= -0.05 else 'NEUTRAL'
    print(f"  Label: {label}\n")

# VADER gestisce bene: maiuscole, punteggiatura, emoji
# Non gestisce bene: sarcasmo, contesto complesso

1.2 Klasik Makine Öğrenimi Yaklaşımları

Transformers'tan önce en popüler yaklaşımlar TF-IDF + Lojistik Regresyon'du veya SVM'dir. Bugün bile hızlı temeller olarak veya çok az veri olduğunda faydalıdırlar.

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.metrics import classification_report

# Dataset di esempio
train_texts = [
    "Ottimo prodotto, lo consiglio a tutti",
    "Pessima esperienza, non lo ricomprero",
    "qualità eccellente, spedizione veloce",
    "Totale spreco di soldi",
    "Servizio clienti impeccabile",
    "Prodotto difettoso, deluso"
]
train_labels = [1, 0, 1, 0, 1, 0]

# Pipeline TF-IDF + Logistic Regression
pipe = Pipeline([
    ('tfidf', TfidfVectorizer(
        ngram_range=(1, 2),      # unigrammi e bigrammi
        max_features=50000,
        sublinear_tf=True        # log(1+tf) per attenuare frequenze alte
    )),
    ('clf', LogisticRegression(C=1.0, max_iter=1000))
])

pipe.fit(train_texts, train_labels)

# Valutazione
test_texts = ["Prodotto fantastico!", "Pessimo, non funziona"]
preds = pipe.predict(test_texts)
probs = pipe.predict_proba(test_texts)

for text, pred, prob in zip(test_texts, preds, probs):
    label = 'POSITIVO' if pred == 1 else 'NEGATIVO'
    confidence = max(prob)
    print(f"{text}: {label} ({confidence:.2f})")

1.3 çünkü BERT Üstündür

Duygu Analizi Yaklaşımlarının Karşılaştırılması

Yaklaşmak	Doğruluk (SST-2)	Gecikme	Eğitim Verileri	Zor Vakalar
VADER	~71%	<1ms	Hiç kimse	Nadir
TF-IDF + LR	~%85	~5ms	Gerekli	Orta
DistilBERT	~%91	~50ms	Gerekli	İyi
BERT-temel	~%93	~100ms	Gerekli	Optimum
Roberta	~%96	~100ms	Gerekli	Harika

2. Duyarlılık Analizi için Veri Kümesi

İnce ayarın kalitesi büyük ölçüde veri kümesinin kalitesine ve boyutuna bağlıdır. Bir sonraki makalede İtalyanca için endikasyonlarla birlikte İngilizce için en önemli olanları burada bulabilirsiniz.

from datasets import load_dataset

# SST-2: Stanford Sentiment Treebank (binario: positivo/negativo)
sst2 = load_dataset("glue", "sst2")
print(sst2)
# train: 67,349 esempi, validation: 872, test: 1,821

# IMDb Reviews (binario: positivo/negativo)
imdb = load_dataset("imdb")
print(imdb)
# train: 25,000, test: 25,000

# Amazon Reviews (1-5 stelle)
amazon = load_dataset("amazon_polarity")
print(amazon)
# train: 3,600,000, test: 400,000

# Esempio di esplorazione del dataset
print("\nSST-2 esempi:")
for i, example in enumerate(sst2['train'].select(range(3))):
    label = 'POSITIVO' if example['label'] == 1 else 'NEGATIVO'
    print(f"  [{label}] {example['sentence']}")

# Analisi distribuzione classi
from collections import Counter
labels = sst2['train']['label']
print("\nDistribuzione SST-2 train:", Counter(labels))
# Counter({1: 37569, 0: 29780}) - leggero sbilanciamento

3. HuggingFace ile ince ayarları tamamlayın

Veri hazırlığından eksiksiz bir duyarlılık sınıflandırıcısı oluşturuyoruz eğitilmiş modeli kaydederken.

3.1 Veri Hazırlama

from transformers import AutoTokenizer
from datasets import load_dataset, DatasetDict
import numpy as np

# Utilizziamo DistilBERT per velocità (97% di BERT, 60% più veloce)
MODEL_NAME = "distilbert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)

# Carica SST-2 da GLUE
dataset = load_dataset("glue", "sst2")

def tokenize_function(examples):
    return tokenizer(
        examples["sentence"],
        padding="max_length",
        truncation=True,
        max_length=128,
        return_tensors=None   # restituisce liste, non tensori
    )

# Tokenizzazione del dataset completo (con cache)
tokenized = dataset.map(
    tokenize_function,
    batched=True,
    batch_size=1000,
    remove_columns=["sentence", "idx"]  # rimuovi colonne non necessarie
)

# Formato PyTorch
tokenized.set_format("torch")
print(tokenized)
print("Colonne train:", tokenized['train'].column_names)
# ['input_ids', 'attention_mask', 'label']

3.2 Model Tanımı ve Eğitimi

from transformers import (
    AutoModelForSequenceClassification,
    TrainingArguments,
    Trainer
)
import evaluate
import numpy as np

# Modello con testa di classificazione
model = AutoModelForSequenceClassification.from_pretrained(
    MODEL_NAME,
    num_labels=2,
    id2label={0: "NEGATIVE", 1: "POSITIVE"},
    label2id={"NEGATIVE": 0, "POSITIVE": 1}
)

# Metriche di valutazione
accuracy = evaluate.load("accuracy")
f1 = evaluate.load("f1")

def compute_metrics(eval_pred):
    logits, labels = eval_pred
    predictions = np.argmax(logits, axis=-1)
    return {
        "accuracy": accuracy.compute(
            predictions=predictions, references=labels)["accuracy"],
        "f1": f1.compute(
            predictions=predictions, references=labels,
            average="binary")["f1"]
    }

# Configurazione training
training_args = TrainingArguments(
    output_dir="./results/distilbert-sst2",
    num_train_epochs=3,
    per_device_train_batch_size=32,
    per_device_eval_batch_size=64,
    warmup_ratio=0.1,
    weight_decay=0.01,
    learning_rate=2e-5,
    lr_scheduler_type="linear",
    evaluation_strategy="epoch",
    save_strategy="epoch",
    load_best_model_at_end=True,
    metric_for_best_model="f1",
    greater_is_better=True,
    logging_dir="./logs",
    logging_steps=100,
    fp16=True,          # Mixed precision (GPU con Tensor Cores)
    dataloader_num_workers=4,
    report_to="none",   # Disabilita wandb/tensorboard per semplicità
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized["train"],
    eval_dataset=tokenized["validation"],
    compute_metrics=compute_metrics,
)

# Avvia training
train_result = trainer.train()
print(f"Training loss: {train_result.training_loss:.4f}")

# Valutazione finale
metrics = trainer.evaluate()
print(f"Validation accuracy: {metrics['eval_accuracy']:.4f}")
print(f"Validation F1: {metrics['eval_f1']:.4f}")

# Salva modello e tokenizer
trainer.save_model("./models/distilbert-sst2")
tokenizer.save_pretrained("./models/distilbert-sst2")

3.3 Dengesiz Sınıfların Yönetimi

Birçok gerçek veri setinde (örneğin, müşteri destek incelemeleri) sınıflar güçlü bir şekilde dengesiz: %90 negatif, %10 pozitif. Önlemler olmadan model öğrenecek her zaman çoğunluk sınıfını tahmin etmek.

import torch
from torch import nn
from transformers import Trainer

# Soluzione 1: Weighted loss function
class WeightedTrainer(Trainer):
    def __init__(self, class_weights, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.class_weights = torch.tensor(class_weights, dtype=torch.float)

    def compute_loss(self, model, inputs, return_outputs=False):
        labels = inputs.get("labels")
        outputs = model(**inputs)
        logits = outputs.get("logits")

        # CrossEntropy con pesi inversamente proporzionali alla frequenza
        loss_fct = nn.CrossEntropyLoss(
            weight=self.class_weights.to(logits.device)
        )
        loss = loss_fct(logits.view(-1, self.model.config.num_labels),
                       labels.view(-1))
        return (loss, outputs) if return_outputs else loss

# Calcola pesi dalle frequenze del dataset
from sklearn.utils.class_weight import compute_class_weight
import numpy as np

labels = tokenized['train']['label'].numpy()
weights = compute_class_weight(
    class_weight='balanced',
    classes=np.unique(labels),
    y=labels
)
print("Class weights:", weights)  # es. [2.3, 0.7] se negativo e raro

# Soluzione 2: Oversampling con imbalanced-learn
# pip install imbalanced-learn
from imblearn.over_sampling import RandomOverSampler
# (applicabile alle feature matrix, non direttamente ai tensor)

# Soluzione 3: Metriche appropriate per sbilanciamento
from sklearn.metrics import classification_report
# Usa F1 macro o F1 per la classe minoritaria, non solo accuracy

4. İnce Taneli Duygu: Görünüşe Dayalı (ABSA)

İkili (olumlu/olumsuz) duygu analizi karmaşıklığı yakalayamıyor gerçek görüşler. Bir müşteri üründen memnun olabilir ancak gönderiden memnun değilim. 'Unsur Bazlı Duygu Analizi (ABSA) bahsedilen her bir hususa ilişkin duyguyu tanımlar.

from transformers import pipeline

# Zero-shot classification per ABSA
classifier = pipeline(
    "zero-shot-classification",
    model="facebook/bart-large-mnli"
)

review = "Il prodotto e eccellente ma la spedizione ha impiegato tre settimane. Il servizio clienti non ha risposto."

# Classificazione per ogni aspetto
aspects = ["prodotto", "spedizione", "servizio clienti"]
sentiments_per_aspect = {}

for aspect in aspects:
    # Prompt per ogni aspetto
    hypothesis = f"Il cliente e soddisfatto del {aspect}."
    result = classifier(
        review,
        candidate_labels=["positivo", "negativo", "neutro"],
        hypothesis_template=f"In questa recensione, il {{}} riguardo {aspect} e {{}}."
    )
    sentiments_per_aspect[aspect] = result['labels'][0]
    print(f"{aspect}: {result['labels'][0]} ({result['scores'][0]:.2f})")

# Output atteso:
# prodotto: positivo (0.89)
# spedizione: negativo (0.92)
# servizio clienti: negativo (0.87)

5. Zor Durumlar: İroni, İnkar, Belirsizlik

BERT modelleri birçok zor durumu klasik yöntemlere göre daha iyi ele alır, ama yanılmaz değiller. En yaygın vakaları nasıl analiz edeceğiniz ve azaltacağınız aşağıda açıklanmıştır.

5.1 İnkarın Yönetimi

from transformers import pipeline

classifier = pipeline(
    "text-classification",
    model="distilbert-base-uncased-finetuned-sst-2-english"
)

# Test su casi di negazione
negation_examples = [
    "This is not bad at all",        # doppia negazione = positivo
    "I wouldn't say it's terrible",  # negazione attenuante
    "Not the worst, but not great",  # ambiguo
    "Far from perfect",              # negazione implicita
    "Could have been worse",         # comparativo negativo-positivo
]

for text in negation_examples:
    result = classifier(text)[0]
    print(f"'{text}'")
    print(f"  -> {result['label']} ({result['score']:.3f})\n")

# BERT gestisce bene "not bad" -> POSITIVE
# Ma può sbagliare con negazioni complesse e indirette

5.2 Hata Analizi

import pandas as pd
from sklearn.metrics import confusion_matrix, classification_report
import matplotlib.pyplot as plt
import seaborn as sns

def analyze_errors(texts, true_labels, predicted_labels, probs):
    """Analisi dettagliata degli errori del modello."""
    results = pd.DataFrame({
        'text': texts,
        'true_label': true_labels,
        'pred_label': predicted_labels,
        'confidence': [max(p) for p in probs],
        'correct': [t == p for t, p in zip(true_labels, predicted_labels)]
    })

    # Falsi positivi: modello dice POSITIVO ma e NEGATIVO
    fp = results[(results['true_label'] == 0) & (results['pred_label'] == 1)]
    print(f"Falsi Positivi ({len(fp)}):")
    for _, row in fp.head(5).iterrows():
        print(f"  Conf={row['confidence']:.2f}: {row['text'][:80]}")

    # Falsi negativi: modello dice NEGATIVO ma e POSITIVO
    fn = results[(results['true_label'] == 1) & (results['pred_label'] == 0)]
    print(f"\nFalsi Negativi ({len(fn)}):")
    for _, row in fn.head(5).iterrows():
        print(f"  Conf={row['confidence']:.2f}: {row['text'][:80]}")

    # Confusion matrix
    cm = confusion_matrix(true_labels, predicted_labels)
    print(f"\nClassification Report:\n")
    print(classification_report(true_labels, predicted_labels,
                                target_names=['NEGATIVO', 'POSITIVO']))

    return results

6. FastAPI ile devreye alma

Bir duyarlılık analizi modeli yalnızca üretimde erişilebilir olması durumunda değerlidir. FastAPI ile hızlı ve ölçeklenebilir bir REST uç noktasının nasıl oluşturulacağı aşağıda açıklanmıştır.

# sentiment_api.py
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel, validator
from transformers import pipeline
from typing import List
import time

app = FastAPI(title="Sentiment Analysis API", version="1.0")

# Carica il modello una sola volta all'avvio
MODEL_PATH = "./models/distilbert-sst2"
sentiment_pipeline = pipeline(
    "text-classification",
    model=MODEL_PATH,
    device=-1,              # -1 = CPU, 0 = prima GPU
    batch_size=32,          # batch inference per efficienza
    truncation=True,
    max_length=128
)

class SentimentRequest(BaseModel):
    texts: List[str]

    @validator('texts')
    def validate_texts(cls, texts):
        if not texts:
            raise ValueError("Lista testi non può essere vuota")
        if len(texts) > 100:
            raise ValueError("Massimo 100 testi per richiesta")
        for text in texts:
            if len(text) > 5000:
                raise ValueError("Testo troppo lungo (max 5000 caratteri)")
        return texts

class SentimentResult(BaseModel):
    text: str
    label: str
    score: float
    processing_time_ms: float

@app.post("/predict", response_model=List[SentimentResult])
async def predict_sentiment(request: SentimentRequest):
    start = time.time()
    try:
        results = sentiment_pipeline(request.texts)
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

    elapsed = (time.time() - start) * 1000
    per_text = elapsed / len(request.texts)

    return [
        SentimentResult(
            text=text,
            label=r['label'],
            score=r['score'],
            processing_time_ms=per_text
        )
        for text, r in zip(request.texts, results)
    ]

@app.get("/health")
def health_check():
    return {"status": "ok", "model": MODEL_PATH}

# Avvio: uvicorn sentiment_api:app --host 0.0.0.0 --port 8000

7. Gecikme için Optimizasyon

Üretimde gecikme genellikle kritik öneme sahiptir. İşte ana teknikler çok fazla kalite kaybı olmadan çıkarım süresini azaltmak için.

7.1 Dinamik Kuantizasyon

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model = AutoModelForSequenceClassification.from_pretrained("./models/distilbert-sst2")
tokenizer = AutoTokenizer.from_pretrained("./models/distilbert-sst2")

# Quantizzazione dinamica (INT8): riduce dimensione e aumenta velocità su CPU
quantized_model = torch.quantization.quantize_dynamic(
    model,
    {torch.nn.Linear},  # quantizza solo i layer Linear
    dtype=torch.qint8
)

# Confronto dimensioni
import os
def model_size(m):
    torch.save(m.state_dict(), "tmp.pt")
    size = os.path.getsize("tmp.pt") / (1024 * 1024)
    os.remove("tmp.pt")
    return size

print(f"Modello originale: {model_size(model):.1f} MB")
print(f"Modello quantizzato: {model_size(quantized_model):.1f} MB")
# Originale: ~250 MB, Quantizzato: ~65 MB

# Benchmark velocità
import time

def benchmark(m, tokenizer, texts, n_runs=50):
    inputs = tokenizer(texts, return_tensors='pt',
                      padding=True, truncation=True, max_length=128)
    with torch.no_grad():
        # Warm-up
        for _ in range(5):
            _ = m(**inputs)
        # Benchmark
        start = time.time()
        for _ in range(n_runs):
            _ = m(**inputs)
        elapsed = (time.time() - start) / n_runs * 1000
    return elapsed

texts = ["This product is amazing!"] * 8  # batch di 8
t_orig = benchmark(model, tokenizer, texts)
t_quant = benchmark(quantized_model, tokenizer, texts)
print(f"Originale: {t_orig:.1f}ms, Quantizzato: {t_quant:.1f}ms")
print(f"Speedup: {t_orig/t_quant:.2f}x")

7.2 Dağıtım için ONNX'i Dışa Aktarma

from optimum.onnxruntime import ORTModelForSequenceClassification
from transformers import AutoTokenizer
import numpy as np
import time

# Converti in ONNX con HuggingFace Optimum
# pip install optimum[onnxruntime]
model_onnx = ORTModelForSequenceClassification.from_pretrained(
    "./models/distilbert-sst2",
    export=True,          # esporta in ONNX al primo caricamento
    provider="CPUExecutionProvider"
)
tokenizer = AutoTokenizer.from_pretrained("./models/distilbert-sst2")

# Inferenza con ONNX Runtime
text = "This product exceeded all my expectations!"
inputs = tokenizer(text, return_tensors='pt', truncation=True, max_length=128)

start = time.time()
outputs = model_onnx(**inputs)
latency = (time.time() - start) * 1000

import torch
probs = torch.softmax(outputs.logits, dim=-1)
label = model_onnx.config.id2label[probs.argmax().item()]
confidence = probs.max().item()

print(f"Label: {label}")
print(f"Confidence: {confidence:.3f}")
print(f"Latency: {latency:.1f}ms")
# ONNX e tipicamente 2-4x più veloce della versione PyTorch su CPU

8. Tam Değerlendirme ve Raporlama

from sklearn.metrics import (
    classification_report,
    roc_auc_score,
    average_precision_score,
    confusion_matrix
)
import numpy as np

def evaluate_sentiment_model(model, tokenizer, test_texts, test_labels,
                              batch_size=64):
    """Valutazione completa del modello di sentiment."""
    all_probs = []
    all_preds = []

    for i in range(0, len(test_texts), batch_size):
        batch = test_texts[i:i+batch_size]
        inputs = tokenizer(
            batch, return_tensors='pt', padding=True,
            truncation=True, max_length=128
        )
        with torch.no_grad():
            outputs = model(**inputs)
        probs = torch.softmax(outputs.logits, dim=-1).numpy()
        preds = np.argmax(probs, axis=1)
        all_probs.extend(probs[:, 1])  # probabilità classe positiva
        all_preds.extend(preds)

    # Report principale
    print("=== Classification Report ===")
    print(classification_report(
        test_labels, all_preds,
        target_names=['NEGATIVE', 'POSITIVE'],
        digits=4
    ))

    # Metriche aggiuntive
    auc = roc_auc_score(test_labels, all_probs)
    ap = average_precision_score(test_labels, all_probs)
    print(f"AUC-ROC:            {auc:.4f}")
    print(f"Average Precision:  {ap:.4f}")

    # Analisi errori per fascia di confidenza
    all_probs = np.array(all_probs)
    all_preds = np.array(all_preds)
    test_labels = np.array(test_labels)

    for threshold in [0.5, 0.7, 0.9]:
        high_conf = all_probs >= threshold
        if high_conf.sum() > 0:
            acc_high = (all_preds[high_conf] == test_labels[high_conf]).mean()
            print(f"Accuracy (conf >= {threshold}): {acc_high:.4f} "
                  f"({high_conf.sum()} esempi)")

    return np.array(all_probs), np.array(all_preds)

9. Üretim için Optimizasyon: ONNX ve Niceleme

BERT modelleri önemli hesaplama kaynakları gerektirir. Uygulamalar için düşük gecikme süresinde veya sınırlı donanımda farklı optimizasyon stratejileri vardır Bu, kaliteden ödün vermeden çıkarım sürelerini büyük ölçüde azaltır.

Optimizasyon Stratejilerinin Karşılaştırılması

Strateji	Gecikme Azaltma	Model Küçültme	Kalite kaybı	Karmaşıklık
ONNX Dışa Aktarma	2-4x	~%10	<%0,1	Düşük
Dinamik Niceleme (INT8)	2-3x	%75	%0,5-1	Düşük
Statik Niceleme (INT8)	3-5x	%75	%0,3-0,8	Ortalama
DistilBERT (KD)	2x	%40	3%	Ortalama
TorchScript	1,5-2x	Hiçbiri	<%0,1	Düşük

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from optimum.onnxruntime import ORTModelForSequenceClassification
import torch
import time

# ---- Esportazione ONNX con Optimum ----
model_path = "./models/distilbert-sentiment"

# Esportazione e ottimizzazione ONNX in un comando
ort_model = ORTModelForSequenceClassification.from_pretrained(
    model_path,
    export=True,       # Esporta automaticamente in ONNX
    provider="CPUExecutionProvider"
)
tokenizer = AutoTokenizer.from_pretrained(model_path)

# Salva modello ONNX
ort_model.save_pretrained("./models/distilbert-sentiment-onnx")

# ---- Benchmark: PyTorch vs ONNX ----
def benchmark_model(predict_fn, texts, n_runs=100):
    """Misura latenza media su n_runs inferenze."""
    # Warmup
    for _ in range(10):
        predict_fn(texts[0])

    times = []
    for text in texts[:n_runs]:
        start = time.perf_counter()
        predict_fn(text)
        times.append((time.perf_counter() - start) * 1000)

    import numpy as np
    return {
        "mean_ms": round(np.mean(times), 2),
        "p50_ms":  round(np.percentile(times, 50), 2),
        "p95_ms":  round(np.percentile(times, 95), 2),
        "p99_ms":  round(np.percentile(times, 99), 2),
    }

# Carica modello PyTorch originale per confronto
pt_model = AutoModelForSequenceClassification.from_pretrained(model_path)
pt_model.eval()

def pt_predict(text):
    inputs = tokenizer(text, return_tensors='pt', truncation=True, max_length=128)
    with torch.no_grad():
        return pt_model(**inputs).logits

def onnx_predict(text):
    inputs = tokenizer(text, return_tensors='pt', truncation=True, max_length=128)
    return ort_model(**inputs).logits

test_texts = ["Prodotto ottimo, lo consiglio!"] * 100

pt_stats = benchmark_model(pt_predict, test_texts)
onnx_stats = benchmark_model(onnx_predict, test_texts)

print("PyTorch:  ", pt_stats)
print("ONNX:     ", onnx_stats)
print(f"Speedup: {pt_stats['p95_ms'] / onnx_stats['p95_ms']:.1f}x")

# Quantizzazione dinamica con PyTorch (nessun dato di calibrazione)
import torch

def quantize_bert_dynamic(model_path: str, output_path: str):
    """Quantizzazione INT8 dinamica per CPU inference."""
    from transformers import AutoModelForSequenceClassification

    model = AutoModelForSequenceClassification.from_pretrained(model_path)
    model.eval()

    # Quantizza solo i layer Linear (nn.Linear) dinamicamente
    quantized = torch.quantization.quantize_dynamic(
        model,
        {torch.nn.Linear},
        dtype=torch.qint8
    )

    # Salva il modello quantizzato
    torch.save(quantized.state_dict(), f"{output_path}/quantized_model.pt")

    # Confronto dimensioni
    import os
    original_size = sum(
        os.path.getsize(f"{model_path}/{f}")
        for f in os.listdir(model_path) if f.endswith('.bin')
    ) / 1024 / 1024

    print(f"Modello originale: ~{original_size:.0f} MB")
    print(f"Riduzione stimata: ~75% → ~{original_size * 0.25:.0f} MB")

    return quantized

# Esempio di utilizzo
# quantized_model = quantize_bert_dynamic(
#     "./models/distilbert-sentiment",
#     "./models/quantized"
# )

10. Üretim İçin En İyi Uygulamalar

Anti-Desen: Ham Deseni Doğrulama Olmadan Kullanmayın

SST-2 (film incelemeleri) üzerine eğitilmiş bir model düşük performans gösterebilir teknik destek biletleri veya sosyal medya gönderileri. Modeli her zaman doğrula dağıtımdan önce kendi etki alanınızda.

Üretimde Dağıtım Kontrol Listesi

Modeli hedef alan verilerine göre değerlendirin (yalnızca genel kıyaslamalara göre değil)
Güven eşiklerini ayarlayın: eşiğin altındaki "belirsiz" değerini döndürün (ör. 0,6)
Güven puanının zaman içindeki dağılımını izleyin
Yanlış etiketleri toplamak için bir geri bildirim mekanizması uygulayın
Hem modeli hem de belirteci birlikte sürümlendirin
Anormal girişte test davranışı (boş metin, özel karakterler, aşırı uzunluklar)
API için hız sınırlaması ve zaman aşımları uygulayın
Post-hoc analiz için tüm tahminleri günlüğe kaydedin

class ProductionSentimentClassifier:
    """Classificatore di sentiment pronto per la produzione."""

    def __init__(self, model_path: str, confidence_threshold: float = 0.7):
        self.pipeline = pipeline(
            "text-classification",
            model=model_path,
            truncation=True,
            max_length=128
        )
        self.threshold = confidence_threshold

    def predict(self, text: str) -> dict:
        # Validazione input
        if not text or not text.strip():
            return {"label": "UNKNOWN", "score": 0.0, "reason": "empty_input"}

        text = text.strip()[:5000]  # Trunca testi troppo lunghi

        result = self.pipeline(text)[0]

        # Gestione incertezza
        if result['score'] < self.threshold:
            return {
                "label": "UNCERTAIN",
                "score": result['score'],
                "raw_label": result['label'],
                "reason": "below_confidence_threshold"
            }

        return {
            "label": result['label'],
            "score": result['score'],
            "reason": "ok"
        }

    def predict_batch(self, texts: list) -> list:
        # Filtra testi vuoti mantenendo la posizione
        valid_texts = [t.strip()[:5000] if t and t.strip() else "" for t in texts]
        results = self.pipeline(valid_texts)
        return [
            self.predict(t) if t else {"label": "UNKNOWN", "score": 0.0}
            for t in valid_texts
        ]

Sonuçlar ve Sonraki Adımlar

Bu makalede bir duyarlılık analizi sisteminin tüm yaşam döngüsünü ele aldık: klasik yaklaşımlardan (VADER, TF-IDF) Transformer modellerinin ince ayarına kadar, FastAPI ile dengesiz verileri yönetmekten üretime geçirmeye kadar ve gecikme optimizasyonu.

Önemli Noktalar

İhtiyaçlarınıza göre yaklaşımı seçin: Hız için VADER, kalite için BERT
Her zaman değerlendir alanınız yalnızca kıyaslamalarda değil, spesifik
Ağırlıklı kayıp veya aşırı örnekleme ile dengesiz sınıfları ele alın
Zorunlu tahminler yerine üretimde güven eşiklerini kullanın
DistilBERT, üretim için mükemmel bir hız/kalite uzlaşması sunar
Veri kaymasını tespit etmek için zaman içindeki tahminleri izleyin

Seri devam ediyor

Sonraki: İtalyanca için NLP — hisset, AlBERTo ve İtalya'nın kendine özgü zorlukları
Madde 5: Adlandırılmış Varlık Tanıma — metinden varlıkları çıkarın
Madde 6: Çok Etiketli Metin Sınıflandırması — bir metin birden fazla kategoriye ait olduğunda
Madde 7: HuggingFace Transformers: Tam Kılavuz — API Eğitmeni, Veri Kümeleri, Hub
Madde 10: Üretimde NLP İzleme — sürüklenme tespiti ve otomatik yeniden eğitim