Hallo! Ik ben

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

Neem Contact Op

Over Mij

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

Mijn Vaardigheden

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

Procesautomatisering

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

Maatwerksystemen

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

Mijn Missie

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

Technologie Democratiseren

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

IT en Business Verenigen

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

Maatwerkoplossingen Creëren

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

Transformeer Uw Bedrijf met Technologie

Che tu gestisca un negozio, uno studio professionale o un'azienda, posso aiutarti a sfruttare le potenzialità dell'informatica per lavorare meglio, più velocemente e in modo più intelligente.

Laten We Praten →

Unisciti alla Community

Entra nella community di sviluppatori dove discutiamo di software, AI, architettura e DevOps. Condividi idee, fai domande e cresci insieme a noi.

Canale

FC Dev Blog

Ricevi notifiche su nuovi articoli, serie complete, tips settimanali e tool in evidenza. Contenuti bilingui IT/EN direttamente nel tuo Telegram.

Nuovi articoli appena pubblicati
Tips e code snippets settimanali
Sondaggi sugli argomenti futuri

Iscriviti al Canale

Gruppo

FC Dev Community

Una community bilingue IT/EN per sviluppatori. Discussioni, Q&A, aiuto reciproco e networking con altri professionisti del settore.

Discussioni su articoli e tecnologie
Help coding e code review
Opportunità di lavoro e collaborazione

Unisciti al Gruppo

Topic di Discussione

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

Linguaggi & Tecnologie

Java

Python

JavaScript

Angular

React

TypeScript

SQL

PHP

CSS/SCSS

Node.js

Docker

Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

Neem Contact Op

Heeft u een project in gedachten? Laten we praten! Vul het formulier in en ik reageer snel.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

Samenvatting van juridische documenten met generatieve AI

Een bedrijfsfusieovereenkomst beslaat vaak meer dan 300 pagina's. Een procesdossier bevat er duizenden. Toch moet een jurist of juridisch analist deze documenten vandaag de dag lezen, begrijpen en samenvatten steeds gecomprimeerde tijden. Daar Generatieve AI en in het bijzonder ik Grote taalmodellen (LLM) transformeren dit proces radicaal en brengen de automatische samenvatting van academisch experiment tot productietool in advocatenkantoren en in juridische afdelingen van bedrijven.

In dit artikel verkennen we de volledige technische pijplijn voor het samenvatten van juridische documenten: van tekstopname en chunking tot MapReduce en hiërarchische samenvattingsstrategieën, tot het verfijnen van gespecialiseerde modellen en het vermijden van outputvalidatie hallucinatie en kritische omissies. We zullen echte Python-code schrijven, vergelijken de belangrijkste raamwerken en bespreek de praktische implicaties voor degenen die LegalTech-producten bouwen.

Wat je gaat leren

Chunkingstrategieën voor lange juridische documenten (MapReduce, Hiërarchisch, Verfijnen)
Geavanceerde snelle engineering voor juridische samenvattingen
Verfijning van LLM op juridisch corpus met LoRA/QLoRA
Outputvalidatie: ROUGE, BERTScore en human-in-the-loop
Productieklare pijplijn met LangChain en LlamaIndex

Het probleem: juridische documenten en tokenlimieten

LLM-modellen hebben beperkte contextvensters. GPT-4 Turbo gaat naar 128.000 tokens, Claude 3.5 tot 200.000, maar een complex contract met bijlagen kan deze limieten gemakkelijk overschrijden – zonder te tellen Het in één keer verwerken van het hele document is duur en levert vaak uitvoer van lage kwaliteit op.

Het specifieke probleem van juridische teksten is dat elke clausule kan afhangen van de definities die erin voorkomen verschillende secties. Een in Artikel 1 gedefinieerde “Gebeurtenis van Wanprestatie” geeft aanleiding tot de beschreven gevolgen in artikel 12. Een naïeve samenvattingsstrategie die opeenvolgende stukken verwerkt, kan deze over het hoofd zien kritische afhankelijkheden.

De drie belangrijkste strategieën voor het beheren van lange documenten zijn:

KaartVerminderen: elk deel wordt afzonderlijk samengevat, waarna de samenvattingen komen samengevoegd tot een eindsamenvatting. Snel en parallelliseerbaar, maar verliest de context tussen de delen.
Hiërarchisch / Boomgebaseerd: brokken zijn semantisch gegroepeerd, samengevat op elk niveau van de hiërarchie. Behoudt de documentstructuur beter.
Verfijnen: de samenvatting wordt geleidelijk verfijnd door nieuwe stukjes toe te voegen. Nauwkeuriger, maar opeenvolgend en langzaam.

Intelligente chunking voor juridische teksten

Voorafgaand aan elke samenvattende strategie moet er sprake zijn van chunking semantisch coherent met de structuur van het juridische document. Als je een artikel in het midden afbreekt, wordt de context vernietigd. De oplossing en op structuur gebaseerde chunking: artikelen, secties, clausules als atomaire eenheden.

import re
from dataclasses import dataclass
from typing import List, Optional

@dataclass
class LegalChunk:
    """Rappresenta un chunk semantico di un documento legale."""
    chunk_id: str
    article_number: Optional[str]
    section_title: str
    content: str
    token_count: int
    metadata: dict

class LegalDocumentChunker:
    """
    Chunker specializzato per documenti legali strutturati.
    Rispetta i confini di articoli, sezioni e clausole.
    """

    # Pattern per rilevare inizi di articoli/sezioni
    ARTICLE_PATTERN = re.compile(
        r'^(ARTICOLO|ART\.|ARTICLE|SECTION|CLAUSOLA|CLAUSE)\s+(\d+[a-z]?)',
        re.IGNORECASE | re.MULTILINE
    )

    def __init__(self, max_tokens: int = 4000, overlap_tokens: int = 200):
        self.max_tokens = max_tokens
        self.overlap_tokens = overlap_tokens

    def chunk_document(self, text: str, doc_metadata: dict) -> List[LegalChunk]:
        """
        Splitta un documento nelle sue unita semantiche principali.
        Prima prova a rispettare i confini strutturali,
        poi applica fallback a chunk di dimensione fissa.
        """
        chunks = []
        sections = self._split_by_structure(text)

        for idx, section in enumerate(sections):
            token_count = self._estimate_tokens(section['content'])

            if token_count <= self.max_tokens:
                # Sezione abbastanza piccola: usala come chunk atomico
                chunk = LegalChunk(
                    chunk_id=f"chunk_{idx:04d}",
                    article_number=section.get('article_number'),
                    section_title=section.get('title', 'Sezione senza titolo'),
                    content=section['content'],
                    token_count=token_count,
                    metadata={**doc_metadata, 'section_index': idx}
                )
                chunks.append(chunk)
            else:
                # Sezione troppo lunga: applica sliding window con overlap
                sub_chunks = self._sliding_window_split(
                    section['content'],
                    section.get('article_number'),
                    section.get('title', ''),
                    doc_metadata,
                    idx
                )
                chunks.extend(sub_chunks)

        return chunks

    def _split_by_structure(self, text: str) -> List[dict]:
        """Identifica confini naturali del documento legale."""
        sections = []
        matches = list(self.ARTICLE_PATTERN.finditer(text))

        if not matches:
            # Nessuna struttura rilevata: documento come singolo blocco
            return [{'content': text, 'title': 'Documento', 'article_number': None}]

        for i, match in enumerate(matches):
            start = match.start()
            end = matches[i + 1].start() if i + 1 < len(matches) else len(text)
            sections.append({
                'article_number': match.group(2),
                'title': match.group(0),
                'content': text[start:end].strip()
            })

        return sections

    def _estimate_tokens(self, text: str) -> int:
        """Stima approssimativa: 1 token ~= 4 caratteri per italiano/inglese."""
        return len(text) // 4

    def _sliding_window_split(self, text, article_num, title, metadata, base_idx):
        """Fallback: sliding window con overlap semantico."""
        words = text.split()
        chunk_size_words = self.max_tokens * 3  # approssimazione parole
        overlap_words = self.overlap_tokens * 3
        sub_chunks = []
        start = 0
        sub_idx = 0

        while start < len(words):
            end = min(start + chunk_size_words, len(words))
            chunk_text = ' '.join(words[start:end])
            sub_chunks.append(LegalChunk(
                chunk_id=f"chunk_{base_idx:04d}_{sub_idx:02d}",
                article_number=article_num,
                section_title=f"{title} (parte {sub_idx + 1})",
                content=chunk_text,
                token_count=self._estimate_tokens(chunk_text),
                metadata={**metadata, 'section_index': base_idx, 'sub_index': sub_idx}
            ))
            start += chunk_size_words - overlap_words
            sub_idx += 1

        return sub_chunks

MapReduce-strategie met LangChain

De MapReduce-strategie is de meest voorkomende in productie omdat deze parallelleerbaar en schaalbaar is. Elk deel wordt onafhankelijk verwerkt (kaartfase), waarna gedeeltelijke samenvattingen komen gecombineerd (Fase verminderen). LangChain biedt kant-en-klare implementaties.

from langchain.chains.summarize import load_summarize_chain
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.schema import Document
from typing import List
import asyncio

# Prompt specializzato per il Map step (riassunto di singoli chunk)
MAP_PROMPT_TEMPLATE = """Sei un analista legale esperto. Riassumi il seguente estratto
di documento legale, preservando:
1. Obblighi e diritti delle parti
2. Scadenze e date critiche
3. Condizioni e clausole risolutive
4. Definizioni tecniche importanti
5. Penali e conseguenze di inadempimento

Estratto:
{text}

RIASSUNTO STRUTTURATO:"""

# Prompt per il Reduce step (sintesi finale dei riassunti parziali)
REDUCE_PROMPT_TEMPLATE = """Sei un senior legal counsel. Hai davanti i riassunti
delle varie sezioni di un documento legale. Produci un executive summary che:
1. Identifichi le parti contraenti e l'oggetto del contratto
2. Sintetizzi i principali obblighi di ciascuna parte
3. Evidenzi i rischi legali più rilevanti
4. Elenchi le date e scadenze critiche
5. Segnali le clausole potenzialmente controverse

Riassunti delle sezioni:
{text}

EXECUTIVE SUMMARY LEGALE:"""

class LegalMapReduceSummarizer:
    """
    Pipeline MapReduce asincrona per summarization di contratti.
    Supporta parallelismo controllato per rispettare i rate limit API.
    """

    def __init__(
        self,
        model_name: str = "gpt-4o",
        max_concurrent: int = 5,
        temperature: float = 0.1  # bassa temperatura per output deterministici
    ):
        self.llm = ChatOpenAI(model=model_name, temperature=temperature)
        self.max_concurrent = max_concurrent
        self.semaphore = asyncio.Semaphore(max_concurrent)

        self.map_prompt = PromptTemplate(
            template=MAP_PROMPT_TEMPLATE,
            input_variables=["text"]
        )
        self.reduce_prompt = PromptTemplate(
            template=REDUCE_PROMPT_TEMPLATE,
            input_variables=["text"]
        )

    async def summarize_chunk(self, chunk: LegalChunk) -> dict:
        """Riassume un singolo chunk (fase Map)."""
        async with self.semaphore:
            doc = Document(page_content=chunk.content)
            chain = load_summarize_chain(
                self.llm,
                chain_type="stuff",  # per chunk singoli
                prompt=self.map_prompt
            )
            result = await chain.ainvoke({"input_documents": [doc]})
            return {
                'chunk_id': chunk.chunk_id,
                'article_number': chunk.article_number,
                'section_title': chunk.section_title,
                'summary': result['output_text']
            }

    async def summarize_document(self, chunks: List[LegalChunk]) -> dict:
        """
        Pipeline completa: Map parallelo + Reduce sequenziale.
        """
        print(f"Avvio Map su {len(chunks)} chunk in parallelo...")

        # Fase Map: summarization parallela di tutti i chunk
        map_tasks = [self.summarize_chunk(chunk) for chunk in chunks]
        chunk_summaries = await asyncio.gather(*map_tasks)

        print(f"Map completato. Avvio Reduce su {len(chunk_summaries)} riassunti...")

        # Fase Reduce: sintesi finale
        combined_text = "\n\n---\n\n".join([
            f"SEZIONE: {s['section_title']}\n{s['summary']}"
            for s in chunk_summaries
        ])

        reduce_doc = Document(page_content=combined_text)
        reduce_chain = load_summarize_chain(
            self.llm,
            chain_type="stuff",
            prompt=self.reduce_prompt
        )
        final_result = await reduce_chain.ainvoke({
            "input_documents": [reduce_doc]
        })

        return {
            'executive_summary': final_result['output_text'],
            'chunk_summaries': chunk_summaries,
            'total_chunks_processed': len(chunks)
        }

# Utilizzo
async def main():
    chunker = LegalDocumentChunker(max_tokens=3500)
    summarizer = LegalMapReduceSummarizer(model_name="gpt-4o")

    with open("contratto_fornitura.txt", "r") as f:
        text = f.read()

    chunks = chunker.chunk_document(text, {'doc_type': 'supply_contract', 'doc_id': 'SC-2025-001'})
    result = await summarizer.summarize_document(chunks)

    print("=== EXECUTIVE SUMMARY ===")
    print(result['executive_summary'])

Finetuning met LoRA voor het juridische domein

Modellen voor algemeen gebruik, zoals GPT-4, produceren samenvattingen van goede kwaliteit, maar ontbreken vaak van specifieke technisch-juridische terminologie en hebben de neiging juridische formules te ‘normaliseren’ normen in de gemeenschappelijke taal, waardoor de nauwkeurigheid verloren gaat. De verfijning met LoRA (Low-Rank Aanpassing) Hiermee kunt u zich specialiseren in een open-sourcemodel zoals Llama-3 of Mistral op een corpus van contracten zonder dat zakelijke GPU's nodig zijn.

from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    TrainingArguments,
    Trainer,
    DataCollatorForSeq2Seq
)
from peft import LoraConfig, get_peft_model, TaskType
from datasets import Dataset
import torch
import json

def prepare_legal_dataset(jsonl_path: str) -> Dataset:
    """
    Carica e formatta il dataset di addestramento.
    Formato atteso: {"document": "...", "summary": "..."} per riga
    """
    data = []
    with open(jsonl_path, 'r') as f:
        for line in f:
            item = json.loads(line.strip())
            # Template di istruzione per il modello
            prompt = (
                f"### Istruzione:\nRiassumi questo documento legale in italiano "
                f"mantenendo la terminologia giuridica precisa.\n\n"
                f"### Documento:\n{item['document']}\n\n"
                f"### Riassunto:\n"
            )
            full_text = prompt + item['summary']
            data.append({'text': full_text, 'prompt_len': len(prompt)})

    return Dataset.from_list(data)

def setup_lora_model(base_model_id: str = "mistralai/Mistral-7B-Instruct-v0.3"):
    """
    Carica Mistral-7B e applica LoRA per fine-tuning efficiente.
    Richiede ~16GB VRAM (4-bit quantization).
    """
    from transformers import BitsAndBytesConfig

    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16
    )

    tokenizer = AutoTokenizer.from_pretrained(base_model_id)
    tokenizer.pad_token = tokenizer.eos_token

    model = AutoModelForCausalLM.from_pretrained(
        base_model_id,
        quantization_config=bnb_config,
        device_map="auto"
    )

    # Configurazione LoRA: adattiamo solo i layer di attenzione
    lora_config = LoraConfig(
        task_type=TaskType.CAUSAL_LM,
        r=16,               # rank della decomposizione
        lora_alpha=32,      # scaling factor
        target_modules=["q_proj", "v_proj", "k_proj", "o_proj"],
        lora_dropout=0.05,
        bias="none"
    )

    model = get_peft_model(model, lora_config)
    model.print_trainable_parameters()
    # Output: trainable params: 13,631,488 || all params: 3,765,006,336 || trainable%: 0.36

    return model, tokenizer

def train_legal_summarizer(
    dataset_path: str,
    output_dir: str,
    num_epochs: int = 3
):
    """Fine-tuning completo del modello legale."""
    model, tokenizer = setup_lora_model()
    dataset = prepare_legal_dataset(dataset_path)

    # Split train/eval
    split = dataset.train_test_split(test_size=0.1)

    training_args = TrainingArguments(
        output_dir=output_dir,
        num_train_epochs=num_epochs,
        per_device_train_batch_size=2,
        per_device_eval_batch_size=2,
        gradient_accumulation_steps=8,
        learning_rate=2e-4,
        warmup_ratio=0.1,
        lr_scheduler_type="cosine",
        logging_steps=50,
        evaluation_strategy="epoch",
        save_strategy="epoch",
        load_best_model_at_end=True,
        bf16=True,
        report_to="wandb",  # o "tensorboard"
    )

    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=split['train'],
        eval_dataset=split['test'],
        data_collator=DataCollatorForSeq2Seq(tokenizer, model=model, padding=True)
    )

    trainer.train()
    model.save_pretrained(f"{output_dir}/lora_weights")
    tokenizer.save_pretrained(f"{output_dir}/tokenizer")

Outputvalidatie: hallucinaties vermijden

In het juridische domein is een hallucinatie geen simpele kwaliteitsfout: het kan gevolgen hebben rampzalig. Een samenvatting waarin sprake is van een niet-bestaand boetebeding, of waarin een termijn wordt weggelaten Cruciaal is dat het kan leiden tot onjuiste beslissingen met aanzienlijke economische en juridische gevolgen.

De validatiestrategie moet op meerdere niveaus werken:

Risico's van hallucinatie in het juridische domein

2025 Stanford-onderzoek documenteert dat toonaangevende AI-systemen voor juridisch onderzoek (Westlaw AI, LexisNexis Lexis+) presenteren hallucinatiepercentages tussen 17% en 33% op specifieke vragen. Controleer de AI-uitvoer altijd met primaire bronnen.

from rouge_score import rouge_scorer
from sentence_transformers import SentenceTransformer, util
import numpy as np
from dataclasses import dataclass, field

@dataclass
class ValidationResult:
    """Risultato della validazione di un riassunto legale."""
    rouge_l: float
    bert_score: float
    citation_coverage: float  # % di riferimenti normativi coperti
    date_accuracy: float       # % di date correttamente estratte
    passed: bool
    warnings: list = field(default_factory=list)

class LegalSummaryValidator:
    """
    Validatore multi-dimensionale per riassunti legali.
    Combina metriche automatiche con check rule-based.
    """

    def __init__(self):
        self.rouge = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True)
        self.bert_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-mpnet-base-v2')
        self.date_pattern = re.compile(
            r'\b(\d{1,2}[\/\-\.]\d{1,2}[\/\-\.]\d{2,4}|\d{4}[\/\-\.]\d{1,2}[\/\-\.]\d{1,2})\b'
        )
        self.article_pattern = re.compile(r'\bArt\.\s*\d+|Articolo\s+\d+', re.IGNORECASE)

    def validate(self, original_text: str, summary: str) -> ValidationResult:
        """Esegue validazione completa del riassunto."""
        warnings = []

        # 1. ROUGE-L: misura sovrapposizione sequenze
        rouge_scores = self.rouge.score(original_text, summary)
        rouge_l = rouge_scores['rougeL'].fmeasure

        # 2. BERTScore semantico: embedding similarity
        orig_embed = self.bert_model.encode(original_text[:5000], convert_to_tensor=True)
        summ_embed = self.bert_model.encode(summary, convert_to_tensor=True)
        bert_score = float(util.cos_sim(orig_embed, summ_embed))

        # 3. Verifica copertura date critiche
        dates_in_original = set(self.date_pattern.findall(original_text))
        dates_in_summary = set(self.date_pattern.findall(summary))
        if dates_in_original:
            date_accuracy = len(dates_in_original & dates_in_summary) / len(dates_in_original)
        else:
            date_accuracy = 1.0

        if date_accuracy < 0.8:
            warnings.append(f"Date mancanti nel riassunto: {dates_in_original - dates_in_summary}")

        # 4. Verifica riferimenti normativi
        articles_original = set(self.article_pattern.findall(original_text))
        articles_summary = set(self.article_pattern.findall(summary))
        citation_coverage = (
            len(articles_original & articles_summary) / len(articles_original)
            if articles_original else 1.0
        )

        # 5. Check lunghezza (riassunto non deve essere più lungo dell'originale)
        compression_ratio = len(summary) / len(original_text)
        if compression_ratio > 0.5:
            warnings.append(f"Compression ratio basso: {compression_ratio:.1%} (atteso <50%)")

        # Soglie di qualità minima
        passed = (
            rouge_l >= 0.15 and
            bert_score >= 0.75 and
            date_accuracy >= 0.8 and
            citation_coverage >= 0.6
        )

        return ValidationResult(
            rouge_l=rouge_l,
            bert_score=bert_score,
            citation_coverage=citation_coverage,
            date_accuracy=date_accuracy,
            passed=passed,
            warnings=warnings
        )

Klaar voor pijplijnproductie met Human-in-the-Loop

In een professionele LegalTech-context vervangt AI het juridisch oordeel niet: het neemt toe. De productiepijplijn moet een menselijk beoordelingsmechanisme omvatten voor gevallen waarin de automatische validatie de minimumdrempels niet overschrijdt, of voor documenten zeer kritisch, zoals contracten boven een waardedrempel.

from enum import Enum
from dataclasses import dataclass
from datetime import datetime
import uuid

class ReviewStatus(Enum):
    AUTO_APPROVED = "auto_approved"
    PENDING_REVIEW = "pending_review"
    HUMAN_APPROVED = "human_approved"
    REJECTED = "rejected"

@dataclass
class SummarizationJob:
    """Rappresenta un job di summarization con il suo stato."""
    job_id: str
    document_id: str
    document_value_eur: float  # valore contrattuale per routing
    summary: str
    validation: ValidationResult
    status: ReviewStatus
    created_at: datetime
    reviewed_by: str = None
    review_notes: str = None

class SummarizationOrchestrator:
    """
    Orchestratore della pipeline di summarization con human-in-the-loop.
    Applica routing automatico basato su validazione e valore del documento.
    """

    # Soglia valore contrattuale per revisione obbligatoria (EUR)
    HIGH_VALUE_THRESHOLD = 1_000_000

    def __init__(self, chunker, summarizer, validator):
        self.chunker = chunker
        self.summarizer = summarizer
        self.validator = validator

    async def process_document(
        self,
        document_text: str,
        document_id: str,
        document_value_eur: float = 0,
        doc_metadata: dict = None
    ) -> SummarizationJob:
        """
        Processa un documento e determina il routing appropriato.
        """
        # Step 1: Chunking
        chunks = self.chunker.chunk_document(
            document_text,
            doc_metadata or {'doc_id': document_id}
        )

        # Step 2: Summarization
        result = await self.summarizer.summarize_document(chunks)
        summary = result['executive_summary']

        # Step 3: Validazione automatica
        validation = self.validator.validate(document_text, summary)

        # Step 4: Routing decision
        requires_human_review = (
            not validation.passed or
            document_value_eur >= self.HIGH_VALUE_THRESHOLD or
            len(validation.warnings) > 2
        )

        status = (
            ReviewStatus.PENDING_REVIEW if requires_human_review
            else ReviewStatus.AUTO_APPROVED
        )

        job = SummarizationJob(
            job_id=str(uuid.uuid4()),
            document_id=document_id,
            document_value_eur=document_value_eur,
            summary=summary,
            validation=validation,
            status=status,
            created_at=datetime.utcnow()
        )

        # Notifica team legale se richiesta revisione
        if requires_human_review:
            await self._notify_review_team(job)

        return job

    async def _notify_review_team(self, job: SummarizationJob):
        """Invia notifica al team legale per revisione manuale."""
        # Integrazione con sistema di ticketing (es. Jira, ServiceNow)
        message = (
            f"Revisione richiesta per documento {job.document_id}\n"
            f"Job ID: {job.job_id}\n"
            f"Validazione: {'FALLITA' if not job.validation.passed else 'PASSATA con warning'}\n"
            f"Warning: {'; '.join(job.validation.warnings)}\n"
            f"Valore contratto: EUR {job.document_value_eur:,.0f}"
        )
        # await notification_service.send(team="legal_review", message=message)
        print(f"[REVIEW REQUIRED] {message}")

Modelvergelijking: prestaties op juridische benchmarks

Niet alle modellen zijn gelijk geschapen voor het juridische domein. De volgende tabel vat het samen prestaties op specifieke benchmarks voor contractuele documenten in het Italiaans en Engels (interne dataset van 500 contracten, handmatige evaluatie door senior juristen).

Model	ROUGE-L	BERTScore	Nauwkeurigheid data	Kosten/1M-token	Gemiddelde latentie
GPT-4o	0,38	0,91	94%	$ 5 / $ 15	12s
Claude 3.5 Sonnetten	0,36	0,90	93%	$ 3 / $ 15	10s
Mistral-7B (LoRA ft)	0,31	0,85	87%	Zelf gehost	8s
Lama-3-70B	0,34	0,88	91%	Zelf gehost	18s
GPT-3.5-turbo	0,25	0,80	78%	$ 0,5 / $ 1,5	5s

Productie Raad

Voor de meeste LegalTech-use cases een hybride en optimale aanpak: gebruik GPT-4o (of Claude 3.5) voor hoogwaardige documenten waarbij kwaliteit cruciaal is, en een zelfgehost, verfijnd model voor standaard documentvolumes. Kostenbesparingen kunnen oplopen tot meer dan 80% met behoud van een acceptabele kwaliteit.

Beste praktijken voor productie

Behoudt juridische terminologie: gebruik prompt dat expliciet vraag om technische termen zoals "default", "escrow", "clausule" te behouden uitdrukkelijke resolutie" zonder ze te parafraseren.
Structureer de uitvoer: gebruik JSON-schema of gestructureerde uitvoer voor dwing het model om vooraf gedefinieerde secties te produceren (onderdelen, object, verplichtingen, deadlines, boetes).
Snel versiebeheer: bijhouden welke versie van de prompt produceerde elke samenvatting – cruciaal voor audit en reproduceerbaarheid.
De originele invoer loggen: sla altijd de brontekst op onveranderlijke manier (SHA-256 hash) om latere verificatie mogelijk te maken.
Beperk de context in de Reduce-fase: als de som van de samenvattingen is gedeeltelijk groter is dan 50.000 tokens, pas dan een tweede laag MapReduce toe een enkele Reduce.

Conclusies en volgende stappen

De samenvatting van juridische documenten met LLM is een van de meest volwassen toepassingen meteen bruikbaar van generatieve AI in de juridische sector. Met de juiste strategieën Dankzij chunking, snelle engineering en validatie is het mogelijk betrouwbare systemen te bouwen waardoor de tijd voor het beoordelen van documenten aanzienlijk wordt verkort, terwijl de menselijke controle over de meest kritische documenten.

De belangrijkste punten om mee te nemen in de dagelijkse praktijk:

Kies een chunkingstrategie op basis van de documentstructuur, niet op willekeurige grootte
MapReduce voor volume, Hiërarchisch voor nauwkeurigheid, Verfijnen voor korte zeer kritische documenten
Altijd geldig met ROUGE + BERTScore + check rule-based (data, wettelijke referenties)
Implementeer human-in-the-loop voor documenten met een hoge waarde of weinig vertrouwen
Overweeg om de kosten bij grote volumes te verfijnen

In het volgende artikel in de serie zullen we de Jurisprudentiële zoekmachine met vectorinsluitingen: Hoe je een semantisch zoeksysteem bouwt dat vindt relevante zinnen, zelfs als de vraag anders is geformuleerd dan de tekst van de zin.

LegalTech- en AI-serie

NLP voor Contractanalyse: van OCR tot Begrijpen
e-Discovery Platform-architectuur
Compliance-automatisering met Dynamic Rules Engine
Slim contract voor juridische overeenkomsten: Soliditeit en Vyper
Samenvatting van juridische documenten met generatieve AI (dit artikel)
Zoekmachinewet: vectorinbedding
Digitale handtekening en documentauthenticatie bij Scala
Systemen voor gegevensprivacy en AVG-naleving
Een juridische AI-assistent bouwen (juridische copiloot)
LegalTech-gegevensintegratiepatroon