Merhaba! Ben

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

İletişime Geç

Hakkımda

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

Yeteneklerim

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

Süreç Otomasyonu

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

Özel Sistemler

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

Misyonum

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

Teknolojiyi Demokratikleştirmek

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

BT ve İş Dünyasını Birleştirmek

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

Özel Çözümler Oluşturmak

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

İşletmenizi Teknolojiyle Dönüştürün

Che tu gestisca un negozio, uno studio professionale o un'azienda, posso aiutarti a sfruttare le potenzialità dell'informatica per lavorare meglio, più velocemente e in modo più intelligente.

Konuşalım →

Unisciti alla Community

Entra nella community di sviluppatori dove discutiamo di software, AI, architettura e DevOps. Condividi idee, fai domande e cresci insieme a noi.

Canale

FC Dev Blog

Ricevi notifiche su nuovi articoli, serie complete, tips settimanali e tool in evidenza. Contenuti bilingui IT/EN direttamente nel tuo Telegram.

Nuovi articoli appena pubblicati
Tips e code snippets settimanali
Sondaggi sugli argomenti futuri

Iscriviti al Canale

Gruppo

FC Dev Community

Una community bilingue IT/EN per sviluppatori. Discussioni, Q&A, aiuto reciproco e networking con altri professionisti del settore.

Discussioni su articoli e tecnologie
Help coding e code review
Opportunità di lavoro e collaborazione

Unisciti al Gruppo

Topic di Discussione

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

Linguaggi & Tecnologie

Java

Python

JavaScript

Angular

React

TypeScript

SQL

PHP

CSS/SCSS

Node.js

Docker

Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

İletişime Geç

Aklınızda bir proje mi var? Konuşalım! Formu doldurun, en kısa sürede dönüş yapacağım.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

RAG Mimarisi: Naif, Gelişmiş ve Modüler RAG Desenleri

"RAG" terimi aslında basit desenden mimariye kadar çok geniş bir mimari yelpazesini kapsamaktadır. 2023'ten 2026'ya kadar sorgu yönlendirme, yeniden sıralama ve kendi kendine RAG'yi entegre eden modüler sistemlere üç adım ve tutarlılık kontrolleri. Bu evrimi anlamak çok önemlidir: Saf RAG uygulanması hızlıdır ancak karmaşık belgelerde düşük kalitede geri alımlara neden olur; theGelişmiş RAG belirli erişim sorunlarını çözer; Modüler paçavra Üretimdeki sistemler için maksimum esneklik sunar.

Bu kılavuz, gerçek Python kodu ve karşılaştırmalı kalite ölçümleri içeren üç mimariyi kapsar ve kullanım durumunuz için doğru karmaşıklık düzeyini seçmeye yönelik kriterler.

Ne Öğreneceksiniz

Naif RAG: temel mimari, sınırlar ve ne zaman yeterli olduğu
Gelişmiş RAG: alma öncesi (sorgu yeniden yazma, HyDE), alma sonrası (yeniden sıralama)
Modüler RAG: Yönlendirme, kendi kendine RAG, CRAG ve şekillendirilebilir boru hatları
Mimarileri objektif bir şekilde karşılaştırmak için RAGAS ölçümleri
Her mimari için Python kodunu tamamlayın
Karar kılavuzu: bir sonraki seviyeye ne zaman geçilmeli

Naif RAG: Temel Desen

Naive RAG, optimizasyon olmadan indeks alma-oluşturma akışını takip eder:

Sabit parçalara sahip dizin belgeleri (genellikle 512-1024 jeton)
Sorguyu yerleştirmeye dönüştürür ve en benzer k parçayı arar
Parçaları istemde birleştirin ve yanıtı oluşturun

# Naive RAG con LangChain — implementazione completa
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_community.vectorstores import Qdrant
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import DirectoryLoader, UnstructuredMarkdownLoader

# --- FASE 1: Indicizzazione ---
loader = DirectoryLoader(
    "./docs",
    glob="**/*.md",
    loader_cls=UnstructuredMarkdownLoader
)
documents = loader.load()

# Chunking fisso — il limite principale del Naive RAG
splitter = RecursiveCharacterTextSplitter(
    chunk_size=512,
    chunk_overlap=64,
    separators=["\n\n", "\n", ".", " "]
)
chunks = splitter.split_documents(documents)

embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = Qdrant.from_documents(
    chunks, embeddings,
    url="http://localhost:6333",
    collection_name="naive_rag"
)

# --- FASE 2 + 3: Retrieval + Generation ---
NAIVE_RAG_PROMPT = PromptTemplate(
    input_variables=["context", "question"],
    template="""Rispondi alla domanda basandoti SOLO sul contesto fornito.
Se il contesto non contiene la risposta, dì "Non ho informazioni su questo argomento".

Contesto:
{context}

Domanda: {question}

Risposta:"""
)

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
retriever = vectorstore.as_retriever(search_kwargs={"k": 5})

rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    chain_type_kwargs={"prompt": NAIVE_RAG_PROMPT},
    return_source_documents=True
)

result = rag_chain.invoke({"query": "Come gestire gli errori di timeout?"})
print(result["result"])

Naif RAG'ın Sınırları: Belirsiz sorgularda düşük performans, öbek alımı kısmen alakalı, kurtarılan belgelerin birbiriyle çeliştiği durumlarda vaka yönetimi yok, yapılandırılmış belgelerle (tablolar, kod, listeler) değişken kalite.

Gelişmiş RAG: Alma Öncesi ve Sonrası Optimizasyonlar

Gelişmiş RAG, alım öncesi ve sonrası aşamalarda optimizasyonlar ekler. En fazla teknik etkileyen:

Ön erişim: Sorgu Yeniden Yazma ve HyDE

Kullanıcı sorguları genellikle belirsizdir veya yetersiz ifade edilmiştir. Sorgu yeniden yazma, LLM'yi aşağıdaki amaçlar için kullanır: Sorguyu anlamsal aramaya daha uygun formlarda yeniden formüle edin.

# Advanced RAG: Query Rewriting + HyDE (Hypothetical Document Embeddings)
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)

# 1. Multi-query: genera query alternative per copertura piu ampia
MULTI_QUERY_PROMPT = ChatPromptTemplate.from_messages([
    ("system", """Sei un esperto di information retrieval.
Genera 3 varianti della query fornita per recuperare documenti rilevanti
da diverse angolazioni. Restituisci solo le query, una per riga."""),
    ("human", "Query originale: {query}")
])

multi_query_chain = MULTI_QUERY_PROMPT | llm | StrOutputParser()

def generate_multiple_queries(query: str) -> list[str]:
    result = multi_query_chain.invoke({"query": query})
    queries = [q.strip() for q in result.strip().split('\n') if q.strip()]
    return [query] + queries[:3]  # query originale + 3 varianti

# 2. HyDE: genera un documento ipotetico che conterrebbe la risposta
HYDE_PROMPT = ChatPromptTemplate.from_messages([
    ("system", """Scrivi un breve paragrafo tecnico che risponderebbe
alla seguente domanda, come se fosse tratto da una documentazione ufficiale.
Usa terminologia tecnica precisa."""),
    ("human", "{query}")
])

hyde_chain = HYDE_PROMPT | llm | StrOutputParser()

def hyde_search(query: str, vectorstore, k: int = 5):
    # Genera documento ipotetico
    hypothetical_doc = hyde_chain.invoke({"query": query})

    # Cerca usando il documento ipotetico come query (invece della query diretta)
    results = vectorstore.similarity_search(hypothetical_doc, k=k)
    return results

# 3. Multi-query retrieval con deduplicazione
from langchain.retrievers import MergerRetriever
from langchain_community.document_transformers import EmbeddingsRedundantFilter

def advanced_retrieve(query: str, vectorstore, k: int = 5) -> list:
    queries = generate_multiple_queries(query)

    # Raccogli risultati da tutte le query
    all_docs = []
    for q in queries:
        docs = vectorstore.similarity_search(q, k=k)
        all_docs.extend(docs)

    # Deduplica per contenuto simile
    seen_content = set()
    unique_docs = []
    for doc in all_docs:
        content_hash = hash(doc.page_content[:200])
        if content_hash not in seen_content:
            seen_content.add(content_hash)
            unique_docs.append(doc)

    return unique_docs[:k * 2]  # ritorna il doppio dei risultati per il reranker

Geri alma sonrası: Çapraz Kodlayıcı ile Yeniden Sıralama

Vektör yerleştirmeleri "iki kodlayıcı" gösterimini kullanır (ayrı sorgu ve belge): ve hızlı ancak daha az kesindir. Kodlayıcılar arası yeniden sıralama (sorgu + belge birlikte) hassasiyeti artırır ek gecikme (genellikle 50-150 ms) pahasına %15-25 oranında artar.

# Post-retrieval: Reranking con Cohere Rerank o cross-encoder locale
import cohere
from sentence_transformers import CrossEncoder

# Opzione 1: Cohere Rerank API (managed, accurato)
co = cohere.Client("your-api-key")

def rerank_with_cohere(query: str, documents: list[str], top_n: int = 5) -> list[dict]:
    response = co.rerank(
        query=query,
        documents=documents,
        top_n=top_n,
        model="rerank-v3.5"
    )
    return [
        {"content": documents[r.index], "relevance_score": r.relevance_score}
        for r in response.results
    ]

# Opzione 2: Cross-encoder locale (gratuito, ~100MB)
cross_encoder = CrossEncoder("cross-encoder/ms-marco-MiniLM-L-6-v2")

def rerank_local(query: str, documents: list[str], top_n: int = 5) -> list[dict]:
    # Crea coppie (query, documento) per il cross-encoder
    pairs = [[query, doc] for doc in documents]
    scores = cross_encoder.predict(pairs)

    # Ordina per score decrescente
    ranked = sorted(zip(documents, scores), key=lambda x: x[1], reverse=True)
    return [{"content": doc, "relevance_score": float(score)} for doc, score in ranked[:top_n]]

# Advanced RAG completo: multi-query + HyDE + reranking
def advanced_rag(query: str, vectorstore) -> dict:
    # 1. Retrieval ampliato
    candidates = advanced_retrieve(query, vectorstore, k=8)
    candidate_texts = [doc.page_content for doc in candidates]

    # 2. Reranking
    reranked = rerank_local(query, candidate_texts, top_n=5)

    # 3. Generation con contesto di qualita
    context = "\n\n---\n\n".join([r["content"] for r in reranked])

    response = llm.invoke(f"""Contesto:\n{context}\n\nDomanda: {query}\nRisposta:""")
    return {"answer": response.content, "sources": reranked}

Modüler RAG: Modüler Mimari

2026 Modüler RAG, boru hattının her aşamasını değiştirilebilir bir modül olarak ele alır. Desenler en önemlisi:

CRAG: Düzeltici RAG

CRAG bir ilgi sınıflandırıcısı ekler: Alınan belgelerin puanı düşükse, sistem alakasız bağlam oluşturmak yerine yedek bir web araması gerçekleştirir.

# Modular RAG: CRAG (Corrective RAG) con LangGraph
from langgraph.graph import StateGraph, END
from typing import TypedDict, Annotated
from langchain_community.tools.tavily_search import TavilySearchResults

class RAGState(TypedDict):
    query: str
    documents: list
    relevance_scores: list[float]
    web_results: list
    answer: str
    retrieval_quality: str  # "high" | "low" | "ambiguous"

def retrieve(state: RAGState) -> RAGState:
    """Retrieval dal vector store"""
    docs = vectorstore.similarity_search_with_score(state["query"], k=5)
    documents = [doc for doc, _ in docs]
    scores = [float(score) for _, score in docs]
    return {**state, "documents": documents, "relevance_scores": scores}

def assess_relevance(state: RAGState) -> RAGState:
    """Valuta se i documenti sono sufficientemente rilevanti"""
    avg_score = sum(state["relevance_scores"]) / len(state["relevance_scores"])

    if avg_score > 0.85:
        quality = "high"
    elif avg_score > 0.70:
        quality = "ambiguous"
    else:
        quality = "low"

    return {**state, "retrieval_quality": quality}

def web_search_fallback(state: RAGState) -> RAGState:
    """Fallback: web search quando il retrieval e scarso"""
    search_tool = TavilySearchResults(max_results=3)
    results = search_tool.invoke(state["query"])
    return {**state, "web_results": results}

def generate_answer(state: RAGState) -> RAGState:
    """Genera risposta usando documenti disponibili"""
    if state["retrieval_quality"] == "low" and state["web_results"]:
        context = "\n".join([r["content"] for r in state["web_results"]])
        source_type = "web search"
    else:
        context = "\n".join([doc.page_content for doc in state["documents"]])
        source_type = "knowledge base"

    response = llm.invoke(
        f"Contesto ({source_type}):\n{context}\n\nDomanda: {state['query']}\nRisposta:"
    )
    return {**state, "answer": response.content}

# Routing basato sulla qualita del retrieval
def should_web_search(state: RAGState) -> str:
    return "web_search" if state["retrieval_quality"] == "low" else "generate"

# Costruzione del grafo
graph = StateGraph(RAGState)
graph.add_node("retrieve", retrieve)
graph.add_node("assess_relevance", assess_relevance)
graph.add_node("web_search", web_search_fallback)
graph.add_node("generate", generate_answer)

graph.set_entry_point("retrieve")
graph.add_edge("retrieve", "assess_relevance")
graph.add_conditional_edges(
    "assess_relevance",
    should_web_search,
    {"web_search": "web_search", "generate": "generate"}
)
graph.add_edge("web_search", "generate")
graph.add_edge("generate", END)

crag = graph.compile()

# Esecuzione
result = crag.invoke({"query": "Qual e la versione piu recente di Qiskit?"})
print(result["answer"])

Kalite Karşılaştırması: Naif vs Gelişmiş vs Modüler

Benchmark su dataset di test enterprise (500 domande, base di conoscenza 50K docs)

Metrica             | Naive RAG | Advanced RAG | Modular RAG (CRAG)
--------------------|-----------|--------------|--------------------
Faithfulness        | 0.71      | 0.88         | 0.92
Answer Relevancy    | 0.74      | 0.86         | 0.89
Context Recall      | 0.65      | 0.81         | 0.84
Context Precision   | 0.72      | 0.87         | 0.88
--------------------|-----------|--------------|--------------------
Latenza p50         | 850ms     | 1.4s         | 1.8s (con web fallback: 3.2s)
Costo per query     | $0.003    | $0.007       | $0.009 (avg)
--------------------|-----------|--------------|--------------------
"Hallucination rate"| 18%       | 6%           | 4%
Domande senza risp. | 12%       | 8%           | 3% (web fallback)

Bir Sonraki Seviyeye Ne Zaman İlerlemeliyiz?

Saf -> Gelişmiş: doğruluk < 0,80 ise veya kullanıcılar yanıt bildirirse alakasız sıklıkta; ek maliyet ~2x
Gelişmiş -> Modüler: Bilgi tabanınız yalnızca bir alt kümeyi kapsıyorsa talep edilen konuların sayısı veya sorguların heterojen konular arasında yer alması durumunda; ek maliyet ~1,3x
Saf ol: Bilgi tabanınız iyi yapılandırılmışsa sorgular homojen ve doğruluk > 0,85 zaten temel modelle

Sonuçlar

Doğru RAG mimarisi, kullanım durumunuzun karmaşıklığına bağlıdır. Her zaman şununla başla: Naif RAG, RAGAS ile ölçüm yapın ve yalnızca veriler gerektirdiğinde ilerleyin. Karmaşıklık ekleyin ölçüm olmadan, iyileştirme olmadan daha pahalıya mal olan aşırı mühendislik gerektiren sistemlere yol açar ölçülebilir.

Bir sonraki makale parçalama stratejilerini (geri alma hattı bileşeni) ele alıyor Naive RAG'ın kalitesi üzerinde en büyük etkiye sahip olan ve sıklıkla gözden kaçırılan şey budur.