Skip to main content

Configuration

Split ogni N caratteri. Semplice e deterministico.

1002000

Input text

891 caratteri
3product chunks
297 Total tokens
297 Media chunk/character

Chunk prodotti (3)

~Token 99 396 char

La Retrieval-Augmented Generation (RAG) e' una tecnica che combina modelli linguistici con recupero di documenti esterni. Il processo RAG si divide in due fasi principali: indicizzazione e inferenza. Nella fase di indicizzazione, i documenti vengono suddivisi in chunk, convertiti in embedding e salvati in un vector store. Durante l'inferenza, la query dell'utente viene convertita in embedding,

~Token 99 397 char

vengono recuperati i chunk piu' simili e il modello genera una risposta contestualizzata. La scelta della strategia di chunking impatta significativamente la qualita' dei risultati RAG. Chunk troppo piccoli perdono contesto, chunk troppo grandi riducono la precisione del retrieval. Le strategie piu' comuni includono: split fisso per semplicita', split per frase per coerenza semantica, split per

~Token 23 91 char

paragrafo per testi strutturati, e sliding window per massimizzare il contesto disponibile.

Mastering the

Comparing Chunking Strategies for the RAG Pipeline
StrategyWhen to use itForAgainst
Fixed SizePlain texts without structureDeterministic, fastCut sentences at meta'
SentenceArticles, News, Narrative TextsNon capisco la richiesta. Puoi fornire il testo da tradurre?Variable-sized chunks
ParagraphStructured documentsNatural SemanticsLong or short paragraphs
RecursiveVariable-structured mixed documentsFlexible, adaptableMore complex logic
Semantic CosineMixed-topic textsSemantically coherent chunksApproximated without actual embeddings
Sliding WindowTechnical QA on texts, maximum context.No context lostRedundancy, more called embeddings
Markdown HeaderDocumentation, READ ME, WikiRespect the Markdown hierarchyOnly for markdown texts
Token BucketToken Count ControlRespect word boundariesIgnore semantic structure.