Aller au contenu principal

Configuration

384d sentence-transformersLogiciel gratuit open source

Ideal for text embeddings — measures angle between vectors, invariant to magnitude.

Split by a fixed number of tokens with configurable overlap. Simple and predictable.

Documents totaux :10,000

Stockage estimé20 MB
Coût/mois0 € (hébergement auto-hôte)
Taille384d
Avertissements 0
-- Redis Stack HNSW Vector Index
-- Run via redis-cli or ioredis

FT.CREATE idx:docs
  ON HASH PREFIX 1 doc:
  SCHEMA
    id          TAG
    content     TEXT
    source      TAG
    created_at  NUMERIC
    embedding   VECTOR HNSW 6
      TYPE FLOAT32
      DIM 384
      DISTANCE_METRIC COSINE
      M 16
      EF_CONSTRUCTION 200

-- Optional: store JSON documents
FT.CREATE idx:docs:json
  ON JSON PREFIX 1 doc:
  SCHEMA
    $.id          AS id          TAG
    $.content     AS content     TEXT
    $.source      AS source      TAG
    $.created_at  AS created_at  NUMERIC
    $.embedding[*] AS embedding  VECTOR HNSW 6
      TYPE FLOAT32
      DIM 384
      DISTANCE_METRIC COSINE
      M 16
      EF_CONSTRUCTION 200

Comment ça fonctionne

Choisissez le modèle

Sélectionnez le modèle d'embedding parmi les 12 options + disponibles (Sentence Transformers, Open AI, Cohère, Voyage) . Les dimensions sont automatiquement configurées.

Configure la base de données

Choisissez le vecteur de base cible, la métrique de distance et l'approche d'éclatement. Les paramètres HNSW sont proposés automatiquement.

Obtenez le schéma

Le outil génère des scripts SQL exécutables et de configuration en JSON ainsi que les estimations d'espace disque et coûts chez Heizner. Cloner avec une seule clic dans votre projet.

Pourquoi utiliser cet outil ?

Tout en une seule opération !

Supporte de base de données vecteur avec les instructionsDDL prêtes à l'emploi pour une production immédiate. Changement de BDD et re-génération en un seul second.

Coût-conscient pour Hetzner

Estimation de stockage et coût mensuel en fonction des serveurs virtuels (VPS) Hetzner CCX13 / CCX23. Mettre en évidence les warnings sur la nuée d'indexation Cloud Pinecone et les modèles payants.

Paramètres HNSW rationalisés

Tous les paramètres (M, ef_construction, ef) sont générés avec une raison explicite. Aucune valeur magique anonyme n'est utilisée.