Sietch

stable

Vector + columnar RAG store. 90MB RAM.

Memoria vectorial y columnar del ecosistema Dune. HNSW puro Rust con TurboQuant (ICLR 2026) para compresión 8x de vectores. Indexa embeddings de documentos clínicos, protocolos y datos del HIS/ERP, y sirve consultas RAG para el agente Prescient. Indexación automática: cada INSERT construye el grafo HNSW y comprime con TurboQuant sin configuración extra.

Características

  • HNSW index puro Rust — sin dependencias C++ (usearch, faiss)
  • TurboQuant (ICLR 2026): compresión 8x vs f32 — 3 bits/dim con calidad equivalente
  • Indexación automática: cada INSERT indexa en HNSW + comprime con TurboQuant
  • vector_search() 6.7x más rápido que brute-force cosine_similarity()
  • Dual store: vectores (ANN search) + columnar (SQL analytics)
  • Ingesta de embeddings desde Harvester vía SQL INSERT
  • Consultas RAG vía vector_search() con JOIN a datos estructurados
  • Storage columnar en Parquet con compresión automática

Ejemplo

dune sietch
-- Crear índice HNSW con TurboQuant (una sola vez)
CREATE INDEX idx_docs ON document_chunks
USING HNSW (embedding) WITH (
m=16, ef_construction=200,
quantization='turboquant' -- 8x compresión, 3 bits/dim
);
-- Cada INSERT indexa automáticamente
INSERT INTO document_chunks (id, chunk_text, embedding)
VALUES (1, 'Protocolo QT mama HER2+...', '[0.12, 0.45, ...]');
-- Búsqueda vectorial RAG (53ms vs 358ms brute-force)
SELECT d.chunk_text, v.similarity as score
FROM vector_search('idx_docs', '[0.1, 0.2, ...]', 10) v
JOIN document_chunks d ON d.id = v.id;
CHUNK_TEXT SCORE
Protocolo QT mama HER2+: esquema... 0.94
Guía clínica cáncer mama §7.1... 0.91
Ficha técnica trastuzumab §2... 0.87

DETALLES

Stack
Rust · HNSW · TurboQuant · Arrow · Parquet
Puerto
:7421
Reemplaza
Pinecone / Weaviate / Chroma
Estado
stable