Sietch
stableVector + columnar RAG store. 90MB RAM.
Memoria vectorial y columnar del ecosistema Dune. HNSW puro Rust con TurboQuant (ICLR 2026) para compresión 8x de vectores. Indexa embeddings de documentos clínicos, protocolos y datos del HIS/ERP, y sirve consultas RAG para el agente Prescient. Indexación automática: cada INSERT construye el grafo HNSW y comprime con TurboQuant sin configuración extra.
Características
- ✦HNSW index puro Rust — sin dependencias C++ (usearch, faiss)
- ✦TurboQuant (ICLR 2026): compresión 8x vs f32 — 3 bits/dim con calidad equivalente
- ✦Indexación automática: cada INSERT indexa en HNSW + comprime con TurboQuant
- ✦vector_search() 6.7x más rápido que brute-force cosine_similarity()
- ✦Dual store: vectores (ANN search) + columnar (SQL analytics)
- ✦Ingesta de embeddings desde Harvester vía SQL INSERT
- ✦Consultas RAG vía vector_search() con JOIN a datos estructurados
- ✦Storage columnar en Parquet con compresión automática
Ejemplo
dune sietch
-- Crear índice HNSW con TurboQuant (una sola vez)CREATE INDEX idx_docs ON document_chunksUSING HNSW (embedding) WITH (m=16, ef_construction=200,quantization='turboquant' -- 8x compresión, 3 bits/dim);-- Cada INSERT indexa automáticamenteINSERT INTO document_chunks (id, chunk_text, embedding)VALUES (1, 'Protocolo QT mama HER2+...', '[0.12, 0.45, ...]');-- Búsqueda vectorial RAG (53ms vs 358ms brute-force)SELECT d.chunk_text, v.similarity as scoreFROM vector_search('idx_docs', '[0.1, 0.2, ...]', 10) vJOIN document_chunks d ON d.id = v.id;CHUNK_TEXT SCOREProtocolo QT mama HER2+: esquema... 0.94Guía clínica cáncer mama §7.1... 0.91Ficha técnica trastuzumab §2... 0.87
DETALLES
- Stack
- Rust · HNSW · TurboQuant · Arrow · Parquet
- Puerto
- :7421
- Reemplaza
- Pinecone / Weaviate / Chroma
- Estado
- stable