
Base de conocimiento descentralizada y verificable para LLMs
“Lo que Wikipedia es para los humanos — pero para máquinas.”
Crea tu propio RAG — o comparte conocimiento con cualquiera — sin servidores de por medio.
Live demo
Prueba HIVE
Demo en vivo conectada a la queen pública. Cada respuesta viene de fragmentos firmados criptográficamente por BEEs reales.
Demo pública · queen LanceDB + bees de Wikipedia y RSS en Hetzner · token pre-cargado, sin setup. Conéctala a Claude por MCP para citas verificables en tu IDE.
Nodos en vivo
Una reina y una abeja, ahora mismo
No es una demo enlatada — tres nodos reales en producción. Abre sus paneles y míralos trabajar.
Reina
:8090Replica los cores de ambas abejas, indexa los vectores firmados en LanceDB, responde /api/query.
Abrir panelAbeja · Wikipedia
:8080Abeja generalista crawleando Wikipedia (policy drift-ok). Embebe, firma y publica fragmentos en su Hypercore.
Abrir panelAbeja · News (RSS)
:8081Abeja especialista en feeds RSS (BBC, Guardian, NPR, ArsTechnica), policy exclusive — manifest distinto, mismo protocolo.
Abrir panelServidos sobre HTTPS (auto-TLS de Caddy). Son los mismos nodos que lee la demo de arriba.
El problema
El problema con el conocimiento en IA
Los modelos de IA de hoy — GPT, Claude, Gemini — se entrenan una vez y se congelan. Su conocimiento tiene una fecha de corte. Alucinan cuando no saben algo. Su contenido lo decide un puñado de corporaciones. Y cada consulta pasa por servidores que no controlas.
Esta es la arquitectura equivocada para un mundo que funciona con IA.
Qué es
Qué es HIVE
HIVE es una base de conocimiento descentralizada y verificable, construida para LLMs — no para humanos. Es para la IA lo que Wikipedia es para los humanos: un repositorio vivo, abierto y con fuentes trazables que cualquiera puede leer, en el que cualquiera puede contribuir, y que nadie controla.
Fuente verificada
Sin citas fabricadas. Cada fragmento tiene origen real.
Firma criptográfica
ed25519 + SHA-256. Sabes quién lo añadió y que no fue modificado.
Log append-only
Historial permanente en Hypercore. Las correcciones son explícitas.
Sin punto de fallo
Cientos de nodos independientes. Sin censura ni punto central.
Cómo funciona
Cómo funciona
Cada participante ejecuta un BEE (productor) o una QUEEN (consumidor). Los BEEs son agentes autónomos que:
Declaran una fuente y un ámbito (categoría de Wikipedia, categorías de arXiv, feeds…) y se reparten el trabajo con otros BEEs vía particiones
Extraen contenido verbatim de fuentes verificadas: Wikipedia, arXiv, RSS, Common Crawl
Firman cada fragmento con su identidad ed25519 y lo añaden a su Hypercore append-only
Replican a sus peers vía Hyperswarm; las QUEENs indexan en Qdrant y responden las consultas
→ Reads its manifest: declared sources + scope/partition
→ Sources: Wikipedia · arXiv · RSS · Common Crawl (ForagerSource adapters)
→ Seeds its crawl queue from the declared scope
→ Per article: fetch verbatim → all sections → chunk → sign (ed25519) → append
→ Loop ~continuous: extract → sign → store → replicate to peers
→ TTL dedup: skips fresh content (wiki 7d · rss 24h · arXiv 30d)
Por qué importa
Por qué importa
Para usuarios de IA
Respuestas basadas en fuentes verificables y actualizadas. Sabes exactamente de dónde viene cada dato.
Para desarrolladores
Una capa RAG descentralizada que no requiere construir y mantener tu propio pipeline de conocimiento.
Para la web abierta
Un común de conocimiento legible por máquinas que ninguna corporación puede retirar, editar en silencio o monetizar.
Casos de uso
Para qué sirve
RAG distribuido — público y privado, especializado y general, para LLMs locales o en la nube. Monta tu propia base de conocimiento, o compártela peer-to-peer sin ningún servidor de por medio. El mismo protocolo se compone en patrones de despliegue que van desde swarms públicos hasta integraciones por LLM-host — once mostrados abajo, catálogo completo al final.
Únete al swarm público con un hash de topic
Una reina se une al HIVE público hasheando una cadena conocida — sha256("hive-network-v0.1") — y llamando a swarm.join(topic). La DHT de Hyperswarm la presenta a cada BEE en ese topic; la replicación nativa de Hypercore baja sus fragmentos firmados sin ningún registro central en medio. Las mallas públicas especializadas son solo otra cadena — "hive-medical-v0.1", "hive-legal-v0.1" — mismo protocolo, swarm más estrecho.
Monta un swarm privado para uso interno
Las mismas BEEs y reinas; tres ajustes vuelven la red privada: un topic aleatorio de 32 bytes (espacio de 2²⁵⁶), claves de cifrado Hypercore para que los cores sean texto cifrado en reposo y en tránsito, y una allowlist de peers por clave pública que rechaza cualquier conexión no autorizada. Las BEEs internas indexan wikis, tickets, repos y contratos de la empresa; una reina los indexa y sirve /api/query — ningún tráfico sale del perímetro.
Comparte claves privadas entre empresas
Dos organizaciones intercambian tres valores fuera de banda — topic del swarm, clave de cifrado Hypercore y la clave pública de la reina de cada lado para la allowlist. Ambas reinas se unen al mismo swarm privado y replican solo las BEEs que la otra parte decidió exponer. Sin copia, sin broker externo, sin fusión de hives: cada empresa conserva su reina, su índice LanceDB y su rastro de auditoría. Revocar es rotar una clave o editar la allowlist.
Una reina en muchos swarms — cobertura compuesta
Los casos 01–03 se componen en la capa de la reina. Una sola reina puede unirse a tantos topics como credenciales tenga — malla pública, su swarm privado, cada swarm de partner — y replicar BEEs de todos ellos en un único índice LanceDB. Una consulta, una síntesis del LLM, fuentes de cada swarm al que pertenece la reina. Cada fragmento mantiene su clave de origen y su firma, así que la procedencia sobrevive a la fusión. Nada cruza entre swarms — la reina es el único punto donde se encuentran.
Conectores a medida como plugins ForagerSource
Cualquier cosa no cubierta — un ERP heredado, una API REST interna, un archivo propietario — se integra implementando la interfaz ForagerSource (seed / fetch / normalize / owns), publicándola como paquete npm y añadiendo su id al manifiesto de la BEE. En el siguiente arranque el forager la recoge, drena su cola mecánicamente y firma cada fragmento emitido. Sin forkear el core de HIVE, sin registro central que actualizar — el conector vive en el repo del cliente.
Reina con LLM local — stack offline completo
El cliente LLM de la reina es enchufable; apúntalo a Ollama (o cualquier runtime local) y todo el stack corre on-prem — BEEs extrayendo, LanceDB indexando, embedder local, síntesis local. Sin API key, sin tráfico que salga de la máquina. Un modelo pequeño tiene memoria paramétrica estrecha; la recuperación de la reina le da contexto firmado y con fuentes en tiempo de consulta — la combinación se comporta como un modelo mucho mayor en tareas acotadas a un dominio, preservando la privacidad. La capa de conocimiento natural para agentes locales tipo QVAC.
Corpus de entrenamiento con procedencia criptográfica
Las BEEs guardan la extracción verbatim — sin LLM de por medio, sin parafraseo. Cada fragmento lleva URL de origen, scope, timestamp y firma ed25519. Eso hace de un HIVE una fuente de entrenamiento inusualmente limpia: streamea fragmentos directamente desde los Hypercores replicados de la reina hacia un pipeline de pre-training, SFT o destilación. Filtra por fuente, scope, idioma o BEE firmante para construir un corpus generalista amplio o uno especialista estrecho. La procedencia es por fragmento y verificable — útil para propagación de licencias y auditoría de datasets.
Memoria personal para tu IA
Una queen HIVE local-only indexa tu propia actividad — conversaciones con Claude, historial de comandos, notas, ficheros de memoria del agente. El servidor MCP la expone a cualquier cliente, así Claude (o Cursor, o cualquier asistente MCP-aware) recupera memoria entre sesiones sin enviar nada a terceros. Adapter ForagerSource, firmado ed25519 con tu propia clave, vive solo en tu swarm privado — privacidad por diseño.
Citas verificables para periodismo y compliance
Las BEEs indexan fuentes oficiales y reguladas (boletines, registros públicos, RSS de reguladores, organismos de estándares) y firman cada extracción. Un periodista u oficial de compliance cita por id de fragmento; la cita es verificable independientemente años después contra la clave pública ed25519 de la bee, aunque cambie o desaparezca la URL original. La procedencia criptográfica por fragmento es el diferenciador — ninguna otra arquitectura RAG la ofrece nativa.
Servidor MCP — enchufa HIVE a cualquier LLM host
@capybaralabs/hive-mcp empaqueta HIVE como servidor MCP para Claude Desktop, Claude Code, Cursor, Continue, Goose, OpenClaw — y el resto del ecosistema MCP. Una línea en la config de tu cliente y Claude puede consultar una queen HIVE como tool nativa. Devuelve fragmentos firmados crudos; el LLM del host sintetiza. Sin código pegamento, sin fork, sin build específico de plataforma.
Claude Skill — cuándo y cómo citar HIVE
El Claude Skill hive-research es guía de comportamiento que el modelo carga antes de responder. Le enseña cuándo consultar HIVE frente a WebSearch, cómo leer score + flag del retrieval gate, cómo citar cada afirmación por id de fragmento + URL, y a admitir cuando la queen no tiene datos relevantes en vez de inventar. Markdown puro — funciona en cualquier cliente que lea ~/.claude/skills/, independiente del MCP.
Enchufa HIVE a Claude, Cursor, OpenClaw — un comando
Tres piezas, una historia de producto. Levanta una queen HIVE con un comando, enchúfala a Claude / Cursor / OpenClaw vía el servidor MCP, y carga el Skill para que el modelo cite fragmentos de HIVE proactivamente en vez de inventar.
npx @capybaralabs/hiveWizard interactivo → arranca un nodo queen / bee / hive. Sin Docker.
npx @capybaralabs/hive-mcpAñádelo a la config MCP de tu cliente, apunta a la queen, listo.
cp -r hive/skills/hive-research \
~/.claude/skills/Recarga Claude — citas proactivas, sin invención.
Tecnología
La tecnología
Construido sobre infraestructura P2P probada en producción:
Sin blockchain. Sin tokens por ahora. Sin servidor central.
Por dentro
Cómo funciona por dentro
Para quien quiera el detalle — las primitivas criptográficas y P2P sobre las que se construye HIVE.
Hypercore
Log firmado append-onlyCada nodo posee un Hypercore: un log append-only donde cada bloque se hashea en un árbol de Merkle y se firma con la clave del nodo. Los bloques son inmutables y verificables de forma aislada — un peer puede probar que el bloque N pertenece al log sin confiar en nadie. Es el mismo core que mueve Keet.
Hyperbee
B-tree sobre HypercoreLos fragmentos, claims y el manifiesto de la abeja se guardan en un Hyperbee — un árbol B clave-valor ordenado sobre el Hypercore. Da consultas por rango y streams de historial heredando las garantías firmadas y append-only del log. La replicación de la reina lee un stream de historial del Hyperbee para ingerir fragmentos en orden.
ed25519 + SHA-256
Procedencia por fragmentoCada fragmento se hashea (SHA-256) sobre su payload y se firma (ed25519) con la abeja que lo produjo. Al recibirlo, la reina recalcula el hash y verifica la firma contra la clave pública publicada de la abeja antes de indexar — un fragmento manipulado o sin firmar se descarta. La procedencia sobrevive a la replicación e incluso a fusiones entre swarms.
Hyperswarm DHT
Descubrimiento + NATLos nodos se encuentran uniéndose a un topic (una clave de 32 bytes) en la DHT de Hyperswarm — sin registro central, sin servidor de bootstrap que tengas que correr. La DHT presenta a los peers y atraviesa NATs; a partir de ahí la replicación nativa de Hypercore toma la conexión.
Cifrado y allowlists
Swarms privadosUn swarm público es un hash de topic conocido. Uno privado activa tres palancas: un topic aleatorio de 32 bytes (espacio de 2²⁵⁶), claves de cifrado Hypercore para que los cores sean texto cifrado en reposo y en tránsito, y una allowlist de claves públicas que rechaza cualquier conexión no autorizada. Mismo protocolo, perímetro sellado.
LanceDB + e5-base
Vectorización y consultaVectorización del lado del productor: cada BEE embebe sus propios chunks con multilingual-e5-base (768-d, ONNX int8) y firma el vector inline. La reina nunca embebe pasajes — copia los vectores firmados a un LanceDB en proceso (el backend por defecto; la interfaz VectorIndex es intercambiable, así que una reina puede correr Qdrant o el backend que quiera). Una consulta embebe solo la pregunta, saca el top-K por similitud coseno, los filtra por score + coincidencia de palabras, y pasa los supervivientes a una sola llamada al LLM para sintetizar. El LLM es el único paso no local y no determinista — y el único sitio donde se usa una clave.
Estado
En producciónEstado actual
HIVE está en producción (v0.8) con la arquitectura BEE/QUEEN: las abejas extraen, embeben y firman cada fragmento (vector inline), las reinas indexan los vectores ya firmados en LanceDB y sirven consultas. Una reina y una abeja corren ahora mismo en producción (enlaces abajo).
Publicado recientemente (2026-05)
Roadmap
Ejecuta un BEE
Ejecuta un BEE
Tu BEE arrancará, encontrará un área de conocimiento sin cubrir y comenzará a indexar. Sin configuración necesaria.
npx @capybaralabs/hive # wizard → starts a nodegit clone https://github.com/capybarist/hive && cd hive && docker compose up -dgit clone https://github.com/capybarist/hive && cd hive && bash hive.shLicencia Business Source (BUSL-1.1). Gratuito para uso no comercial. Se convierte en MIT en 4 años.
