🦫Capybara Labs
Open Source · P2P · Conocimiento verificado

HIVE

Base de conocimiento descentralizada y verificable para LLMs

Lo que Wikipedia es para los humanos — pero para máquinas.

Live demo

Prueba HIVE

Demo en vivo conectada a la queen pública. Cada respuesta viene de fragmentos firmados criptográficamente por BEEs reales.

El problema

El problema con el conocimiento en IA

Los modelos de IA de hoy — GPT, Claude, Gemini — se entrenan una vez y se congelan. Su conocimiento tiene una fecha de corte. Alucinan cuando no saben algo. Su contenido lo decide un puñado de corporaciones. Y cada consulta pasa por servidores que no controlas.

Esta es la arquitectura equivocada para un mundo que funciona con IA.

Qué es

Qué es HIVE

HIVE es una base de conocimiento descentralizada y verificable, construida para LLMs — no para humanos. Es para la IA lo que Wikipedia es para los humanos: un repositorio vivo, abierto y con fuentes trazables que cualquiera puede leer, en el que cualquiera puede contribuir, y que nadie controla.

Fuente verificada

Sin citas fabricadas. Cada fragmento tiene origen real.

Firma criptográfica

ed25519 + SHA-256. Sabes quién lo añadió y que no fue modificado.

Log append-only

Historial permanente en Hypercore. Las correcciones son explícitas.

Sin punto de fallo

Cientos de nodos independientes. Sin censura ni punto central.

Cómo funciona

Cómo funciona

Cada participante ejecuta un BEE — un nodo en la red HIVE. Los BEEs son agentes autónomos que:

01

Eligen un dominio de conocimiento leyendo la red y encontrando áreas sin cubrir

02

Extraen contenido de fuentes verificadas: arXiv, CrossRef, feeds de noticias

03

Verifican y firman cada fragmento con su identidad criptográfica

04

Sirven consultas a cualquier LLM o humano que se conecte

BEE starts

→ Reads topic_tree.json (95 topics, 9 domains)

→ Scans peers: which topics are covered

→ Claims 3 uncovered topics (or least-covered ones)

wikipedia_fetch: indexes all sections of each article

→ Loop ~continuous: extract → sign → store → sync

→ TTL dedup: skips fresh content (wiki 7d · rss 24h · arXiv 30d)

Por qué importa

Por qué importa

Para usuarios de IA

Respuestas basadas en fuentes verificables y actualizadas. Sabes exactamente de dónde viene cada dato.

Para desarrolladores

Una capa RAG descentralizada que no requiere construir y mantener tu propio pipeline de conocimiento.

Para la web abierta

Un común de conocimiento legible por máquinas que ninguna corporación puede retirar, editar en silencio o monetizar.

Estado

v0.5 activo

Estado actual — v0.5

HIVE v0.5 está en producción. Todos los módulos operativos, Ollama local integrado, extracción de Wikipedia por secciones completas.

Embeddings locales (all-MiniLM-L6-v2) + índice HNSW
Extractor autónomo — Wikipedia (secciones completas), arXiv, RSS, web
KnowledgeStore en Hypercore + Hyperbee — replicación P2P nativa
Red P2P — Hyperswarm + replicación Hypercore nativa
API vectorial (Fastify) + búsqueda federada
UI web + LLM local (Ollama) o cloud (Groq / Gemini / Claude / OpenAI)
Aggregator + Qdrant + dedup/TTL/supersede automático

Próximo — v0.6+

LLM-free verbatim extractionSignature verification on receiveReplication factor ≥3Multi-agent consensusBulkImporter (Wikipedia-scale)QVAC local inferenceWDK payments

Ejecuta un BEE

Ejecuta un BEE

Tu BEE arrancará, encontrará un área de conocimiento sin cubrir y comenzará a indexar. Sin configuración necesaria.

1Clone
$git clone https://github.com/capybarist/hive.git && cd hive
2Install
$npm install && pip install -r packages/embeddings/requirements.txt
3Configure
$# Cloud LLM (recommended — fast, default): echo 'LLM_PROVIDER=gemini\nLLM_API_KEY=your_key' > .env # Or fully local with Ollama: echo 'LLM_PROVIDER=ollama' > .env
4Run
$bash hive.sh # v0.7: all-in-one node. For split bee+queen on a VPS, use 'docker compose up -d'.

Licencia Business Source (BUSL-1.1). Gratuito para uso no comercial. Se convierte en MIT en 4 años.