·
2 min de lectura
Hoarder / Karakeep
- ai ,
- bookmarks ,
- organization ,
- self hosted
Hoarder/Karakeep: aplicación auto-alojable para guardar contenido digital con IA, etiquetado automático, OCR y preservación de datos
Karakeep (anteriormente conocido como Hoarder) es una aplicación de código abierto y auto-alojable diseñada para ser un “guardatodo” digital. Permite guardar, organizar y buscar una amplia gama de contenido, como enlaces, notas, imágenes y PDFs, utilizando IA para facilitar la organización.
Funcionalidades clave
- Etiquetado por IA: Utiliza Modelos de Lenguaje Grandes (LLMs) para entender y etiquetar automáticamente el contenido que guardas. Soporta tanto servicios en la nube (OpenAI) como modelos locales (Ollama).
- Organización de contenido: Guarda enlaces, texto, imágenes y PDFs. La aplicación extrae automáticamente metadatos como títulos y descripciones.
- Búsqueda de texto completo: Todo el contenido guardado se indexa, permitiendo una búsqueda rápida y completa.
- Soporte multiplataforma: Ofrece extensiones de navegador para Chrome y Firefox, así como aplicaciones móviles para iOS y Android.
- Preservación de datos: Combate el “link rot” (enlaces rotos) guardando archivos offline de las páginas que guardas.
- Extracción de contenido: Incluye OCR para extraer texto de imágenes.
Ventajas
- Auto-alojado: Tienes control total sobre tus datos y privacidad.
- Organizador todo en uno: Actúa como un centro neurálgico para todo tu contenido digital, no solo enlaces.
- Moderno y en desarrollo activo: Construido con un stack tecnológico moderno y con una comunidad activa.
- Personalizable: Un motor basado en reglas permite una gestión personalizada de tus marcadores.
Docker compose
services:
web:
image: ghcr.io/karakeep-app/karakeep:${KARAKEEP_VERSION:-release}
restart: unless-stopped
volumes:
- data:/data
ports:
- 3000:3000
env_file:
- .env
environment:
MEILI_ADDR: http://meilisearch:7700
BROWSER_WEB_URL: http://chrome:9222
DATA_DIR: /data # DON'T CHANGE THIS
chrome:
image: gcr.io/zenika-hub/alpine-chrome:124
restart: unless-stopped
command:
- --no-sandbox
- --disable-gpu
- --disable-dev-shm-usage
- --remote-debugging-address=0.0.0.0
- --remote-debugging-port=9222
- --hide-scrollbars
meilisearch:
image: getmeili/meilisearch:v1.13.3
restart: unless-stopped
env_file:
- .env
environment:
MEILI_NO_ANALYTICS: "true"
volumes:
- meilisearch:/meili_data
volumes:
meilisearch:
data:
Archivo de Entorno (.env)
Crea un archivo .env y define las siguientes variables. Es crítico usar valores aleatorios y seguros.
KARAKEEP_VERSION=release
NEXTAUTH_SECRET=super_random_string
MEILI_MASTER_KEY=another_random_string
NEXTAUTH_URL=http://localhost:3000
NEXTAUTH_URL: Cámbialo por la URL de tu servidor.