OSFRIA Découvrir les outils

OSIALab · Documents / RAG

Khoj — assistant personnel avec recherche dans vos documents et sur le web

Khoj est un assistant IA qui indexe vos fichiers locaux (notes, PDF, Markdown), les connecte à une recherche web optionnelle, et répond à vos questions en citant ses sources — en local ou via votre propre serveur.

Cette page est informative et sans valeur de conseil. Téléchargez toujours depuis la source officielle de chaque outil, vérifiez la licence du logiciel et des modèles, et gardez en tête qu'un modèle d'IA peut se tromper : croisez les informations importantes.

À quoi ça sert

Khoj fonctionne comme un assistant personnel ancré dans vos propres données. Il indexe vos notes Obsidian, vos fichiers Org-mode, vos PDF et vos pages web sauvegardées, puis les combine avec une recherche web optionnelle pour répondre à vos questions en indiquant toujours les sources utilisées.

Il peut s'utiliser depuis une interface web, via des plugins Obsidian ou Emacs, ou par API. Le traitement peut se faire en local (avec Ollama) ou via un fournisseur cloud selon votre configuration.

Pour qui

Pour les profils avancés qui gèrent déjà une base de notes (Obsidian, Org-mode, Markdown) et veulent la rendre interrogeable. Khoj convient également aux équipes souhaitant un assistant qui cite ses sources. L'installation nécessite Docker ou pip — un minimum de technique est requis.

Installation

Option 1 — Docker (recommandé)

# Lancer Khoj avec Docker
docker run -d \
  -p 42110:42110 \
  -v ~/.khoj:/root/.khoj \
  --name khoj \
  ghcr.io/khoj-ai/khoj:latest

Accédez ensuite à http://localhost:42110 dans votre navigateur.

Option 2 — pip

# Créer un environnement virtuel
python -m venv .venv
source .venv/bin/activate   # Linux / macOS
.venv\Scripts\activate      # Windows

# Installer Khoj
pip install khoj

# Lancer
khoj

Connecter un modèle local

Dans les réglages de l'interface web, sélectionnez Ollama comme fournisseur et renseignez l'adresse http://localhost:11434. Si Ollama n'est pas encore installé, consultez la fiche Ollama.

Indexer vos fichiers

Dans l'interface, allez dans Agents > Sources et ajoutez le chemin vers vos dossiers de notes ou PDF. Khoj les indexe en tâche de fond. Vous pouvez ensuite poser des questions dans la zone de chat.

Précautions d'usage

  • La recherche web envoie des requêtes à des moteurs tiers. Si la confidentialité est prioritaire, désactivez la recherche web dans les réglages et restez en mode local uniquement.
  • Les réponses peuvent citer des sources incorrectes. Khoj indique toujours ses sources, mais vérifiez-les avant de vous appuyer sur une information importante.
  • Si un fournisseur cloud est configuré, vos données transitent en ligne. Utilisez Ollama pour un traitement strictement local.
  • Vérifiez la licence (AGPL-3.0). Khoj est distribué sous AGPL — lisez-la avant tout déploiement professionnel ou commercial.

Matrice de risque

Risque Niveau Mitigation
Fuite de données si mode cloud activé 🔴 Élevé en mode cloud Configurer Ollama en local et désactiver la recherche web pour les données sensibles
Réponse erronée ou source mal citée 🟡 Moyen Toujours vérifier les sources indiquées dans la réponse
Licence AGPL contraignante 🟡 Moyen en contexte commercial Lire la licence AGPL-3.0 avant usage professionnel ou redistribution
Consommation mémoire sur gros corpus 🟡 Moyen Indexer progressivement, surveiller la RAM disponible

Sécurité

En mode local avec Ollama, vos fichiers ne quittent pas votre machine. Ce qu'il faut surveiller :

  • Ne pas exposer le port 42110 sur Internet sans authentification. L'accès local ou via VPN est préférable.
  • La recherche web contacte des services externes. Désactivez-la si vous manipulez des données confidentielles.
  • Mettez à jour régulièrement en suivant les releases officielles sur GitHub.

Aller plus loin

  • Ollama — moteur local à connecter à Khoj.
  • AnythingLLM — alternative tout-en-un pour interroger des documents.
  • Docling — préparer vos PDF pour une meilleure indexation.
  • Onyx — knowledge base orientée équipe et entreprise.
  • OSIALab — vue d'ensemble de tous les outils.

Sources