Cette page est informative et sans valeur de conseil. Téléchargez toujours depuis la source officielle de chaque outil, vérifiez la licence du logiciel et des modèles, et gardez en tête qu'un modèle d'IA peut se tromper : croisez les informations importantes.
À quoi ça sert
Khoj fonctionne comme un assistant personnel ancré dans vos propres données. Il indexe vos notes Obsidian, vos fichiers Org-mode, vos PDF et vos pages web sauvegardées, puis les combine avec une recherche web optionnelle pour répondre à vos questions en indiquant toujours les sources utilisées.
Il peut s'utiliser depuis une interface web, via des plugins Obsidian ou Emacs, ou par API. Le traitement peut se faire en local (avec Ollama) ou via un fournisseur cloud selon votre configuration.
Pour qui
Pour les profils avancés qui gèrent déjà une base de notes (Obsidian, Org-mode, Markdown) et veulent la rendre interrogeable. Khoj convient également aux équipes souhaitant un assistant qui cite ses sources. L'installation nécessite Docker ou pip — un minimum de technique est requis.
Installation
Option 1 — Docker (recommandé)
# Lancer Khoj avec Docker
docker run -d \
-p 42110:42110 \
-v ~/.khoj:/root/.khoj \
--name khoj \
ghcr.io/khoj-ai/khoj:latest
Accédez ensuite à http://localhost:42110 dans votre navigateur.
Option 2 — pip
# Créer un environnement virtuel
python -m venv .venv
source .venv/bin/activate # Linux / macOS
.venv\Scripts\activate # Windows
# Installer Khoj
pip install khoj
# Lancer
khoj
Connecter un modèle local
Dans les réglages de l'interface web, sélectionnez Ollama comme fournisseur et renseignez l'adresse http://localhost:11434. Si Ollama n'est pas encore installé, consultez la fiche Ollama.
Indexer vos fichiers
Dans l'interface, allez dans Agents > Sources et ajoutez le chemin vers vos dossiers de notes ou PDF. Khoj les indexe en tâche de fond. Vous pouvez ensuite poser des questions dans la zone de chat.
Précautions d'usage
- La recherche web envoie des requêtes à des moteurs tiers. Si la confidentialité est prioritaire, désactivez la recherche web dans les réglages et restez en mode local uniquement.
- Les réponses peuvent citer des sources incorrectes. Khoj indique toujours ses sources, mais vérifiez-les avant de vous appuyer sur une information importante.
- Si un fournisseur cloud est configuré, vos données transitent en ligne. Utilisez Ollama pour un traitement strictement local.
- Vérifiez la licence (AGPL-3.0). Khoj est distribué sous AGPL — lisez-la avant tout déploiement professionnel ou commercial.
Matrice de risque
| Risque | Niveau | Mitigation |
|---|---|---|
| Fuite de données si mode cloud activé | 🔴 Élevé en mode cloud | Configurer Ollama en local et désactiver la recherche web pour les données sensibles |
| Réponse erronée ou source mal citée | 🟡 Moyen | Toujours vérifier les sources indiquées dans la réponse |
| Licence AGPL contraignante | 🟡 Moyen en contexte commercial | Lire la licence AGPL-3.0 avant usage professionnel ou redistribution |
| Consommation mémoire sur gros corpus | 🟡 Moyen | Indexer progressivement, surveiller la RAM disponible |
Sécurité
En mode local avec Ollama, vos fichiers ne quittent pas votre machine. Ce qu'il faut surveiller :
- Ne pas exposer le port 42110 sur Internet sans authentification. L'accès local ou via VPN est préférable.
- La recherche web contacte des services externes. Désactivez-la si vous manipulez des données confidentielles.
- Mettez à jour régulièrement en suivant les releases officielles sur GitHub.
Aller plus loin
- Ollama — moteur local à connecter à Khoj.
- AnythingLLM — alternative tout-en-un pour interroger des documents.
- Docling — préparer vos PDF pour une meilleure indexation.
- Onyx — knowledge base orientée équipe et entreprise.
- OSIALab — vue d'ensemble de tous les outils.
Sources
- Site officiel : khoj.dev
- Code source : github.com/khoj-ai/khoj
- Documentation : docs.khoj.dev