OSFRIA Découvrir les outils

OSIALab · Documents / RAG

Onyx — moteur de recherche IA et knowledge base pour les équipes

Onyx (anciennement Danswer) connecte vos outils d'équipe — Confluence, Notion, Google Drive, Slack, fichiers locaux — à un moteur de recherche alimenté par l'IA, tout en restant déployable sur votre propre infrastructure.

Cette page est informative et sans valeur de conseil. Téléchargez toujours depuis la source officielle de chaque outil, vérifiez la licence du logiciel et des modèles, et gardez en tête qu'un modèle d'IA peut se tromper : croisez les informations importantes.

À quoi ça sert

Onyx est un assistant de recherche d'entreprise : il indexe vos sources de connaissance (wikis, bases documentaires, canaux Slack, fichiers partagés) et permet à chaque membre d'une équipe de poser des questions en langage naturel. Les réponses indiquent toujours les documents sources.

Contrairement aux solutions SaaS du marché, Onyx peut se déployer entièrement sur vos serveurs — vos données ne quittent pas votre périmètre si vous choisissez un modèle local ou un hébergement souverain.

Pour qui

Pour les équipes et petites structures qui souhaitent une base de connaissance interrogeable sans envoyer leurs données dans un service cloud tiers. Niveau requis : avancé à expert — l'installation Docker est conséquente, et la configuration des connecteurs demande un certain investissement initial.

Pour un usage individuel ou une petite documentation, AnythingLLM ou Khoj seront plus simples à mettre en place.

Installation

Prérequis

Docker et Docker Compose. Un serveur Linux (ou Windows avec WSL2) avec au moins 8 Go de RAM est recommandé pour un usage confortable.

Déploiement avec Docker Compose

# Cloner le dépôt officiel
git clone https://github.com/onyx-dot-app/onyx.git
cd onyx/deployment/docker_compose

# Copier et adapter la configuration
cp .env.prod.example .env.prod
# Éditer .env.prod : définir les mots de passe, le domaine, le fournisseur LLM

# Lancer les services
docker compose -f docker-compose.prod.yml up -d

L'interface est accessible sur http://localhost:3000 (ou votre domaine configuré).

Connecter un modèle local

Dans les réglages administrateur, choisissez Ollama comme fournisseur LLM et saisissez l'adresse de votre instance Ollama. Consultez la fiche Ollama pour l'installation du moteur.

Ajouter des sources de données (connecteurs)

Depuis l'interface admin, activez les connecteurs correspondant à vos outils (Confluence, Notion, Google Drive, GitHub, dossiers locaux…). Chaque connecteur indexe régulièrement les nouvelles données.

Précautions d'usage

  • Vérifiez la licence en vigueur. Onyx a changé de nom (anciennement Danswer) et sa licence a évolué — lisez attentivement les conditions actuelles sur le dépôt GitHub avant tout déploiement commercial.
  • Les connecteurs cloud envoient des données à des services tiers. Connecter Google Drive ou Slack implique que ces services restent impliqués dans la chaîne. Pour une confidentialité maximale, limitez-vous à des sources locales.
  • Les réponses peuvent être inexactes. Onyx cite ses sources, mais vérifiez toujours les informations importantes dans les documents d'origine.
  • L'infrastructure demande de la maintenance. Mises à jour, sauvegardes de la base vectorielle, surveillance des services — prévoir un responsable technique.

Matrice de risque

Risque Niveau Mitigation
Fuite de données via connecteurs cloud 🟡 Moyen si connecteurs cloud activés Limiter aux sources locales pour les données sensibles
Licence évolutive (changement Danswer → Onyx) 🔴 Élevé sans vérification Lire la licence actuelle sur le dépôt officiel avant tout usage commercial
Réponse erronée ou source mal citée 🟡 Moyen Toujours vérifier les sources indiquées dans la réponse
Infrastructure complexe, risque de mauvaise configuration 🟡 Moyen Suivre la documentation officielle, ne pas exposer sans authentification

Sécurité

Onyx sur infrastructure propre garde vos données sous contrôle. Quelques points incontournables :

  • Sécurisez l'accès avec HTTPS et un reverse proxy (Nginx, Caddy) — ne laissez pas le port 3000 exposé directement.
  • Activez l'authentification dès le premier lancement : Onyx supporte plusieurs modes (email/mot de passe, SSO, SAML selon la version).
  • Sauvegardez la base de données et l'index vectoriel régulièrement — une reconstruction d'index peut prendre plusieurs heures sur un large corpus.
  • Suivez les releases et les annonces de sécurité sur le dépôt officiel.

Aller plus loin

  • Ollama — moteur local à connecter à Onyx.
  • AnythingLLM — alternative plus simple pour un usage individuel.
  • Khoj — assistant personnel avec recherche dans vos notes et sur le web.
  • Docling — préparer vos PDF avant indexation.
  • OSIALab — vue d'ensemble de tous les outils.

Sources