Cette page est informative et sans valeur de conseil. Téléchargez toujours depuis la source officielle de chaque outil, vérifiez la licence du logiciel et des modèles, et gardez en tête qu'un modèle d'IA peut se tromper : croisez les informations importantes.
À quoi ça sert
Ollama est un moteur d'inférence qui télécharge et lance des modèles de langage directement sur votre ordinateur — Windows, macOS ou Linux. Une fois installé, une seule commande (`ollama run llama3`) suffit pour discuter avec une IA. Tout reste local, rien n'est envoyé en ligne.
Pour qui
Idéal pour quelqu'un à l'aise avec un terminal et qui veut démarrer rapidement. Si vous préférez une interface graphique sans ligne de commande, explorez plutôt GPT4All, LM Studio ou Jan.
Installation
Télécharger et installer
Rendez-vous sur la source officielle : ollama.com. Téléchargez l'installeur pour votre système d'exploitation et lancez-le.
Vérifier l'installation
Ouvrez un terminal et saisissez :
ollama --version
Si un numéro de version s'affiche, tout fonctionne.
Lancer votre premier modèle
Pour télécharger et lancer un modèle en une seule commande :
ollama run llama3.2
La première fois, Ollama télécharge le modèle (durée variable selon votre connexion). Ensuite, vous pouvez discuter directement dans le terminal.
Commandes utiles
# Lister les modèles installés
ollama list
# Télécharger un modèle sans le lancer
ollama pull mistral
# Voir les modèles en cours d'exécution
ollama ps
# Supprimer un modèle (pour libérer de l'espace)
ollama rm llama3.2
# Quitter une conversation
/bye
# ou : Ctrl + D
Précautions d'usage
- La mémoire compte. Un modèle consomme de la RAM (et parfois la VRAM de votre carte graphique). Commencez par un modèle léger et ajustez selon vos capacités.
- Les modèles peuvent se tromper. Un modèle local (7 à 13 milliards de paramètres généralement) est plus petit qu'un service cloud : ses réponses sont souvent bonnes, mais pas toujours. Vérifiez avant de suivre un conseil important.
- Les licences varient. Le logiciel Ollama est open source, mais chaque modèle a sa propre licence. Lisez-la avant tout usage professionnel ou commercial.
- Mettez à jour régulièrement. Téléchargez toujours depuis la source officielle et pensez à mettre à jour Ollama pour les corrections de sécurité.
Matrice de risque
| Risque | Niveau | Mitigation |
|---|---|---|
| Fuite de données vers le cloud | 🟢 Faible — tout reste local | Rester en usage local, éviter les API distantes |
| Réponse erronée du modèle | 🟡 Moyen | Vérifier, croiser les sources, ne pas faire confiance aveuglément |
| Licence du modèle mal adaptée | 🟡 Moyen | Lire la licence avant usage professionnel |
| Surcharge de la machine (RAM/CPU) | 🟡 Moyen | Choisir un modèle adapté à votre matériel, tester avant l'usage professionnel |
Sécurité
Tout le traitement reste sur votre poste — aucune donnée n'est envoyée en ligne. Pensez à :
- Mettre à jour Ollama régulièrement. Les mises à jour de sécurité arrivent souvent.
- Ne télécharger des modèles que depuis des sources fiables. Le site officiel ollama.com propose un catalogue, ou Hugging Face (via llama-cli ou d'autres outils).
- Garder Ollama local par défaut. Le serveur API d'Ollama (port 11434) écoute par défaut sur localhost — c'est bon. N'exposez pas Ollama sur Internet sans authentification.
Aller plus loin
- Guide complet : Installer Ollama pas à pas — toutes les étapes expliquées en détail.
- Open WebUI — une interface web confortable pour piloter Ollama.
- llama.cpp — le moteur bas niveau sur lequel Ollama repose.
- OSIALab — comparer Ollama avec d'autres outils (GPT4All, LM Studio, Jan).
Sources
- Site officiel : ollama.com
- Code source : github.com/ollama/ollama
- Documentation : github.com/ollama/ollama/wiki