OSFRIA Découvrir les outils

OSIALab · Moteur local

Ollama — faire tourner des modèles d'IA en local

Ollama permet de télécharger et faire tourner des modèles de langage sur votre propre machine, sans cloud. C'est l'option la plus simple pour débuter avec l'IA locale : quelques commandes suffisent.

Cette page est informative et sans valeur de conseil. Téléchargez toujours depuis la source officielle de chaque outil, vérifiez la licence du logiciel et des modèles, et gardez en tête qu'un modèle d'IA peut se tromper : croisez les informations importantes.

À quoi ça sert

Ollama est un moteur d'inférence qui télécharge et lance des modèles de langage directement sur votre ordinateur — Windows, macOS ou Linux. Une fois installé, une seule commande (`ollama run llama3`) suffit pour discuter avec une IA. Tout reste local, rien n'est envoyé en ligne.

Pour qui

Idéal pour quelqu'un à l'aise avec un terminal et qui veut démarrer rapidement. Si vous préférez une interface graphique sans ligne de commande, explorez plutôt GPT4All, LM Studio ou Jan.

Installation

Télécharger et installer

Rendez-vous sur la source officielle : ollama.com. Téléchargez l'installeur pour votre système d'exploitation et lancez-le.

Vérifier l'installation

Ouvrez un terminal et saisissez :

ollama --version

Si un numéro de version s'affiche, tout fonctionne.

Lancer votre premier modèle

Pour télécharger et lancer un modèle en une seule commande :

ollama run llama3.2

La première fois, Ollama télécharge le modèle (durée variable selon votre connexion). Ensuite, vous pouvez discuter directement dans le terminal.

Commandes utiles

# Lister les modèles installés
ollama list

# Télécharger un modèle sans le lancer
ollama pull mistral

# Voir les modèles en cours d'exécution
ollama ps

# Supprimer un modèle (pour libérer de l'espace)
ollama rm llama3.2

# Quitter une conversation
/bye
# ou : Ctrl + D

Précautions d'usage

  • La mémoire compte. Un modèle consomme de la RAM (et parfois la VRAM de votre carte graphique). Commencez par un modèle léger et ajustez selon vos capacités.
  • Les modèles peuvent se tromper. Un modèle local (7 à 13 milliards de paramètres généralement) est plus petit qu'un service cloud : ses réponses sont souvent bonnes, mais pas toujours. Vérifiez avant de suivre un conseil important.
  • Les licences varient. Le logiciel Ollama est open source, mais chaque modèle a sa propre licence. Lisez-la avant tout usage professionnel ou commercial.
  • Mettez à jour régulièrement. Téléchargez toujours depuis la source officielle et pensez à mettre à jour Ollama pour les corrections de sécurité.

Matrice de risque

Risque Niveau Mitigation
Fuite de données vers le cloud 🟢 Faible — tout reste local Rester en usage local, éviter les API distantes
Réponse erronée du modèle 🟡 Moyen Vérifier, croiser les sources, ne pas faire confiance aveuglément
Licence du modèle mal adaptée 🟡 Moyen Lire la licence avant usage professionnel
Surcharge de la machine (RAM/CPU) 🟡 Moyen Choisir un modèle adapté à votre matériel, tester avant l'usage professionnel

Sécurité

Tout le traitement reste sur votre poste — aucune donnée n'est envoyée en ligne. Pensez à :

  • Mettre à jour Ollama régulièrement. Les mises à jour de sécurité arrivent souvent.
  • Ne télécharger des modèles que depuis des sources fiables. Le site officiel ollama.com propose un catalogue, ou Hugging Face (via llama-cli ou d'autres outils).
  • Garder Ollama local par défaut. Le serveur API d'Ollama (port 11434) écoute par défaut sur localhost — c'est bon. N'exposez pas Ollama sur Internet sans authentification.

Aller plus loin

Sources