Note informative, sans valeur de conseil. Une idée par note, reliée à ses voisines et aux outils concernés.
L'idée en deux mots
WebGPU est une technologie du navigateur qui donne aux pages web un accès direct à la carte graphique. Couplée à de petits modèles et à des bibliothèques comme WebLLM ou Transformers.js, elle permet de faire tourner une IA entièrement côté navigateur. Le fichier du modèle se télécharge une fois, se met en cache, puis chaque réponse est calculée sur votre matériel — rien ne part en ligne.
Les ordres de grandeur restent modestes (un portable fait tourner un modèle de l'ordre de 1 à 2 milliards de paramètres à vitesse utilisable), et une solution de repli sur le processeur existe quand le GPU manque. Mais le principe est puissant : pas d'installation, pas de serveur, pas de compte.
Pourquoi c'est prometteur
Pour la découverte, c'est idéal : tester une IA en deux clics, sans rien installer, lève une vraie barrière à l'entrée. Et le modèle « zéro serveur » est une aubaine pour la vie privée et le hors-ligne, dans le droit fil de l'IA locale. Pour des usages plus exigeants, on revient aux moteurs dédiés comme Ollama — mais comme première marche, WebGPU est une porte d'entrée idéale.
À relier
- La vie privée préservée — rien ne quitte l'appareil.
- Fonctionne hors-ligne — une fois le modèle en cache.
- La quantification — ce qui fait tenir le modèle dans l'onglet.
- Bien débuter — une première marche sans installation.