P

Computer Use : Définition et Exemples

Capacité d'un modèle d'IA à interagir directement avec un ordinateur en contrôlant la souris, le clavier et l'écran, comme le ferait un utilisateur humain.

Définition complète

Le Computer Use (ou utilisation de l'ordinateur) désigne une fonctionnalité avancée permettant à un modèle d'intelligence artificielle de prendre le contrôle d'un environnement informatique. Concrètement, l'IA peut voir ce qui s'affiche à l'écran via des captures d'écran, déplacer le curseur de la souris, cliquer sur des éléments, taper du texte au clavier et naviguer entre différentes applications.

Cette capacité représente un changement de paradigme majeur dans l'interaction homme-machine. Plutôt que de se limiter à générer du texte ou du code, l'IA devient un véritable agent capable d'exécuter des tâches complexes dans un environnement graphique réel. Elle peut par exemple remplir un formulaire web, manipuler un tableur, utiliser un logiciel de design ou effectuer des recherches sur internet de manière autonome.

Le Computer Use repose sur une boucle perception-action : le modèle reçoit une capture d'écran, analyse visuellement son contenu, décide de l'action à effectuer (clic, frappe clavier, défilement), puis observe le résultat pour planifier l'étape suivante. Cette approche itérative permet de gérer des workflows multi-étapes sans intervention humaine constante.

Introduit par Anthropic avec Claude en octobre 2024, le Computer Use ouvre la voie à l'automatisation de tâches répétitives qui nécessitaient jusqu'alors une intervention humaine. Il se distingue des API et des scripts classiques car il interagit avec les interfaces graphiques existantes, sans nécessiter d'intégration technique préalable avec les logiciels utilisés.

Étymologie

Le terme « Computer Use » est un anglicisme qui signifie littéralement « utilisation de l'ordinateur ». Il a été popularisé par Anthropic lors du lancement de cette fonctionnalité pour Claude en 2024. Le choix de ce nom simple reflète l'ambition : permettre à l'IA d'utiliser un ordinateur exactement comme un humain le ferait, sans distinction entre les deux types d'utilisateurs du point de vue de la machine.

Exemples concrets

Automatisation de tâches administratives répétitives

Ouvre le navigateur, connecte-toi à notre CRM, exporte la liste des clients actifs du mois dernier au format CSV, puis envoie ce fichier par email à l'équipe commerciale.

Test d'interfaces utilisateur

Navigue sur notre site web, teste le parcours d'inscription complet en remplissant chaque champ du formulaire, et signale tout problème d'affichage ou d'ergonomie que tu constates.

Recherche et synthèse d'informations sur le web

Recherche les 5 dernières actualités sur la réglementation européenne de l'IA, ouvre chaque article, lis le contenu et produis une synthèse structurée avec les sources.

Usage pratique

En prompt engineering, le Computer Use permet de déléguer à l'IA des tâches qui impliquent des interfaces graphiques, sans avoir besoin de développer des intégrations API. Il est particulièrement utile pour automatiser des workflows impliquant plusieurs logiciels différents. Pour obtenir les meilleurs résultats, décrivez les étapes de manière séquentielle et précise, en indiquant les noms exacts des boutons ou menus sur lesquels cliquer.

Concepts liés

Agent IATool UseAutomatisationVision par ordinateurAgentic AI

FAQ

Quelle est la différence entre Computer Use et Tool Use ?
Le Tool Use permet à l'IA d'appeler des fonctions ou des API prédéfinies par le développeur, tandis que le Computer Use lui permet d'interagir directement avec l'interface graphique d'un ordinateur (écran, souris, clavier). Le Tool Use est plus rapide et fiable pour des actions spécifiques, mais le Computer Use est plus flexible car il peut interagir avec n'importe quelle application sans intégration préalable.
Le Computer Use est-il fiable pour des tâches critiques ?
Le Computer Use est encore une fonctionnalité en phase expérimentale. Il peut commettre des erreurs de clic, mal interpréter certains éléments visuels ou se perdre dans des interfaces complexes. Il est recommandé de l'utiliser avec supervision humaine pour les tâches critiques et de privilégier les API quand elles sont disponibles pour les opérations sensibles.
Quels modèles d'IA supportent le Computer Use ?
Anthropic a été le premier à lancer cette fonctionnalité avec Claude en octobre 2024. Depuis, d'autres acteurs comme OpenAI avec son « Operator » ont proposé des capacités similaires. La fonctionnalité est accessible via l'API d'Anthropic et certains outils comme Claude Code. Elle nécessite un environnement d'exécution adapté (machine virtuelle ou bureau distant) pour des raisons de sécurité.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.