Retour aux ressources
2
Module 2

Comment fonctionne un site web IA-ready

AEO, Schema.org, llms.txt — optimiser pour les moteurs IA

12 min

Du SEO au AEO — un changement de paradigme

Pendant vingt ans, le référencement web a été synonyme de SEO (Search Engine Optimization). L'objectif était simple : apparaître dans les premiers résultats de Google. Mais depuis 2024, un nouveau canal de découverte émerge : les moteurs de réponse. ChatGPT, Perplexity, Gemini, Copilot — ces outils ne renvoient pas une liste de liens. Ils fournissent directement une réponse, en citant leurs sources.

L'AEO (Answer Engine Optimization) est l'art de rendre votre site web citable par ces moteurs de réponse. Ce n'est pas un remplacement du SEO — c'est une couche supplémentaire. Un site optimisé pour l'AEO continue de bien se positionner sur Google, mais il devient aussi une source privilégiée pour les agents IA.

En résumé

Le SEO optimise pour les résultats de recherche classiques
L'AEO optimise pour les réponses générées par les IA conversationnelles
Les deux approches sont complémentaires, pas opposées

Simulateur d'audit AEO

Comparez l'optimisation AEO de deux sites

somastudio.xyz

Cliquez sur "Lancer l'audit" pour démarrer

Les trois piliers d'un site IA-ready

Le balisage sémantique (Schema.org)

Le fichier llms.txt

La performance technique

Schema.org est un vocabulaire standardisé qui permet de décrire le contenu d'une page web de manière structurée. Au lieu de laisser un moteur IA deviner que « SOMA Studio » est une entreprise, que « 1 200 € » est un prix, et que « Aix-en-Provence » est une localisation, on le déclare explicitement dans le code HTML.

Les types Schema.org les plus utiles pour une entreprise de services sont : Organization (identité de l'entreprise), ProfessionalService (type d'activité), FAQPage (questions fréquentes), HowTo (processus de travail), et BreadcrumbList (fil d'Ariane). Chaque type enrichit la compréhension que les moteurs IA ont de votre contenu.

Concept clé

Schema.org est un vocabulaire standardisé qui décrit le contenu d'une page de façon structurée. Il permet aux machines de comprendre non seulement ce que contient une page, mais ce que ces informations signifient.

Le fichier llms.txt est l'équivalent du robots.txt pour les agents IA. Placé à la racine de votre site (/llms.txt), il fournit un résumé structuré de ce que votre entreprise fait, de vos services, de vos coordonnées, et des pages importantes. Les moteurs de réponse le consultent pour comprendre rapidement de quoi parle votre site sans avoir à crawler toutes les pages.

Un bon llms.txt contient : le nom de l'entreprise, une description courte, la liste des services avec descriptions, les liens vers les pages clés, les coordonnées de contact, et les questions fréquentes. C'est un document texte brut, facile à maintenir, qui sert de carte de visite pour les IA.

Un site IA-ready doit être techniquement performant : temps de chargement rapide, HTML sémantique propre, pas de contenu caché derrière du JavaScript lourd. Les crawlers IA privilégient les sites qui leur facilitent l'extraction de contenu. Le server-side rendering (SSR) et l'incremental static regeneration (ISR) sont des architectures qui rendent le contenu immédiatement disponible sans exécution JavaScript côté client.

En résumé

Organization, FAQPage, BreadcrumbList, HowTo : les schémas essentiels
Le balisage sémantique transforme du texte brut en données structurées
Google et les IA utilisent ces données pour construire leurs réponses

Ce qui se passe quand un moteur IA cite votre site

Quand un utilisateur demande à Perplexity « Quel studio IA propose des chatbots RAG à Aix-en-Provence ? », le moteur de réponse parcourt ses sources, identifie les pages pertinentes, et formule une réponse. Si votre site est bien structuré (Schema.org, llms.txt, contenu clair), vous avez de fortes chances d'être cité comme source. Cette citation inclut souvent un lien vers votre site — c'est un trafic qualifié, avec une intention forte.

À l'inverse, un site sans balisage sémantique, sans llms.txt, avec du contenu dynamique chargé en JavaScript, sera invisible pour ces moteurs. Il ne sera tout simplement pas considéré comme source fiable.

Concept clé

Le fichier llms.txt est au LLM ce que robots.txt est au moteur de recherche : un guide explicite de ce que le site propose et comment le comprendre.

En résumé

llms.txt présente votre site en langage naturel aux IA
Il complète le balisage structuré avec du contexte humain
Son adoption est encore récente, ce qui crée un avantage pour les premiers adopteurs

Checklist pratique

Pour évaluer si votre site est IA-ready, vérifiez ces points. Avez-vous du balisage Schema.org sur vos pages principales ? Avez-vous un fichier llms.txt à la racine de votre domaine ? Votre contenu est-il accessible sans JavaScript ? Vos pages de services ont-elles des descriptions claires et structurées ? Vos FAQ sont-elles balisées en FAQPage ? Si vous répondez non à plus de deux de ces questions, votre site est probablement invisible pour les moteurs de réponse.

En résumé

Le SSR rend le contenu immédiatement lisible par les crawlers
Un temps de chargement inférieur à 2 secondes est le seuil cible
Les Core Web Vitals restent un signal de qualité pour Google et les IA

Quiz — Validez vos acquis

4/4 bonnes réponses requises pour valider ce module.

1. Que signifie AEO ?

2. Quel est le rôle du fichier llms.txt ?

3. Pourquoi le server-side rendering (SSR) est-il important pour l'AEO ?

4. Quel type Schema.org est le plus pertinent pour une page de questions fréquentes ?