Au-delà du prompt : l'UX de la conversation
L'explosion des chatbots IA depuis ChatGPT a créé un nouveau champ de design : le design conversationnel à grande échelle. Les travaux fondateurs de Moore et Arar (2019) identifient les composants clés d'une conversation réussie avec un agent IA : le turn-taking (gestion des tours de parole), le grounding (vérification de la compréhension mutuelle), le repair (correction des malentendus), et le framing (cadrage du périmètre de compétence).
L'erreur la plus fréquente des designers de chatbots : se concentrer sur la qualité des réponses en ignorant la qualité de l'interaction. Les études de Følstad et Brandtzæg (2020) montrent que la satisfaction utilisateur corrèle davantage avec la fluidité de l'échange (temps de réponse, pertinence des questions de suivi, gestion des ambiguïtés) qu'avec la précision factuelle des réponses.
Ce paradoxe s'explique par les attentes conversationnelles : dans une conversation humaine, on tolère les approximations et les corrections, mais on ne tolère pas l'absence de réactivité ou le non-respect des conventions sociales de la conversation. Un chatbot qui répond parfaitement mais ignore les signaux de l'utilisateur (frustration, reformulation, changement de sujet) est perçu comme incompétent.
Personnalité et ton : le calibrage crucial
Les recherches de Nass et al. (2001), confirmées par Volkel et al. (2021) dans le contexte des LLM, montrent que les utilisateurs attribuent une personnalité aux agents conversationnels dans les 30 premières secondes d'interaction. Cette personnalité perçue influence toute la suite de l'échange : confiance, patience, intention de réutilisation.
Le calibrage du ton est un acte de design critique. Trop formel (« Je vous prie de bien vouloir reformuler votre requête ») crée une distance qui décourage l'exploration. Trop familier (« Hey ! Super question 🔥 ») crée une dissonance quand le chatbot échoue — personne ne veut qu'un agent enjoué dise « Oups, j'ai pas compris lol » quand il s'agit d'une réclamation bancaire.
Le sweet spot identifié par les études : un ton professionnel-accessible, qui varie selon le contexte émotionnel de l'échange. Quand l'utilisateur est en mode exploration, le chatbot peut être plus conversationnel. Quand l'utilisateur est frustré ou pressé, le ton doit devenir plus direct et factuel. Cette adaptation tonale est un signal de compétence sociale que les utilisateurs reconnaissent intuitivement.
Gestion des erreurs et des limites
Les travaux de Ashktorab et al. (2019) à IBM Research ont identifié le facteur #1 d'abandon des chatbots : la mauvaise gestion des erreurs. Un chatbot qui prétend avoir compris quand ce n'est pas le cas, qui boucle sur des réponses génériques, ou qui ignore une correction de l'utilisateur, perd la confiance de manière irréversible.
Le pattern le plus efficace est le « graceful degradation with handoff ». Le chatbot reconnaît explicitement qu'il ne peut pas aider (« Je ne suis pas sûr de comprendre votre demande sur les remboursements internationaux »), propose une action alternative (« Voulez-vous que je vous connecte avec un conseiller spécialisé ? »), et conserve le contexte de la conversation pour le transfert.
Un résultat surprenant des recherches de Kocielnik et al. (2019) : les chatbots qui annoncent proactivement leurs limites (« Je peux vous aider pour X et Y, mais pas pour Z ») obtiennent une satisfaction supérieure de 22 % par rapport aux chatbots qui essaient de tout gérer. La transparence sur les limites augmente paradoxalement la confiance, parce qu'elle calibre les attentes.
Turn-taking et rythme conversationnel
Le turn-taking — qui parle quand — est un mécanisme social fondamental que les chatbots violent constamment. Les études de Skantze (2021) sur les agents conversationnels montrent que les pauses, le timing et les signaux de continuation sont aussi importants que le contenu des messages.
Le pattern problématique le plus répandu : le « mur de texte ». Le chatbot génère une réponse de 500 mots d'un bloc. En conversation humaine, personne ne parle pendant 3 minutes sans pause. La solution : découper les réponses longues en messages séquentiels avec des pauses simulées (indicateur de frappe), des points de checkpoint (« Jusque-là, est-ce clair ? »), et des opportunités d'interruption.
Les recherches sur le timing montrent que le délai de réponse optimal se situe entre 1 et 3 secondes. En dessous d'une seconde, l'utilisateur perçoit la réponse comme automatique et non réfléchie. Au-dessus de 5 secondes, l'anxiété d'attente s'installe. Pour les LLM qui streament le texte, l'affichage progressif résout en partie ce problème, mais les premiers tokens sont critiques — ils doivent signaler la pertinence de la réponse immédiatement.
L'avenir du design conversationnel
Les travaux de Clark et al. (2019) sur les attentes des utilisateurs envers les agents IA identifient un shift générationnel : les utilisateurs qui ont grandi avec les assistants vocaux (Siri, Alexa) ont des attentes conversationnelles plus élevées que ceux qui ont découvert les chatbots avec ChatGPT. Ils tolèrent moins les réponses mécaniques et attendent des capacités de suivi de contexte sur plusieurs échanges.
La direction de recherche la plus prometteuse est le « grounded conversation design » : concevoir des conversations IA ancrées dans le contexte réel de l'utilisateur. Pas seulement son historique de chat, mais son contexte d'usage (mobile vs desktop, heure de la journée, tâche en cours). Un chatbot de support qui sait que l'utilisateur vient de la page « annulation » n'a pas besoin de demander « Comment puis-je vous aider ? » — il peut directement proposer « Vous souhaitez annuler votre abonnement ? ».
Pour les designers, le design conversationnel est un domaine où l'empathie et la rigueur technique se rejoignent. Chaque conversation est un micro-parcours utilisateur avec ses points de friction, ses moments de vérité et ses opportunités de delight. Les outils changent (des arbres de décision aux LLM), mais les principes de design centré utilisateur restent les mêmes.