Développement · 16 juin 2026 · Par Anna Bailly

Lesbienne, masturbation et pénis : quand le correcteur de Microsoft Word refuse d’écrire certains mots

L’essentiel avec votre IAChatGPT Claude Gemini Perplexity Grok VOIR LA DÉMONSTRATION !

Lesbienne, masturbation et pénis : le filtre de dictée Microsoft Word qui transforme des mots en astérisques

Il suffit d’un test anodin pour déclencher l’étonnement : dicter « porno », « femme nue », « pénis » ou « trans » dans Microsoft Word, puis regarder l’écran se remplir d’astérisques. Le phénomène, repéré et commenté sur les réseaux sociaux et sur des forums d’entraide, donne l’impression d’un logiciel qui « rougit » devant certains termes. Et ce qui frappe, ce n’est pas seulement l’existence d’un masquage automatique, mais la liste elle-même : elle mélange vocabulaire sexuel explicite, mots d’anatomie, et parfois des expressions de la vie courante, avec des résultats qui frôlent l’absurde.

Dans des cas rapportés par des utilisateurs, des expressions telles que « au sein de » se retrouvent impactées parce que le système isole le mot « sein », tandis que « nus-pieds » peut être dégradé à cause de « nus ». On n’est plus seulement dans la prévention de contenus choquants, mais dans une mécanique de filtrage qui ignore le contexte, comme si la langue entière était un terrain miné. Or, un traitement de texte sert précisément à écrire tout : roman, mémoire universitaire, compte-rendu médical, article d’actualité ou dialogue de fiction.

Pour donner chair au sujet, imaginons Léa, étudiante en sociologie, qui prépare un mémoire sur les représentations du désir dans la littérature contemporaine. Elle dicte ses notes pour aller plus vite, parce que c’est pratique entre deux cours. Sauf qu’au moment de retranscrire un extrait analysant la masturbation dans un roman, Word remplace le terme par « ». Léa n’a pas seulement perdu du temps : elle se heurte à une forme de mise sous silence, inattendue, dans un outil censé être neutre. Le comble ? Dans un passage sur l’orientation sexuelle d’un personnage, « lesbienne » disparaît, alors que « gay » peut rester visible selon les versions et les moments. Pourquoi cette asymétrie ? 🤔

Ce type de bug culturel crée une sensation très particulière : ce n’est pas la censure d’un éditeur, ni la modération d’un réseau social, mais un geste automatique intégré à un logiciel de bureau. Il n’y a pas d’avertissement clair, pas de bouton évident, et encore moins de justification contextuelle. Le résultat, lui, est immédiat : certains mots deviennent « impossibles » à obtenir par dictée, comme si le logiciel décidait qu’ils n’appartiennent pas à un document « acceptable ».

Dans le vocabulaire du numérique, il s’agit d’un filtre appliqué au module de reconnaissance vocale (« speech to text »). Ce détail change tout : le clavier permet d’écrire les termes, mais la voix déclenche la substitution. Autrement dit, l’outil ne supprime pas le contenu du fichier, il empêche une catégorie d’écriture assistée, celle qui doit justement faciliter l’accès (fatigue, handicap, mobilité, multitâche). Quand une fonction d’accessibilité devient un goulot d’étranglement lexical, l’enjeu dépasse la simple anecdote.

Et si l’affaire passionne autant, c’est qu’elle touche à la fois à l’intime (sexualité, corps, identité) et à la politique (qui définit ce qui est « approprié »). Quand un logiciel grand public trie les mots, il trie aussi une vision du monde. Point final : l’utilisateur découvre que la technologie n’est pas un miroir, mais un filtre. Le terrain est donc prêt pour comprendre comment ce filtre a été pensé, et pourquoi il survit alors même que la dictée s’est nettement améliorée ces dernières années. 🔎

Guide pratique : Comment ajouter un accent aux lettres majuscules (À, É, È, Ç, Î, Ô, Û) sous Windows

Reconnaissance vocale, école et “vocabulaire inapproprié” : l’origine du filtre chez Microsoft

L’explication la plus cohérente tient en une phrase : le filtre serait un héritage des débuts du « speech to text ». Quand la dictée vocale est arrivée dans les suites bureautiques grand public, elle était prometteuse… et très imparfaite. Les erreurs de transcription faisaient régulièrement le tour d’internet : un mot banal devenait grossier, une phrase professionnelle se transformait en blague involontaire, et parfois le résultat tombait au pire moment. Dans un cadre éducatif, ces ratés pouvaient devenir explosifs. 😬

Le raisonnement initial se comprend : si un outil confond des sons proches, il risque d’afficher un terme sexuel ou insultant alors que l’utilisateur a prononcé autre chose. Et dans une salle de classe, devant des enfants, voir apparaître un mot d’anatomie ou de pornographie peut déclencher rires, malaise, plaintes parentales. À l’époque, certaines technologies vocales ont d’ailleurs connu des controverses médiatisées : des assistants qui comprenaient mal une requête, des suggestions mal orientées, des liens inadaptés. Ces épisodes ont installé une peur durable : « et si la machine inventait du contenu gênant ? »

La réponse a été pragmatique : créer une liste de mots à haut risque, et les masquer automatiquement par des astérisques lorsqu’ils surgissent via la dictée. Sur le papier, l’intention est défensive. Dans la pratique, elle ressemble à une censure mécanique, parce qu’elle s’applique même lorsque l’utilisateur prononce volontairement le terme, dans un contexte légitime. En 2026, la reconnaissance vocale en français est bien plus robuste qu’à ses débuts : la plupart des formulations courantes ne déclenchent plus ces confusions massives, et les modèles linguistiques ont gagné en précision. Pourtant, le filtre est resté en place, comme un vieux cadenas accroché à une porte déjà sécurisée.

Ce décalage temporel explique une partie du scandale : les garde-fous d’hier deviennent les entraves d’aujourd’hui. Et le plus intrigant, c’est le côté « fantôme » du dispositif : même au sein d’une grande entreprise, il peut arriver que des équipes locales découvrent tardivement l’existence d’un paramétrage historique. Les produits évoluent par couches successives, et certains composants hérités survivent à plusieurs refontes. Le filtre ressemble à ce genre de relique : installé très tôt, rarement questionné, puis soudain exposé par des internautes qui testent les limites.

Dans les échanges publics, une justification revient souvent : respecter les sensibilités de chacun. L’objectif paraît honorable, mais il est aussi glissant : la « sensibilité » n’est pas une mesure universelle. En fonction des pays, des cultures, des politiques éducatives, le même mot peut être considéré comme médical, militant, pornographique ou insultant. Or, une suite bureautique mondiale doit arbitrer entre des normes contradictoires. Le risque, quand la norme implicite devient celle du plus frileux, c’est que le texte neutre soit traité comme indécent.

Concrètement, la dictée n’affiche pas une alerte pédagogique (« ce mot peut choquer ») ni un réglage simple (« activer/désactiver le masquage »). Elle remplace. Cette stratégie supprime le débat en amont et impose le résultat. Résultat : l’utilisateur se retrouve à contourner la machine, en repassant au clavier ou en changeant de formulation, ce qui est l’opposé d’un outil conçu pour fluidifier l’écriture.

Ce passé technologique explique donc pourquoi un filtre a pu naître. Mais il n’explique pas quels mots ont été retenus, ni pourquoi certaines identités et orientations sont traitées de façon inégale. C’est là que la discussion devient vraiment passionnante, parce qu’elle touche aux biais humains derrière des décisions qui ont l’air automatiques. ⚙️

Pourquoi “lesbienne” est masqué et pas “gay” : biais, incohérences et effets politiques du correcteur

Le cœur du malaise se niche dans les incohérences. Qu’un filtre masque « pénis » ou « cunnilingus », beaucoup comprendront l’objectif de prudence face à un public jeune. Mais que « lesbienne » ou « trans » se retrouve dans la même logique de masquage, c’est un autre message qui s’inscrit en creux : ces mots seraient « inappropriés ». Et dans une société où la visibilité LGBTQIA+ est déjà l’objet de tensions, l’informatique devient, sans le vouloir, un acteur du débat. 🧠

Des utilisateurs ont observé un traitement irrégulier selon les termes : « hétérosexualité » peut être masqué alors que « homosexualité » ne l’est pas ; « lesbienne » disparaît là où « gay » reste parfois visible. À ce stade, deux explications se disputent : la décision culturelle (une liste pensée avec des biais) et la contrainte technique (des mots plus difficiles à reconnaître distinctement). Même si l’argument technique existe — certains sons se confondent mieux que d’autres — il n’épuise pas le sujet. Un filtre n’est pas une fatalité : il est paramétré, ajusté, audité. Chaque entrée dans la liste a été ajoutée par quelqu’un, à un moment donné.

Le problème, c’est l’effet produit, indépendamment de l’intention. Dans un article académique, écrire « lesbienne » n’est pas un acte pornographique, mais un fait social, un concept, parfois une identité revendiquée. Quand la dictée remplace ce mot par des étoiles, elle crée une micro-humiliation : la personne doit corriger, contourner, et se voit rappeler que le logiciel a classé son vocabulaire dans une catégorie à part. Même une autrice de fiction qui décrit une scène tendre entre deux femmes peut ressentir ce décalage : le logiciel ne distingue pas l’érotisme, le militantisme, la médecine, ou la narration. Il écrase tout.

Le cas de certains insultes et de leurs équivalents est tout aussi révélateur : si un terme péjoratif masculin est reconnu (et parfois masqué) mais qu’un équivalent féminin est mal géré, on voit apparaître une carte étrange des priorités. À quel moment un outil « apprend » mieux l’injure que le mot d’identité ? Pourquoi une injure est-elle traitée comme un élément attendu du langage, tandis qu’une orientation est étiquetée comme « délicate » ? Ce sont des questions qui ne relèvent pas seulement de la linguistique, mais de l’histoire sociale des mots.

Une autre dimension est SEO-culturelle : certains termes, comme « lesbienne », ont longtemps été associés à la pornographie dans les imaginaires numériques, par l’effet combiné de requêtes, de contenus, et de classements automatiques. Quand un correcteur vocal bloque ce mot, il renforce involontairement cette association : si le mot est filtré, c’est qu’il serait du côté du contenu adulte. Cercle vicieux. Et ce cercle, on le retrouve dans d’autres zones du numérique : modération, recherche, recommandations.

Pour garder le fil conducteur, reprenons Léa : elle dicte un passage sur des trajectoires trans dans un corpus de témoignages. Le mot est masqué. Son directeur de mémoire lui demande pourquoi ses notes sont pleines d’astérisques. Léa doit expliquer que ce n’est pas elle qui a censuré, mais l’outil. Dans cette scène, la technologie crée une friction sociale. Et cette friction n’est pas anodine : elle influence la façon d’écrire, d’archiver, de partager.

La vraie question est donc : un outil grand public doit-il adopter un filtre moral, ou offrir un choix clair et contrôlable ? Le débat ne porte pas seulement sur des mots « choquants », mais sur la capacité de chacun à nommer le réel. C’est précisément ce qui conduit au terrain suivant : comment reprendre la main, paramétrer Word, et distinguer dictée, orthographe, grammaire et correction automatique. 🛠️

Paramétrer Microsoft Word : orthographe, grammaire, correction automatique et limites du filtre de dictée

Face à un Word qui souligne, remplace ou insiste, le premier réflexe consiste souvent à accuser « le correcteur ». Pourtant, Word embarque plusieurs couches : orthographe, grammaire, correction automatique (substitutions), et, séparément, la dictée. Mélanger ces éléments mène à de faux diagnostics. Un mot masqué en dictée n’est pas forcément un mot “incorrect” : c’est souvent un terme présent dans une liste de masquage, sans lien avec le dictionnaire.

Pour l’orthographe et la grammaire, Word permet déjà des réglages fins : afficher/masquer les marques, ignorer certains mots, réinitialiser les exceptions, ou relancer une vérification complète. Microsoft documente d’ailleurs ces fonctions dans ses pages d’aide, et les utilisateurs chevronnés savent qu’une liste “Ignorer” peut faire croire que Word « accepte » ou « refuse » des mots alors que ce sont juste des paramètres cumulés. Dans le même esprit, les options permettent aussi de désactiver certaines corrections intrusives qui transforment le style d’écriture, un sujet récurrent sur les forums quand Word change de langue ou souligne des mots corrects.

Le hic : le filtre de dictée, lui, a longtemps été difficile à désactiver, voire non désactivable selon les versions et environnements. Cette absence de bouton transforme un choix de design en contrainte quotidienne. L’utilisateur se retrouve à faire du bricolage : dicter en épelant, dicter une périphrase, ou dicter puis corriger au clavier. C’est inefficace et, surtout, cela pénalise celles et ceux qui s’appuient sur la voix pour des raisons d’accessibilité.

Petite boîte à outils : ce qui peut être ajusté tout de suite (et ce qui coince) 🧰

Pour clarifier, voici une liste pratique des actions possibles, avec leurs effets concrets. Elle ne “résout” pas le filtre de dictée quand il est verrouillé, mais elle évite de confondre les problèmes.

📝 Réinitialiser les mots ignorés : utile si Word ne signale plus certaines erreurs parce qu’elles ont été ignorées par le passé.
🔤 Vérifier la langue du document : un texte passé en anglais peut déclencher des corrections absurdes en français (et inversement).
🧩 Contrôler la correction automatique : certaines substitutions transforment des mots ou des symboles, donnant l’impression d’une censure.
👀 Afficher/masquer les marques : pratique pour distinguer un soulignement grammatical d’un remplacement réel.
🎙️ Tester dictée vs clavier : si le mot s’écrit au clavier mais pas à la voix, le problème est bien le filtrage de dictée.

Dans un contexte rédactionnel, une astuce consiste à séparer les phases : dictée pour le flux, puis insertion au clavier des termes bloqués. C’est imparfait, mais cela évite de casser le rythme. Une autre méthode, utilisée par des journalistes, consiste à dicter des marqueurs neutres (« terme anatomique », « orientation », « identité ») puis à effectuer un remplacement global plus tard. On perd la spontanéité, mais on garde la structure.

Tableau : distinguer les mécanismes de Word (et éviter les confusions) 📌

Fonction Word	Symptôme typique	Ce que l’utilisateur peut faire
🧠 Correcteur orthographique	Mot souligné en rouge	Ajouter au dictionnaire, changer la langue, ignorer ou corriger
📐 Correcteur grammatical	Phrase soulignée (souvent en bleu)	Accepter la suggestion, ajuster le style, désactiver certaines règles
🔁 Correction automatique	Substitution immédiate (ex. guillemets, majuscules)	Modifier la liste de remplacement, désactiver les règles gênantes
🎙️ Dictée (speech to text)	Mot prononcé remplacé par	Contourner via clavier ou reformulation; attendre un réglage officiel si disponible

Un dernier point compte : la transparence. L’utilisateur accepte volontiers une correction s’il comprend pourquoi elle a lieu. Mais un remplacement silencieux par des astérisques, sans option évidente, produit l’effet inverse : méfiance, colère, et suspicion d’agenda caché. Et quand la méfiance s’installe, elle déborde vers d’autres sujets numériques, notamment la sécurité, la modération et la gouvernance des plateformes. Ce glissement mène naturellement à un angle plus large : comment les entreprises gèrent les risques, et pourquoi les incidents techniques alimentent des débats de société. 🔐

De la “censure” aux enjeux de confiance numérique : algorithmes, sécurité et responsabilité des éditeurs

Quand des internautes parlent de « censure » à propos d’un filtre de dictée, le mot est fort, parfois excessif juridiquement, mais révélateur émotionnellement. Ce que le public exprime, c’est une perte de contrôle : l’outil d’écriture ne fait plus seulement de l’assistance, il impose une norme. Cette sensation est amplifiée par le contexte numérique des dernières années, où les plateformes filtrent, classent et déréférencent déjà une partie des contenus. Word, logiciel “hors-ligne” dans l’imaginaire collectif, semblait échapper à ces batailles. Surprise : il les rejoint par une porte latérale, celle de la reconnaissance vocale.

La confiance, en informatique, se gagne dans les détails. Un filtre non documenté devient une rumeur ; une rumeur devient un soupçon ; un soupçon devient une théorie. Et l’on voit alors fleurir des explications simplistes : « politiquement correct », « morale nord-américaine », « agenda caché ». La réalité est souvent plus banale : une décision ancienne, un paramétrage hérité, une gouvernance produit éclatée. Mais l’effet public reste le même : la perception d’un tri arbitraire.

Ce climat de suspicion se nourrit aussi d’événements de cybersécurité très concrets. Dès qu’un service numérique se comporte de manière inattendue, certains utilisateurs font le lien avec le piratage, la compromission ou la manipulation. Cette association n’est pas toujours rationnelle, mais elle est compréhensible : on vit dans un paysage où les attaques sont fréquentes, les fuites de données régulières, et les chaînes d’approvisionnement logicielles complexes. Pour illustrer cette sensibilité, il suffit de regarder comment une attaque ciblant une plateforme populaire déclenche immédiatement des questions sur les comptes, les mots de passe et les risques de rebond. Un exemple parlant est l’analyse publiée sur l’attaque hacker visant Yggtorrent, qui montre à quel point la confiance peut se fissurer vite quand l’information circule mal ou tard.

Bien sûr, un filtre de dictée n’est pas une attaque. Mais dans l’esprit d’un public déjà sur le qui-vive, tout comportement “inexplicable” d’un logiciel devient un signal d’alerte. Voilà pourquoi la transparence produit n’est pas un luxe : c’est un élément de sécurité psychologique. Quand Microsoft (ou toute autre entreprise) annonce qu’un filtre sera rendu désactivable et que la liste sera ajustée, cela répond moins à une polémique qu’à une exigence de gouvernance : donner un choix, expliquer la règle, corriger les biais identifiés.

La responsabilité éditoriale des logiciels : nommer, classifier, invisibiliser

Le point le plus important est peut-être celui-ci : classifier un mot, c’est déjà produire du sens. Mettre « lesbienne » dans la même catégorie que des insultes ou du vocabulaire pornographique, même si c’est un accident historique, fabrique un voisinage symbolique. Et ce voisinage a des conséquences : dans un document partagé, dans une salle de classe, dans une entreprise, les astérisques attirent l’œil. Ils signalent qu’il y a “quelque chose à cacher”. 👀

À l’échelle d’une organisation, ce type de détail peut devenir un problème RH. Imaginons un service diversité qui prépare une charte inclusive et la dicte en réunion : certains termes se transforment en étoiles, rires gênés, puis malaise. Le message envoyé est catastrophique : on parle d’inclusion, et l’outil de travail invisibilise le vocabulaire même de cette inclusion. L’incident n’a pas besoin d’être massif pour faire des dégâts ; il suffit d’un moment mal placé.

Il existe une voie de sortie simple et saine : permettre le paramétrage explicite. Un mode “éducation” qui active le masquage, un mode “standard” qui l’assouplit, un mode “professionnel” qui le désactive, avec un avertissement clair. Cette logique existe déjà dans d’autres produits : contrôle parental, safe search, filtres de contenus. Pourquoi ne pas l’appliquer à la dictée ? Cela éviterait de traiter tous les utilisateurs comme un public enfantin, tout en protégeant réellement les environnements qui en ont besoin.

Enfin, un rappel s’impose : les algorithmes ne sont pas neutres, parce qu’ils sont faits de décisions humaines. La meilleure hygiène consiste à auditer régulièrement ces décisions, à écouter les retours, et à corriger rapidement les catégories problématiques. Quand des mots comme « lesbienne » ou « transgenre » sont retirés d’une liste de masquage après signalement, ce n’est pas un détail : c’est la preuve qu’une technologie peut apprendre, mais surtout qu’une entreprise peut choisir de mieux nommer le réel. Et c’est exactement ce que le public attend d’outils d’écriture devenus indispensables. ✍️

Pour prolonger cette réflexion et voir comment ces discussions circulent, une vidéo de vulgarisation sur les biais algorithmiques et la modération automatique permet souvent de relier les points entre “petit bug” et “grand enjeu de société”.

Et pour comprendre plus concrètement le fonctionnement de la dictée vocale et les réglages possibles dans Office, des démonstrations en conditions réelles aident à distinguer ce qui relève de l’option, du dictionnaire et du filtrage.

Anna Bailly

Anna Bailly dirige la rédaction de CDI TECH MEDIA. Journaliste numérique depuis onze ans, elle a fait ses armes au pôle innovation de Numerama avant de rejoindre Usbek & Rica comme cheffe de la rubrique technologies, puis de co-fonder un média indépendant dédié à l’intelligence artificielle à Berlin. Diplômée de Sciences Po Paris et titulaire d’un DU d’éthique de l’intelligence artificielle, elle s’intéresse autant à la mécanique interne des modèles de langage qu’aux dynamiques sociales du numérique.