L’étude Allen (2026) sur l’hormonothérapie et suicidalité: résultats et limites
- Magali Pignard
- il y a 1 jour
- 9 min de lecture
Une étude américaine récente sur des jeunes avec dysphorie de genre conclut que : « L’hormonothérapie a été associée à des réductions cliniquement significatives de la suicidalité au fil du temps, prolongeant des résultats antérieurs grâce à un échantillon plus large et à un suivi plus long. »

➥ Allen et al., (2026), Changes in Suicidality among Transgender Adolescents Following Hormone Therapy: An Extended Study, The Journal of Pediatrics
Description de l'étude
Étude rétrospective fondée sur l’examen de dossiers médicaux, portant sur 432 jeunes présentant une dysphorie de genre, âgés de 12 à 20 ans au moment de la première prescription d’hormones sexuelles croisées (CSH), et exposés au traitement depuis au moins 3 mois.
L’étude est basée aux États-Unis, au sein du système hospitalier Mercy, un réseau de soins intégré, incluant une clinique de genre.
La suicidalité est évaluée à l’aide du questionnaire Ask Suicide-Screening Questions (ASQ) : 3 questions portant sur l'idéation suicidaire, une 4e sur la tentative de suicide, 1 point par réponse « oui ».
Cette évaluation est mesurée à deux moments :
Baseline : date de la première prescription de CSH à la clinique de genre.
Suivi : dernière consultation hospitalière disponible, quelle que soit la spécialité du service, et pas uniquement à la clinique de genre.
Durée moyenne de suivi : 679 jours (environ 1,9 an).
Analyse
L’évolution des scores de suicidalité des mêmes jeunes avant et après la prescription d’hormones est analysée à l’aide d’un modèle statistique ajusté (ANCOVA).
Résultats
Dans les données brutes, 18,5 % des participants présentent une diminution du score ASQ, 75,5 % ont un score nul et inchangé, 1,4 % un score non nul et inchangé, et 4,6 % une augmentation du score.
La proportion de tentatives de suicide récentes passe de 3,0 % dans les semaines précédant la baseline à 0,46 % dans les semaines précédant la consultation de suivi
La proportion de participants sans idéation suicidaire augmente de 78,7 % à la baseline à 92,6 % au suivi, tandis que la proportion rapportant au moins une idéation suicidaire passe de 20,3 % à 7,4 %.
Le modèle statistique met en évidence une diminution pré-/post-traitement statistiquement significative, de taille modérée, des scores ASQ. L’âge à l’initiation des CSH, le sexe assigné à la naissance et la durée du traitement ne sont pas associés de manière significative à l’évolution des scores.
Préoccupations concernant cette étude (Allen et al.)
Dans son Digest 4, la SEGM (Society for Evidence-Based Gender Medicine) a identifié plusieurs points de préoccupation relatifs à cette étude. J'en présente certains.
Risque de sous-estimation des comportements suicidaires après la prescription du traitement
Ce point concerne la manière dont la suicidalité est évaluée et mesurée au cours du suivi.
Avant (baseline) : le score ASQ est recueilli lors de la consultation au cours de laquelle les hormones sont prescrites, dans la clinique de genre. Comme tous les patients passent par cette consultation, la suicidalité initiale est en général évaluée à ce moment-là.
Après (suivi) : le score ASQ de suivi ne provient pas forcément de la clinique de genre, mais de la consultation la plus récente, dans n’importe quel service/département du réseau Children’s Mercy (endocrinologie, médecine générale, urgences, etc.).
Or, les services de santé mentale de ce réseau utilisent un autre outil d’évaluation plus détaillé, le Columbia Suicide Severity Rating Scale (C-SSRS), et sont exemptés du dépistage par ASQ : le programme de dépistage universel mis en place à Children’s Mercy prévoit l’utilisation de l’ASQ dans les services médicaux, tandis que les services de santé mentale utilisent le C-SSRS (Sullivant et al., 2021).
Donc, si après le début des hormones, un jeune présente une suicidalité principalement prise en charge dans un service de santé mentale du réseau hospitalier, cette suicidalité peut être évaluée via le C-SSRS mais ne pas être enregistrée dans les données ASQ.
Étant donné que l’analyse repose uniquement sur les scores ASQ, il y a donc un risque que certaines manifestations de suicidalité au suivi ne soient pas repérées, ce qui pourrait conduire à une sous-estimation de la suicidalité après l'initiation du traitement.
Utilisation non validée/détournement des scores ASQ
Ce problème a fait l’objet d’une lettre à l’éditeur, par Sarah Jorgensen.
L’ASQ (Ask Suicide-Screening Questions) comporte 4 questions (réponses possibles : « oui », « non ») :
Les 3 premières questions sont sur les idéations suicidaires :
Au cours des dernières semaines, avez-vous souhaité être mort(e) ?
Au cours des dernières semaines, avez-vous pensé que vous ou votre famille iriez mieux si vous étiez mort(e) ?
Au cours de la dernière semaine, avez-vous eu des pensées visant à vous donner la mort ?
La dernière question porte sur les tentatives de suicide :
Avez-vous déjà essayé de vous suicider ?
Or, Allen et al. ont changé la nature de l’outil :
ASQ dans sa validation originale
Au moins une réponse « oui » → dépistage positif.
Aucune réponse « oui » → dépistage négatif.
Score binaire
Utilisation dans Allen et al.
1 point par réponse « oui », additionné ces réponses pour obtenir un score allant de 0 à 4.
Ce score est traité comme une variable continue dans l’outil d’analyse.
Les auteurs affirment que des scores plus élevés indiquent une idéation suicidaire récente plus importante : 2 réponses positives signifierait donc plus de risque qu’une seule réponse, et passer de 3 à 2 signifierait une amélioration mesurable du risque suicidaire.
Or, rien n’indique empiriquement que le risque suicidaire augmente de manière linéaire avec le nombre de réponses positives à l’ASQ.
Si le score ASQ ne mesure pas réellement l’évolution du risque suicidaire, alors l’analyse statistique basée sur ce score ne permet pas de tirer des conclusions fiables.
Évolution du score ASQ liée à la formulation de la question 4 (tentatives de suicide)
Allen et al. expliquent que l’item 4 est formulé de différentes manières selon les services, certaines versions portant sur une tentative « au cours des dernières semaines » et d’autres sans cette mention, donc sur une tentative « au cours de la vie ». Pour assurer la comparabilité, les auteurs ont vérifié par revue de dossier toutes les réponses positives à cet item, puis ils les ont codées comme indiquant une tentative récente.
Pour comprendre les implications de ce choix méthodologique, prenons un exemple concret : imaginons un jeune de l'étude, ayant fait une tentative de suicide avant la prescription d'hormones ; ses idéations suicidaires n'évoluent pas entre la prescription et la consultation la plus récente, mais il ne fait pas d'autre tentative de suicide. Lors de la dernière consultation, la question sur la tentative de suicide concerne les dernières semaines.
ASQ à la prescription d'hormones
« Oui » aux 3 questions sur les idéations suicidaires
« Oui » à la question : « Avez-vous déjà essayé de vous suicider ? »
Score final : 4/4
ASQ à la dernière consultation
« Oui » aux 3 questions sur les idéations suicidaires
« Non » à la question : « Au cours des dernières semaines, avez-vous essayé de vous suicider ? »
Score final : 3/4
Dans cet exemple, le score ASQ diminue, alors que la suicidalité actuelle du jeune n’a pas évolué.
L’étude rapporte que 33,3 % des participants ont fait au moins une tentative de suicide avant la prescription d’hormones uniquement, et que 1,4 % en ont fait au moins une avant et au moins une pendant le traitement. Ainsi, 34,7 % des jeunes avaient déjà fait au moins une tentative de suicide avant la prescription d’hormones.
Cet exemple pourrait concerner un nombre non négligeable de participants,
Confusion liée à des prises en charge concomitantes en santé mentale
Au Children’s Mercy, l’ASQ n’est pas un simple outil de recherche : il est intégré à un protocole systématique.
Concrètement, lorsqu’un jeune remplit l’ASQ, et répond positivement à au moins un item, cela déclenche une série d’actions incluant l’orientation vers un travailleur social, et/ou vers un soutien supplémentaire en santé mentale et, le cas échéant, une orientation vers des soins ambulatoires ou une hospitalisation.
→ Un dépistage positif déclenche donc une intervention clinique.
Cela signifie que chez les jeunes ASQ positifs au départ, les hormones ne constituent pas la seule intervention reçue : ils pourraient également bénéficier d’une prise en charge spécifique du risque suicidaire.
Or, les interventions de prévention du suicide mises en œuvre après un dépistage positif ont une efficacité démontrée en soins primaires (Ruch et al., 2024).
Donc l’étude d’Allen ne permet pas de distinguer l’effet spécifique des hormones de celui des interventions déclenchées par le dépistage.
Incertitude concernant le statut du traitement
Pour pouvoir affirmer que l'hormonothérapie a été associée à une réduction cliniquement significative des idées suicidaires au fil du temps, il faut être sûr que les personnes évaluées « après » étaient encore sous CSH au moment de cette évaluation.
Or, les auteurs n’expliquent pas comment ils ont vérifié que les patients prenaient toujours des CSH au moment du suivi.
Ils rapportent qu’avec un suivi médian de deux ans, le taux d’arrêt rapporté n’était que de 1,6 % (7/432). Ce chiffre est nettement inférieur au taux d’arrêt de 25,6 % à quatre ans et à l’estimation d’environ 15 % d’arrêts à deux ans chez des adolescents ayant initié des CSH avant 18 ans, selon une étude récente fondée sur l’analyse des renouvellements de prescriptions (Roberts et al., 2022).
Si les jeunes étaient présumés toujours sous traitement tant qu’ils n’avaient pas signalé d’arrêt, une sous-estimation des cessations ne peut être exclue : des données issues d’une enquête par auto-déclaration (Littman, 2021) montrent que 75 % des personnes ayant détransitionné n’en avaient pas informé les équipes ayant facilité leur transition. Cela ne permet pas d’estimer la fréquence réelle d’un tel phénomène dans cette cohorte, mais suggère qu’un arrêt non signalé peut survenir.
Concernant les ASQ passés dans d'autres services que la clinique de genre, l'étude ne précise pas si le statut du traitement était systématiquement vérifié lors de ces consultations.
À une question explicite du journaliste Ben Ryan , Allen et al. indiquent :
« Même si des patients ont arrêté le traitement hormonal, ils pouvaient tout de même fournir des données de suicidalité dans le système Mercy élargi lorsqu’ils étaient vus pour d’autres raisons ».
Cette réponse suggère que la poursuite réelle du traitement n’aurait pas été vérifiée de manière systématique et que les données de suivi n’étaient pas strictement conditionnées à une exposition confirmée aux CSH. Dans ces conditions, si une part non négligeable des scores ASQ « post-prescription » provenait de personnes ayant cessé les CSH tout en étant analysée comme reflétant un effet du traitement, l’association observée pourrait être affectée par une mauvaise classification de l’exposition.
Manque de transparence dans le reporting
Les auteurs indiquent que les critères d’inclusion étaient la réception d’une hormonothérapie (CSH) pendant au moins trois mois et la disponibilité de données ASQ au départ et au suivi. Les auteurs ont retenu 432 participants répondant à ces critères, qui constituent l’échantillon analysé, mais non l’ensemble des patients traités.
Dans le cadre d’une revue rétrospective de dossiers, on attend habituellement que soient rapportés :
le nombre total de patients ayant reçu les CSH,
le nombre exclu pour absence de données au départ,
le nombre exclu pour absence de données au suivi,
le nombre exclu pour d’autres raisons,
le nombre final de patients inclus dans l’analyse.
Ici, seul le nombre final de patients analysés est rapporté : les lecteurs ne disposent d’aucune information sur le processus de sélection ayant conduit à l’inclusion de ces 432 participants.
Or, dans les études observationnelles, les patients qui changent de parcours, arrêtent un traitement, ou dont la santé se dégrade, sont souvent plus susceptibles d’avoir des données manquantes.
Les standards de publication incluent habituellement un diagramme de flux présentant ces informations clés. En l’absence de ces données, il n’est pas possible d’apprécier l’impact potentiel des biais de sélection et des pertes de suivi sur les résultats.
Régression vers la moyenne
Il n'est pas rare que les jeunes consultent souvent une clinique de genre au pic de leur détresse. Si un jeune remplit l’ASQ à ce moment précis, son score peut être très élevé. Or, les états émotionnels intenses fluctuent naturellement : une crise aiguë finit souvent par s’atténuer, même sans intervention spécifique. Si une mesure est refaite plus tard, il est possible que le score soit plus bas simplement parce que le moment initial était un pic.
Ce phénomène correspond à la « régression vers la moyenne » : lorsqu’une mesure est effectuée à un moment extrême, la mesure suivante tend naturellement à se rapprocher de la moyenne, même en l’absence d’intervention (Barnett et al., 2005). Cela peut donner l’impression d’une amélioration due au traitement, alors qu’il s’agit en partie d’un retour naturel vers un niveau plus moyen.
Sans groupe contrôle, il est difficile de distinguer la part de la baisse due aux hormones, et la part due à la fluctuation naturelle.
Une partie de l’amélioration observée peut donc être attendue statistiquement lorsqu’on mesure à un moment de crise.
Cette étude n’a pas encore été évaluée dans une revue systématique utilisant l’outil ROBINS-I. Par rapport à sa conception (étude observationnelle rétrospective), l’évaluation du risque de biais pourrait être jugée « sérieux » dans plusieurs domaines : la confusion, la sélection des participants, les déviations par rapport aux interventions prévues et la mesure des résultats*.
La certitude des preuves (approche GRADE) ne se détermine pas à partir d’une seule étude, mais en examinant l’ensemble des données disponibles sur une question donnée. Une étude observationnelle isolée comme celle-ci commence à un niveau « faible » et, si elle présente plusieurs risques de biais sérieux, elle ne permettrait pas d’aboutir à une certitude élevée des preuves.
*Dans l’outil ROBINS-I, les niveaux de risque de biais sont : faible, modéré, sérieux et critique. Le jugement global correspond au niveau de risque le plus élevé observé dans l’un des domaines. Ainsi, un domaine jugé « sérieux » entraîne un risque global au moins sérieux, et un domaine jugé « critique » entraîne un risque global critique.




Commentaires