Bloqueurs de puberté : synthèse des preuves de la Nouvelle-Zélande

Magali Pignard
25 déc. 2024
10 min de lecture

Dernière mise à jour : 26 déc. 2024

Synthèse des preuves, bloqueurs de puberté, dysphorie de genre, transition mineurs, nouvelle zelande

Une synthèse des preuves entreprise par la Nouvelle-Zélande conclut que concernant l’impact des bloqueurs de puberté sur la santé mentale et le bien-être, les preuves sont rares et de qualité médiocre [poor].

Contexte

En 2023, le ministère de la Santé a entrepris une évaluation approfondie des preuves de la sécurité et des effets à long terme des bloqueurs de puberté chez les adolescents avec dysphorie de genre.
Cette synthèse des preuves (revue systématique de la littérature) a été publiée le 21 novembre 2024. Elle est accompagnée d'une déclaration de position du ministère de la Santé, qui fixe les nouvelles orientations concernant sa prescription. Ces nouvelles nouvelles orientations entrent en vigueur immédiatement.
Le gouvernement lance en parallèle une consultation sur la question de savoir s’il devrait y avoir des mesures de sécurité supplémentaires pour les bloqueurs de puberté, telles que des réglementations en vertu de la loi sur les médicaments. Cette consultation sera terminée en janvier 2025.

Présentation de la synthèse des preuves (evidence brief)

Introduction

« Examen pour inclusion de toutes les études publiées dans des revues à comité de lecture jusqu'au 30 septembre 2023.
Des outils d'évaluation de la qualité pertinents ont été utilisés pour évaluer la qualité des preuves quantitatives et qualitatives.
Un appendice supplémentaire (Addendum) à l’évaluation des preuves contient un examen des publications entre octobre 2023 et mai 2024, y compris le rapport final du Cass Review. (...) les nouvelles preuves publiées depuis septembre 2023 ne diffèrent pas des preuves antérieures que nous avons incluses dans l’évaluation des preuves. Par conséquent, nos conclusions de l’évaluation des preuves restent inchangées. (...) »

La synthèse des preuves porte sur 4 aspects : dans ce post, il ne sera rapporté que celui concernant l’impact des bloqueurs de puberté sur la santé mentale et le bien-être.

Résultats clés concernant l'impact des bloqueurs de puberté sur la santé mentale et le bien-être

« Les six résultats sur lesquels l'évaluation s'est concentrée sont : la dysphorie de genre DG, la dépression, l'anxiété, l'automutilation, la suicidalité et la qualité de vie.

Les preuves actuelles indiquent une amélioration significative de la dépression, de l'anxiété et des idées suicidaires pour les individus traités avec des bloqueurs de puberté. Cependant, la qualité de ces preuves est faible avec un risque élevé de biais. »

*Preuve de faible qualité : « L'effet réel pourrait être très différent de l'effet estimé », selon le système GRADE utilisé ici.

Limites (concernant tous les aspects évalués dans cet evidence brief)

Il existe des limites significatives dans les études incluses dans cette revue :

Toutes les preuves proviennent principalement d'études de cohorte longitudinales ou transversales utilisant des normes de référence basées sur la population.
Les études incluses impliquent des individus d'une large tranche d'âge et à différents stades de développement pubertaire.
Manque de diversité dans les cohortes : la plupart des participants adolescents s'identifient principalement comme Caucasiens, ont le soutien parental/tuteur et vivent dans des zones socio-économiques de revenu moyen à élevé. Très peu de preuves sur les adolescents indigènes, les adolescents vivant dans des conditions socio-économiques faibles ou ceux qui n'ont pas de soutien parental/tuteur.
Qualité des études quantitatives et qualitatives faible, avec un risque élevé de biais.

Conclusion générale (concernant tous les aspects évalués dans cet evidence brief)

« Les preuves concernant l'impact du GnRHa sur les résultats cliniques et de santé mentale et de bien-être sont rares, les preuves disponibles étant largement de qualité médiocre poor).

(...)

Étant donné le manque et la mauvaise qualité des preuves, ainsi que les preuves spécifiques à la Nouvelle-Zélande, il existe un besoin urgent de données longitudinales et de recherche de haute qualité pour aider à comprendre les besoins spécifiques des adolescents avec dysphorie de genre en N-Z. »

Évaluation de l'impact des bloqueurs de puberté sur la santé mentale et les résultats de bien-être des adolescents

Études incluses/Outil d'évaluation de leur qualité

10 études incluses dans cette évaluation : Toutes sont des études de cohorte observationnelles : 8 études de cohorte prospectives et 2 études rétrospectives.

1. Costa 2015 (réf 74). UK

2. De Vries 2011 et 2014 (même échantillon) (réf 69 et 70); Hollande

3. Elkadi 2023 (réf 88) : Australie

4. Lavender 2023 (réf 75) : UK

5. Lopez de Lara 2020 (réf 74) : Espagne

6. Olsavsky 2022 (réf 77) : US

7. Tordoff 2022 (réf 83) : US

8. Turban 2020 (réf 84) : US

9. Kuper 2020 (réf 76) : US

10. Achille 2020 (réf 93) : US

4 études repérées après l'achèvement initial de cette évaluation des preuves :

3 nouvelles études : Fisher 2023 ; McGregor 2024 ; McPherson 2024), et une étude supplémentaire van der Miesen 2020 (non repérée initialement).

Évaluation de la qualité

« Tous les articles ont été évalués par deux évaluateurs pour leur qualité en utilisant la méthodologie GRADE. (...)
Une évaluation supplémentaire du risque de biais, l'outil ROBINS-I a également été utilisée et a été ajoutée dans le Tableau de synthèse des preuves (Matériel supplémentaire 4). Le protocole ROBINS-I exige que les co-interventions clés soient identifiées pour évaluer les études, car cela constitue également une source importante de biais. Les co-interventions clés susceptibles d'avoir un impact sur les résultats associés à la santé mentale et au bien-être des participants sont : Conseil, thérapie familiale, soutien scolaire, soutien entre pairs, engagement dans des groupes communautaires. »

Qualité des études : profil GRADE et risque de biais ROBINS-I, limites

« Dans l'ensemble, les études avaient plusieurs limites.

cohortes provenant généralement d'une population orientée vers des services de genre et donc non représentatives de la population générale.
Dysphorie de genre évaluée à l'aide d'une gamme variée d'évaluations, y compris l'auto-évaluation et des évaluations non standardisées ou non validées.
une seule étude avec un groupe de contrôle. Les tailles d'échantillon pour de nombreuses études sont faibles, et la plupart des études ont des sous-groupes imbriqués dans un plus grand échantillon d'adolescents recevant une gamme de traitements.
des taux d'abandon élevés parmi les participants ou des évaluations de suivi incomplètes, entraînant une proportion significative de données manquantes.
plusieurs variables importantes (telles que les détails démographiques, le traitement, l'âge et le stade de développement pubertaire) et des co-interventions (comme le manque de soutien en santé mentale et bien-être) n'ont pas été ajustées, rendant les associations peu fiables. »

Études incluses : profil GRADE et risque de biais ROBIN-I (extraits de l’Annexe 4)

	GRADE (certitude des preuves)	Risque de bais dans l’ensemble (ROBINS – I)
Costa 2015	Dysphorie de genre : Très faible Satisf. Qual. vie : Très faible	Critique
De Vries 2011 et 2014	Dysphorie de genre : faible Anxiété, Dépression, Qual. vie : Très faible	Critique
Elkadi 2023	Anxiété, dépression : Très faible	Critique
Lavender 2023	DG, Suicidalité, Automutilation, Qual. vie : Très faible	Critique
Lopez de Lara 2020	DG, Anxiété, Dépression, Qual. vie : Modéré	Sérieux
Olsavsky 2022	Suicidalité, Automutilation, Dépression, Anxiété : Très faible	Sérieux
Tordoff 2022	Suicidalité, Automutilation : faible Anxiété, Dépression : Modéré	Sérieux
Turban 2020	Suicidalité: Très faible	Sérieux
Kuper 2020	DG, Suicidalité, Automutilation : Très faible Anxiété, Dépression : Modéré	Sérieux
Achille 2020	Dépression, Qual. vie : Très faible	Critique

Études repérées après achèvement de la synthèse des preuves : extrait du matériel supplémentaire de l’addendum

	GRADE (certitude des preuves)	Risque de bais dans l’ensemble (ROBINS – I)
Fisher 2023	DG, anxiété, Dépression, Qual. vie, Suicidalité : Très faible	Critique
McGregor 2024	Automutil., Suicidalité : Très faible Qual. vie/bienêtre social : Faible	Sérieux
McPherson 2024	Qual. vie/bien-être social : Très faible	Critique
van der Miesen 2020	Suicidalité : Très faible	Sérieux

Évaluations GRADE de la certitude des preuves

Élevée : Cette étude fournit une très bonne indication de l'effet probable. La probabilité que l'effet soit substantiellement différent est faible.
Modérée : Cette étude fournit une bonne indication de l'effet probable. La probabilité que l'effet soit substantiellement différent est modérée.
Faible : Cette étude fournit une certaine indication de l'effet probable. Cependant, la probabilité qu'il soit substantiellement différent (une différence suffisamment grande pour avoir un impact sur une décision) est élevée.
Très faible : Cette étude ne fournit pas une indication fiable de l'effet probable. La probabilité que l'effet soit substantiellement différent (une différence suffisamment grande pour avoir un impact sur une décision) est très élevée.

Preuves concernant les résultats

Dysphorie de genre

Six études ont évalué la dysphorie de genre (DG) avant et après le début des bloqueurs de puberté.

Outils de mesure : Utrecht Gender Dysphoria Scale (UGDS) et Body Image Scale (BIS).

Lopez de Lara : la DG a disparu pour chacun de ces jeunes au moment de la réévaluation 12 mois plus tard, avant de commencer les hormones sexuelles croisées. A reçu une note de qualité modérée, en raison de nombreux facteurs de confusion intégrés dans l’analyse. Cependant, elle présente encore des risques de biais sérieux, principalement en raison des petits nombres et de l’inscription dans un programme dont les résultats de l’intervention étaient connus des participants et des chercheurs.
Forte attrition lors des périodes de suivi pour toutes les autres études.
de Vries 2014 (n = 33), Lavender (n = 38) et Kuper (n = 23) : la DG et l’insatisfaction corporelle ont persisté pendant le traitement de suppression de la puberté, ne s’atténuant qu’après le début des hormones sexuelles croisées et finalement de la chirurgie de réassignation sexuelle.

Suicidalité

Cinq études rapportant ces résultats.

Une seule étude (Olsavsky) a utilisé des évaluations spécialisées, mais non utilisées dans leur intégralité ; une seule question de chacune a été utilisée comme métrique d’évaluation, réduisant ainsi la validité des résultats.
Les 4 autres études ont utilisé des questions du Youth Self Report et de son équivalent pour les soignants, le Child Behaviour Checklist, le Patient Health Questionnaire à 9 items, la Kessler Psychological Distress Scale et une étude dont l’évaluation n’était pas nommée.

Trois études (Kuper, Olsavsky, Tordoff) exclues de l’analyse car n’ont pas séparé les participants recevant des bloqueurs de puberté de l’échantillon plus large lors de la présentation des résultats.

Dans les deux études restantes :

Étude de Turban : 89 des 3 494 répondants ont déclaré avoir reçu des bloqueurs de puberté au moment où ils en avaient besoin pendant leur adolescence. Cette grande enquête rétrospective communautaire nord-américaine a révélé que la réception de bloqueurs de puberté était associée à une diminution de la probabilité d’idées suicidaires au cours de la vie (p = 0.001), mais pas d’idées suicidaires au cours de l’année précédente (p = 0.09) et de détresse psychologique sévère au cours du mois précédent (p = 0.38).
Même résultat pour Lavender (n = 38), mais de sérieuses limitations à cette étude, car :
- seulement 11 participants ont répondu à la question liée au suicide.
- l’étude a combiné les résultats sur les idées suicidaires avec ceux sur les comportements d’automutilation, rendant toute distinction entre les deux impossible.

→ Les deux études : qualité très faible et risques de biais sérieux ou critiques.

Automutilation

Quatre rapportant ce résultat.

Mesure de l’automutilation : pas d’évaluations spécialisées ou standardisées.

Une seule (Lavender) (n = 38) a rapporté des résultats distincts pour le sous-groupe de participants ayant uniquement reçu des bloqueurs de puberté. Comme mentionné dans la section précédente, le très faible échantillon (11 répondants) et la combinaison des résultats de l’automutilation avec ceux des idées suicidaires ne permet pas de les distinguer. Parmi les 11 participants qui ont auto-rapporté des comportements d’automutilation et de suicidalité, des améliorations notables ont été observées de la ligne de base à un an après le début des bloqueurs de puberté.

→ Les 4 études : qualité faible ou très faible, risque de biais sérieux ou critique.

Anxiété

Six études rapportant ce résultat.

Outil d’évaluation : trois évaluations auto-rapportées.

4 études ont rapporté des résultats pour le sous-groupe recevant des bloqueurs de puberté :

3 (Olsavsky, Tordoff, Elkadi) exclues de l’analyse car ayant combiné les résultats de ce sous-groupe avec ceux de l’échantillon entier.
de Vries 2014 également exclue, car bien qu’ayant rapporté des résultats pour l’anxiété (n = 32), ils n’ont pas commenté ces résultats dans leur analyse.

Kuper (n = 25) : aucune différence statistiquement significative dans les scores de suivi pour les 23 participants ayant complété l’évaluation ; tous sont restés dans la plage clinique « pouvant indiquer la présence d’un trouble anxieux ».
Lopez de Lara : scores d’anxiété moyens de base (n = 23) juste en dessous de la plage modérée ; ils se sont améliorés de manière significative après 12 mois de réception de bloqueurs de puberté, mais pas au même niveau que ceux du groupe témoin cisgenre.

→ 3 des six études : qualité modérée (Lopez de Lara, Kuper, Tordoff) mais avec des scores de risques de biais sérieux.

→ Les 3 autres : qualité très faible (De Vries 2014, Olsavsky, Elkadi) avec un risque de biais sérieux ou critique.

Dépression

Sept études rapportant ce résultat.

Outils d’évaluation : quatre évaluations auto-rapportées.

4 études exclues de l’analyse car n’ayant pas séparé le sous-groupe de ceux recevant des bloqueurs de puberté dans la présentation des résultats (Olsavsky, Tordoff, Elkadi, Achille).

Kuper : seulement 13 réponses sur 23 pour le questionnaire de dépression. Parmi celles-ci, le score moyen s’est amélioré au suivi par rapport à la ligne de base, mais est resté dans la plage de fonctionnement normal aux deux moments.
de Vries 2014 (n = 32) : résultat similaire. Une diminution des symptômes de dépression a été observée de la ligne de base au premier suivi, mais à ces deux moments, ils étaient dans la plage la plus basse (minimale) de dépression.
Lopez de Lara : diminution significative des symptômes de dépression après 12 mois de réception de bloqueurs de puberté (n = 23). Le score moyen est passé de la plage de dépression légère à juste à l’intérieur de la plage minimale (p < .001) ; légèrement supérieur à celui du groupe témoin.

→ Trois des six études : qualité modérée (Lopez de Lara, Kuper, Tordoff) mais risques de biais sérieux.

→ Les 4 autres : qualité très faible (de Vries 2014, Olsavsky, Elkadi, Achille) avec un risque de biais sérieux ou critique.

Qualité de vie

Cinq études rapportant ce résultat.

Approche large de l’évaluation de la qualité de vie afin d’inclure toutes les conclusions pertinentes. Tous les outils de mesure qui évaluaient les compétences sociales, le comportement, le fonctionnement et la qualité de vie ont été inclus.

Achille exclu de l’analyse car n’ayant pas rapporté le sous-groupe recevant des bloqueurs de puberté séparément de l’échantillon de suivi entier.

Lopez de Lara) (n = 23), qui a utilisé le Strengths and Difficulties Questionnaire, a trouvé une amélioration statistiquement significative entre la ligne de base et le suivi dans les domaines des symptômes émotionnels, de la conduite, de l’hyperactivité et du comportement prosocial (p < 0.001). Aucun changement statistiquement significatif n’a été observé dans les relations entre pairs. Les scores moyens variaient de la limite supérieure des scores normaux vers des niveaux cliniquement significatifs, comparables à ceux du groupe témoin.
Lavender (n = 38) : résultats similaires pour 19 répondants ; les scores de base et de suivi dans la Social Responsiveness Scale étaient dans la plage non clinique.
de Vries 2011 (n = 32) : fonctionnement global s’améliorant avec le temps, mais non statistiquement significatif pendant la période entre la ligne de base et le suivi avant le début des hormones sexuelles croisées. Une amélioration statistiquement significative (p = 0.0001) du fonctionnement global n’a été observée qu’au suivi avant la chirurgie de réassignation.
Costa : en utilisant la même évaluation du fonctionnement global que de Vries et al., il a été rapporté un fonctionnement significativement plus élevé au suivi de 12 mois (p = 0.003) après suppression de la puberté et soutien psychologique (n = 60), et à nouveau à 18 mois (n = 35). Les participants avaient un score en moyenne cinq points plus élevé que celui du groupe de comparaison sans réception. Cette augmentation n’a pas atteint la signification statistique, probablement en raison de la forte réduction de la taille de l’échantillon.

→ de Lopez de Lara : qualité modérée.

→ les 5 autres : qualité très faible, avec un risque de biais sérieux ou critique.

Extrait de la synthèse des preuves (doc Word)