Journal de l'Association médicale canadienne 1996; 155 : 1703-1709
Demandes de tirés à part : Dr Patricia Huston, JAMC, 1867, prom. Alta Vista, Ottawa ON K1G 3Y6; fax 613 523-0937; pubs@cma.ca
© 1996 Association médicale canadienne
La recherche sur les services de santé est enracinée dans la recherche par observation qui fait ressortir des variations régionales des tendances de la pratique. Ces variations démontrent que les technologies et les concepts médicaux sont diffusés inégalement dans la pratique et peuvent refléter une incertitude légitime quant à ce qui constitue la meilleure norme de soins. De nos jours, on utilise aussi des méthodes expérimentales et quasi expérimentales en recherche sur les services de santé. Des études randomisées peuvent par exemple servir à déterminer la meilleure façon d'assurer qu'un nouveau traitement est adopté efficacement dans la pratique ordinaire. Les études d'observation sur les tendances de la pratique et les résultats chez les patients prédominent toutefois encore dans les publications de recherche sur les services de santé. Ces études d'observation peuvent être descriptives et documenter l'existence de variations des tendances de la pratique ou des résultats chez les patients. Elles peuvent aussi être plus analytiques et chercher à expliquer les variations observées.
L'évaluation des tendances de la pratique et des résultats sur la santé dans des populations importantes coûterait énormément cher si l'on mettait au point des mécanismes de collecte de données particuliers à chaque étude. C'est pourquoi les chercheurs en services de la santé comptent souvent sur des données tirées de sources secondaires. Nous visons ici avant tout la recherche sur les services de santé pour laquelle on utilise des sources de données secondaires parce qu'elle est fréquente et que la production de rapports à ce sujet pose des défis particulier. Aux fins du présent document, nous avons défini ces sources secondaires de deux façons : (1) bases de données conçues pour effectuer une surveillance épidémiologique constante des soins médicaux et non pour donner suite à une hypothèse en particulier, et (2) bases de données conçues à des fins administratives mais qui servent maintenant à répondre à des questions de recherche (Tableau 1).
Les écrits traitant de la façon d'effectuer des recherches sur les services de santé sont peut-être nombreux, mais il y a pénurie de documents sur la meilleure façon d'en faire rapport. Dans cet article, nous définissons certains des enjeux spéciaux qui découlent d'études fondées sur des sources de données secondaires et présentons des lignes directrices générales aux auteurs et aux pairs examinateurs de d'articles traitant de ce type de recherche sur les services de santé. Nous précisons aussi aux lecteurs ce qu'ils doivent chercher lorsqu'ils évaluent de tels rapports.
Comme les études d'observation utilisant des sources de données secondaires ne posent en général aucun risque de préjudice physique pour les participants, il n'est habituellement pas nécessaire d'obtenir le consentement des intéressés pour analyser des données anonymes[2]. Cependant, si des chercheurs utilisent une source de données secondaires pour identifier des dossiers cliniques réels, l'hôpital doit alors les examiner et il faut en obtenir la permission pour pouvoir vérifier les dossiers. Les exigences sont encore plus rigoureuses si l'on doit communiquer avec le patient en se fondant sur des codes d'identification et des renseignements cliniques tirés d'une source de données secondaires. Dans de tels cas, le médecin personnel du patient doit agir comme intermédiaire dans toute démarche initiale auprès de l'intéressé. Il faut obtenir le consentement éclairé de tous les patients touchés directement par une étude.
Dans le cas des études qui n'utiliseront que des sources de données secondaires, il n'est habituellement pas nécessaire d'obtenir l'approbation d'un conseil d'éthique de la recherche[2]. En cas de doute, il faut toutefois en consulter un. Dans toute étude utilisant des sources de données secondaires, il est crucial de respecter la confidentialité des renseignements. C'est pourquoi il faudrait réduire au minimum l'utilisation des codes d'identification personnels, utiliser dans la mesure du possible des dossiers anonymes, éliminer le plus rapidement possible des dossiers de l'étude et des fichiers de données les codes d'identification personnels nécessaires et contrôler rigoureusement l'information. Pour maintenir la confidentialité, on peut notamment veiller à protéger tous les dossiers par un mot de passe, protéger l'endroit où les données sont gardées et analysées et n'entrer des données que dans des ordinateurs autonomes qui ne sont pas branchés à des lignes téléphoniques.
Il faut préparer le résumé structuré de la même façon que pour les résumés d'articles de recherches originales[3].
Comme on l'a signalé, les concepts utilisés en recherche sur les services de santé peuvent varier. On peut exécuter une étude contrôlée randomisée pour vérifier des manoeuvres qui visent à modifier une tendance de la pratique en particulier. On utilise aussi des concepts quasi expérimentaux, fondés sur des cohortes et des castémoins, souvent appuyés par des données secondaires et des données primaires supplémentaires. À l'heure actuelle, toutefois, la plupart des chercheurs étudiant les services de santé utilisent des concepts représentatifs, fondés sur des sondages, des études avantaprès ou des séries chronologiques.
Le résumé structuré devrait non seulement énoncer brièvement le concept de l'étude, mais aussi préciser comment on a utilisé les sources de données secondaires. Il est souvent utile de fournir une description générique à la section sur la conception (p. ex., «Étude rétrospective de cohortes fondée sur des résumés de sorties d'hôpital») et d'ajouter d'autres détails dans la section sur les mesures des résultats (p. ex., «Réhospitalisation dans les 6 mois suivant la sortie, fondée sur un jumelage probabiliste de l'index et des admissions ultérieures»).
Introduction
Dans l'introduction, il faut définir clairement le problème à l'étude. Il faut inclure une recension concise de la littérature scientifique afin d'établir le contexte de l'étude et de justifier comment elle visait à augmenter les connaissances actuelles. Enfin, il faut énoncer claire-ment la question de recherche ou l'objectif visé.
La question de recherche
Dans des études descriptives, on examine habituellement des variations du taux d'utilisation des services de santé dans une région géographique précise, par exemple, les taux d'hystérectomie selon l'indication dans différentes régions d'une province[4]. Par ailleurs, on peut analyser l'évolution des taux dans le temps, comme la réduction relative spectaculaire de 43 % du taux de prostatectomie transuréthrale notée en Ontario au cours de la période de 19901991 à 19941995[5]. L'hypothèse de différence nulle est que l'écart entre les taux de régions différentes (ou dans le temps) n'est pas plus grand que celui qui peut être lié au hasard seulement. Cela présuppose qu'on s'attend à un certain niveau de variation et qu'il faut préciser d'avance à quoi on s'attend[6].
Dans le cadre d'études de variation géographique, on peut aussi utiliser des données primaires pour clarifier un aspect donné de la variation observée. Au cours d'une étude, van Walraven et ses collaborateurs[7], par exemple, ont jumelé des données tirées d'une source secondaire indiquant les régions où les taux d'arthroplastie de la hanche et du genou étaient élevés et faibles à des données primaires tirées d'une vérification de dossiers choisis au hasard dans des régions bien desservies et des régions mal desservies pour déterminer si les critères de sélection des cas différaient.
Dans une étude analytique, on compare les tendances des soins et des résultats entre des groupes de patients ou de fournisseurs en particulier afin d'essayer de comprendre les causes des variations. L'évaluation des facteurs liés aux complications qui suivent immédiatement un avortement en est un exemple8. La question de recherche doit être très pointue, car elle vérifie une hypothèse précise au sujet du degré et des sources de variabilité des résultats chez les patients ou des soins qu'ils ont reçus.
Dans le cas des études descriptives et des études analytiques, il faut veiller à déterminer si la disponibilité des données a orienté indûment la question de recherche. Il ne faut pas choisir la question et l'adapter aux données : elle doit plutôt être importante en soi. Un facteur indique que les données sont à l'origine de la question d'étude : la question semble plausible par rapport à la source de données, mais rate d'une façon ou d'une autre les enjeux pertinents liés au système clinique ou sanitaire. Les études utilisent d'importants ensembles de données recueillies sans hypothèse énoncée au départ : c'est pourquoi il y a toujours un risque de «dragage de données» lorsqu'on effectue des passes multiples sur des données et que l'on obtient, à cause du hasard seulement, une signification statistique parasite. Les échantillons très gros, surtout dans le cas des données administratives, permettent de trouver une signification statistique dans des cas où les résultats ont peu de signification clinique ou stratégique (signification clinique : ef-fets que des cliniciens ou des patients pourraient juger importants; signification stratégique : résultats auxquels des décideurs ou des administrateurs pourraient juger valable de donner suite). Des hypothèses bien définies, suivies d'une analyse minimale et d'un scepticisme à l'égard de résultats qui semblent significatifs, jouent un rôle crucial si l'on veut tirer des résultats réels de sources de données secondaires.
Méthodes
Considérations générales
Il faut accorder une attention particulière à la partie qui porte sur les méthodes. Le rapport doit traiter de l'évaluation des sources à la fois d'erreurs aléatoires et d'erreurs systématiques.
Pour commencer, on décrit le contexte et la population à l'étude. Il faut définir les critères d'inclusion et d'exclusion afin de pouvoir évaluer la représentativité ou l'exhaustivité du cadre d'échantillonnage. Si l'étude ne portait pas sur la population cible totale, il faut décrire la technique d'échantillonnage pour en révéler tout gauchissement possible.
Le Tableau 2 contient une liste de contrôle relative aux études descriptives et analytiques où l'on utilise des sources de données secondaires. Si l'on utilise un concept expérimental, il faudrait consulter la liste de contrôle CONSORT (Regroupement des normes relatives aux rapports d'études) qui a trait aux études randomisées[9]. Si, dans le cadre d'une étude, on combine une analyse de données secondaires à la collecte de données primaires, ou si l'on procède à des vérifications critériées de la pertinence des soins entre des régions, des établissements ou des fournisseurs différents[7,10,11], on peut trouver dans des guides d'évaluation critique d'études d'utilisation des exigences fondamentales relatives à la production de rapports[12].
Description de sources de données secondaires
Il est crucial de décrire en détail les sources de données secondaires. Si, compte tenu de l'utilisation ou du traitement des données, il est indiqué d'obtenir un consentement, il faudrait décrire comment on l'a demandé et obtenu et comment on a maintenu la confidentialité pendant toute l'étude.
Il faut indiquer les renseignements précis tirés des sources de données. Au Canada, par exemple, toute hospitalisation est consignée dans des résumés de sorties informatisés. Des techniciens en archives médicales examinent les dossiers des patients et, en se fondant sur des critères normalisés, consignent des codes sur des interventions, des diagnostics et des complications spécifiques. Si l'on utilise des résumés de sorties dans le contexte d'une étude, il faudra décrire dans le rapport les codes de diagnostic ou d'intervention qui ont défini l'échantillon. Le niveau de détail devrait suffire pour permettre de répéter éventuellement l'étude.
Il faut défendre la pertinence de la source de données en montrant qu'elle saisit vraiment l'indicateur du mode de soin ou le résultat pour le patient auquel on s'intéresse. On ne dispose pas généralement de mesures des résultats idéaux comme le soulagement des symptômes, l'amélioration du statut fonctionnel et le niveau de satisfaction à l'égard des soins. Les hospitalisations, les interventions et les épisodes de soins actifs sont considérés plutôt comme des substituts des fardeaux de la maladie.
Le rapport doit définir la validité et la fiabilité de tous les aspects pertinents des sources de données secondaires utilisées, y compris l'ensemble des interventions, des diagnostics ou des résultats auxquels on s'intéresse. Les chercheurs peuvent inclure au concept de l'étude un élément pour valider la source de données secondaires utilisées. Ils peuvent aussi citer des publications pertinentes. Les façons de valider la qualité des sources de données varient13. Dans le cas des dossiers d'hôpital, deux ou plusieurs techniciens en archives médicales peuvent examiner indépendamment une série de dossiers et on peut déterminer l'étendue de l'entente entre les observateurs. Des experts cliniques peuvent aussi examiner les dossiers originaux pour déterminer si l'information correspond aux données entrées dans la source de données secondaires. On peut aussi procéder à une validation croisée en comparant deux ou plusieurs sources de données secondaires portant sur des questions semblables pour déterminer si elles concordent. Quelles que soient les méthodes utilisées, il faut rassurer jusqu'à un certain point les lecteurs au sujet de la qualité des données analysées.
Il faut décrire tout lien établi entre des données sur les patients contenues dans deux sources de données secondaires ou plus (p. ex., taux d'hospitalisation et statistiques démographiques pour saisir les décès hors de l'hôpital) ou, de façon longitudinale, à l'intérieur de la même source de données. Ces liens peuvent s'appuyer sur une base déterministe, où l'on utilise des codes d'identification uniques pour jumeler exactement les dossiers, ou sur une base probabiliste, où l'on utilise des similarités de codes d'identification non uniques (p. ex., sexe, date de naissance et code postal de la résidence) pour déterminer avec une très grande probabilité que deux dossiers portent sur la même personne[14]. Quelles que soient les méthodes utilisées pour établir un lien, les menaces à la protection des renseignements personnels et à la confidentialité augmentent lorsqu'on identifie des individus et qu'on les suit dans de multiples sources de données secondaires. C'est pourquoi toutes les précautions éthiques décrites plus tôt sont particulièrement importantes lorsqu'on met au point et utilise des ensembles de données liés.
Enjeux analytiques et statistiques
Alors que le patient est l'unité d'analyse dans la plupart des études cliniques, dans le domaine de la recherche sur les services de santé, il faut définir très clairement l'unité d'analyse parce qu'il peut s'agir de la région, de l'hôpital ou de groupes d'hôpitaux, du médecin ou du patient en particulier. Idéalement, il faudrait définir l'unité d'analyse et décrire comment les services ou les systèmes pertinents diffèrent entre les unités d'analyse afin que les lecteurs comprennent l'éventail des causes possibles des résultats.
Que l'étude soit très descriptive ou qu'elle comporte une analyse comparative détaillée, le rapport devrait décrire une série d'analyses de sensibilité. Ces analyses déterminent dans quelle mesure les résultats de l'analyse primaire sont sensibles aux changements de définitions ou d'interprétations de certaines variables indépendantes. Si les résultats changent de façon spectaculaire face aux définitions possibles plausibles d'une ou de plusieurs variables, on ne peut alors pas considérer que les conclusions sont solides. Ces analyses sont importantes à cause des limites inhérentes aux données secondaires. Plus précisément, des analyses de sensibilité devraient porter sur des questions comme l'influence de valeurs aberrantes, les façons différentes de définir des interventions et des populations et d'établir des liens entre des données ou de les analyser.
Études descriptives
Les études descriptives au cours desquelles on évalue des variations des tendances de la pratique comportent en général la détermination simple de résultats comme la durée moyenne du séjour par établissement ou les taux d'utilisation de services par unité de population. Les rajustements pour tenir compte de différences entre les groupes de patients ou les populations analysés ont tendance à être rudimentaires (p. ex., rajustements en fonction de l'âge et du sexe).
Dans toute étude descriptive stratifiée représentative, les dénominateurs doivent être clairs. On peut les clarifier en calculant des taux fondés sur le lieu de résidence afin de pouvoir définir géographiquement la population visée. Il faudra ensuite pousser l'analyse pour déterminer si les différences relatives à l'intensité des services proviennent d'un ensemble en particulier d'hôpitaux ou de fournisseurs. Si la variation globale est significative, on peut utiliser des tests statistiques pour déterminer si un comté ou un hôpital donné diffère pour la peine des autres membres du groupe analysé. Lorsqu'on effectue de tels tests individuels à l'égard d'un certain nombre de comtés ou d'hôpitaux, le risque d'erreur de type I augmente toutefois à cause de la multiplicité des comparaisons. Il faut en tenir compte dans l'analyse ou l'interprétation.
Études analytiques
Dans les études qui comportent des efforts plus détaillés afin de comprendre les sources de variations des processus de soins, deux problèmes se présentent régulièrement : l'exploration incomplète de facteurs explicatifs possibles et une efficacité statistique insuffisante.
Des variations géographiques significatives des taux relatifs à une intervention ou à un service en particulier peuvent surgir pour nombre de raisons, dont les suivantes : différences au niveau de l'incidence de la maladie, disponibilité relative de l'intervention en cause et traitements parallèles ou concurrents, éducation et attentes des patients, tendances de présentation d'autres médecins et styles de pratique des professionnels qui fournissent le service en cause. Le rapport d'étude devrait préciser clairement si l'on a exploré ces facteurs explicatifs et comment on l'a fait.
Même si les sources de données secondaires englobent habituellement un très grand nombre de patients, l'efficacité statistique peut être limitée si l'unité d'analyse est un nombre restreint de comtés ou d'hôpitaux. On peut alors entreprendre une analyse de sensibilité au niveau de chaque patient et utiliser les comtés ou les hôpitaux comme covariables écologiques[15]. Les considérations relatives à l'efficacité statistique sont importantes aussi lorsqu'on utilise la collecte de données primaires pour analyser des sources possibles de variation non saisies par des sources de données secondaires[16,17]. Dans le cadre d'études de cette nature, l'analyse passe de milliers de sujets répartis entre 40 ou 50 régions dans un ensemble de données secondaires à un ensemble qui peut regrouper 200 ou 300 patients seulement, dont on vérifie les dossiers. Si l'on pose par exemple comme hypothèse que l'état fonctionnel des patients diffère selon la fréquence des interventions chirurgicales, il faut être certain que chaque cellule comptera suffisamment de patients pour qu'on puisse effectuer une analyse appropriée. Il faut donc justifier clairement la taille de l'échantillon dans le cas des analyses fondées sur la collecte de données primaires.
Lorsqu'on effectue des comparaisons détaillées des résultats de patients, deux questions spéciales se posent[18]. Tout d'abord, les mesures des résultats conviennent-elles? Comme nous l'avons déjà signalé, il se peut que les résultats les plus appropriés manquent et que l'on doive plutôt tirer des inférences fondées sur des variables substitutives. Deuxièmement, les groupes de comparaison ont-ils été bien définis par des facteurs qui pourraient jouer sur les résultats en cause? Des épidémiologistes cliniques qui font une étude de pronostic chercheront surtout à déterminer les caractéristiques des patients qui expliquent des résultats différents, mais des chercheurs étudiant les services de santé essaieront de contrôler les caractéristiques en question et de trouver des variations attribuables à un aspect quelconque du système de santé.
Les études sur les résultats des patients reposent habituellement sur des méthodes statistiques à variables multiples qui permettent de corriger les facteurs qui pourraient jouer sur les résultats et qui n'ont pas été répartis au hasard entre les groupes de comparaison. Il faut présenter à la fois les résultats bruts et les résultats rajustés lorsqu'on utilise des méthodes à variables multiples. L'analyse de sous-groupes portant uniquement sur les patients chez lesquels le risque du résultat en cause est faible est une façon simple de réduire la confusion suscitée par des différences subtiles et non mesurées entre les groupes de comparaison[19] et il faudrait effectuer cette analyse de façon routinière. Cette affirmation est fondée sur l'hypothèse selon laquelle les facteurs confusionnels comme des conditions de comorbidité mesurées de façon incomplète sont moins probables dans les groupes à faible risque.
Résultats
Afin d'optimiser la lisibilité du texte, les résultats doivent suivre le même ordre que les éléments soulignés dans la partie qui porte sur la méthodologie. Afin de dissiper les préoccupations relatives à une déviation systématique possible, la section des résultats devrait comprendre des détails sur les données manquantes ou les sujets exclus. On peut utiliser beaucoup de tableaux et de figures, mais à deux conditions. Tout d'abord, les tableaux et les figures ne devraient présenter que des données qui ont trait directement à la question de recherche. Deuxièmement, pour éviter toute répétition inutile, il faut seulement mettre en évidence dans le texte les données présentées dans les tableaux et les figures. Les tableaux devraient, par exemple, tenir compte de tous les participants et indiquer à la fois leur nombre et leur pourcentage, tandis que dans le texte, on peut identifier les groupes les plus communs par leur pourcentage seulement.
Discussion
Le problème le plus fréquent que pose la discussion, c'est sa longueur. C'est habituellement parce que l'on répète les résultats. Lorsqu'on rédige ou examine cette partie, il ne faut pas oublier que tout le texte doit tenir sur moins de 2500 mots (à l'exclusion du résumé et des références).
Dans la section sur la discussion, il faut résumer les principales constatations dans le premier paragraphe, ou dans les deux premiers. Il est ensuite indiqué d'interpréter les résultats ou de répondre à la question inévitable : «Et alors?». Même s'il est parfois possible de tirer des conclusions générales d'études portant sur un sujet précis, il faut éviter de tirer des conclusions injustifiées au sujet des résultats. Par exemple, une étude descriptive indiquant une variation significative des tendances de la pratique ne permet pas de tirer des conclusions définitives sur la cause des variations. Des séjours beaucoup plus long à un hôpital plutôt qu'à un autre peuvent être moins représentatifs de l'établissement et plus représentatifs des caractéristiques des patients, des réseaux de présentation sur de longues distances ou du manque de services suffisants de soins à domicile dans la communauté environnante. Il faut toujours envisager et énoncer d'autres interprétations possibles des données. Il faut revoir les limites de l'étude, y compris celles qui sont inhérentes aux sources de données secondaires (Tableau 3). Enfin, il faut suggérer des recherches futures dans le domaine.
Pour le moment, les recherches sur les services de santé continueront de s'inspirer de toutes sortes de données secondaires et compteront énormément sur les méthodes d'observation. Les lignes directrices présentées ici visent à assurer que ces études font l'objet de rapports qui rendent transparentes les forces et les faiblesses des sources de données et des méthodes d'analyse. De meilleurs rapports aideront en retour à assurer que de telles recherches sur les services de santé contribuent de façon constructive à l'objectif qui est d'améliorer les soins de santé.