Către o raportare completă şi judicioasă a studiilor referitoare la rigurozitatea diagnostică: iniţiativa STARD

Grupul de iniţiativă pentru Standards for Reporting of Diagnostic Accuracy (STARD - Standardele de Raportare a Rigurozităţii Diagnostice) îşi propune să îmbunătăţească judiciozitatea raportării tuturor studiilor legate de rigurozitatea diagnostică. Grupul prezintă în detaliu elaborarea unei liste de control şi a unei diagrame de flux pentru autorii rapoartelor

Rezumat

Obiective: Să îmbunătăţească raportarea completă şi judicioasă a cercetărilor referitoare la rigurozitatea diagnostică, să permită cititorilor evaluarea potenţialului de eroare dintr-un studiu şi să evalueze posibilităţile de generalizare a rezultatelor.

Metode: Comitetul STARD a realizat o documentare, cu scopul de-a identifica lucrările referitoare la coordonarea adecvată şi la raportarea studiilor diagnostice, şi a extras subiectele potenţiale pentru a le înscrie într-o listă amplă. Cercetătorii, editorii şi membrii organizaţiilor profesionale au scurtat lista, în cadrul unei întruniri cu durata de două zile, în vederea obţinerii unui consens în ceea ce priveşte elaborarea unei liste de control şi unei diagrame generale de flux pentru studiile despre rigurozitatea diagnostică.

Rezultate: În urma documentării care a urmărit să identifice ghidurile despre cercetarea diagnostică au fost găsite 33 de liste de control publicate anterior; dintre ele am selectat o listă de 75 de subiecte potenţiale. La întrunirea pentru realizarea consensului, participanţii au redus lista de control la 25 de subiecte, utilizând dovezile, ori de câte ori a fost posibil. Un prototip al diagramei de flux furnizează informaţii despre metoda de selectare a pacienţilor, despre gradul de efectuare a testului şi despre numărul de pacienţi supuşi testului evaluat şi standardului de referinţă, ori ambelor.

Concluzii: Evaluarea cercetării depinde de raportarea completă şi judicioasă. Dacă revistele medicale vor adopta lista de control şi diagrama de flux a STARD, va creşte calitatea raportării studiilor referitoare la rigurozitatea diagnostică, ceea ce va aduce beneficii clinicienilor, cercetătorilor, recenzorilor, revistelor medicale şi publicului.

Introducere

Domeniul testelor diagnostice este foarte dinamic. Ritmul în care se elaborează noi teste este extrem de rapid, iar tehnologia celor existente se perfecţionează continuu. Rezultatele exagerate sau eronate ale studiilor cu protocol necorespunzător, referitoare la diagnostic, pot declanşa difuzarea lor prematură, fapt ce i-ar determina pe medici să ia decizii terapeutice incorecte. O evaluare judicioasă a testelor diagnostice, înainte de aplicarea lor în practica clinică, ar putea nu numai să reducă ponderea consecinţelor clinice negative asociate cu estimările greşite ale rigurozităţii testelor, ci şi să limiteze costurile din sănătate, prin prevenirea testărilor inutile. Studiile pentru stabilirea rigurozităţii diagnostice a unui test sunt o componentă esenţială a procesului de evaluare.1-3

În studiile referitoare la rigurozitatea diagnostică, rezultatele unuia sau mai multor teste supuse evaluării sunt comparate cu cele ale standardului de referinţă - ambele determinate pe subiecţi suspectaţi a prezenta boala de interes. Termenul test se referă la orice metodă de obţinere a unor informaţii suplimentare despre starea de sănătate a unui pacient; este vorba despre date referitoare la istoric şi la examenul clinic, la testele de laborator, imagistice, funcţionale şi histopatologice. Afecţiunea de interes sau afecţiunea ţintă se referă la o anumită boală sau la orice afecţiune ce poate să fie identificată şi să orienteze operaţiunile clinice (testarea diagnostică suplimentară, iniţierea, modificarea sau întreruperea tratamentului). În acest context, standardul de referinţă este considerat a fi cea mai bună dintre metodele utilizate pentru stabilirea prezenţei sau absenţei afecţiunii de interes. Standardul de referinţă poate fi o singură metodă, sau o combinaţie de metode, care determină prezenţa afecţiunii ţintă. El poate include teste de laborator, teste imagistice şi patologice, precum şi urmărirea clinică specifică a subiecţilor. Termenul rigurozitate se referă la nivelul concordanţei între informaţiile obţinute cu ajutorul testului supus evaluării, considerat test indicator, şi standardul de referinţă. Rigurozitatea diagnostică poate fi exprimată în multe feluri, inclusiv prin sensibilitate şi specificitate, probabilitate, risc relativ estimat şi prin zona de sub curba caracteristică primitor-operator.4-6

Există mai multe aspecte care pot ameninţa validitatea internă şi externă a unui studiu consacrat rigurozităţii diagnostice. O sinteză a unor asemenea studii, publicate în patru reviste importante, între 1978 şi 1993, a arătat că metodele folosite au avut o calitate care merită cel mult calificativul mediocră.7 Evaluările au fost, însă, incomplete, pentru că din multe raportări au lipsit informaţiile despre elementele esenţiale legate de protocolul, coordonarea şi analiza studiilor diagnostice.7 Autorii metaanalizelor au confirmat absenţa informaţiilor capitale despre protocolul de studiu şi modul de efectuare a studiilor diagnostice.8, 9 Ca şi în oricare alt tip de cercetare, lacunele existente la nivelul protocolului de studiu pot duce la rezultate eronate. Un raport a arătat că studiile diagnostice cu elemente specifice de protocol sunt asociate cu estimări eronate, optimiste, ale rigurozităţii diagnostice, comparativ cu studiile fără asemenea elemente.10

La colocviul Cochrane, din 1999, de la Roma, grupul de lucru pentru metodele Cochrane de stabilire a diagnosticului şi de efectuare a testelor screening a remarcat calitatea slabă a metodologiei utilizate şi raportarea necorespunzătoare a evaluării testelor diagnostice. Grupul de lucru a stabilit că primul pas în direcţia evitării unor astfel de neajunsuri îl reprezintă îmbunătăţirea calităţii raportării studiilor diagnostice. După iniţiativa de succes CONSORT,11-13 grupul de lucru şi-a propus să elaboreze o listă de control cu subiectele care ar trebui incluse în raportarea unui studiu al rigurozităţii diagnostice.

Obiectivul iniţiativei STARD este de-a îmbunătăţi calitatea raportării studiilor referitoare la rigurozitatea diagnostică. Raportarea completă şi judicioasă le permite cititorilor să deceleze potenţialul de eroare dintr-un studiu (validitatea internă) şi să evalueze posibilitatea generalizării şi aplicării rezultatelor (validitatea externă).

Metode

Comitetul de iniţiativă STARD (vezi bmj.com) şi-a început activitatea printr-o amplă documentare, care a urmărit identificarea lucrărilor referitoare la coordonarea şi raportarea studiilor diagnostice; au fost explorate Medline, Embase, BIOSIS şi baza de date Cochrane Collaboration, până în iulie 2000. Membrii comitetului de iniţiativă au examinat şi indicaţiile bibliografice ale articole extrase, au cercetat fişiere personale şi au luat legătura cu experţi din domeniul cercetării diagnostice. Ei au trecut în revistă toate publicaţiile relevante, pe baza cărora au întocmit o listă amplă de subiecte potenţiale pentru lista de control.

Ulterior, comitetul de iniţiativă STARD a convocat o întrunire pentru consens, cu durata de două zile, la care a invitat experţi din următoarele grupuri de interes: cercetători, editori, metodologi şi organizaţii profesionale. Conferinţa a urmărit să reducă dimensiunile listei de subiecte potenţiale, în cazurile care se pretau la o asemenea ajustare, şi să analizeze variantele optime ale formatului şi prezentării listei de control. Selecţia subiectelor ce meritau să fie reţinute s-a bazat pe dovezi, ori de câte ori a fost posibil.

Întrunirea a fost organizată în sesiuni pe grupuri mici şi sesiuni plenare. Fiecare dintre grupurile mici s-a axat pe un lot de subiecte de pe listă, iar sugestiile lor au fost discutate, ulterior, în sesiuni plenare. Pe baza sugestiilor grupurilor şi a observaţiilor din sesiunile în plen a fost stabilită o primă formă a listei de control STARD. A doua zi s-a analizat versiunea respectivă şi s-au făcut noi modificări. Membrii grupului STARD au putut face sugestii şi mai târziu, în cadrul unei runde de comentarii prin e-mail.

Utilizatorii potenţiali au testat versiunea listei de control şi diagrama de flux, colectându-se observaţii suplimentare. Noua versiune, însoţită de solicitarea adresată vizitatorilor, de-a trimite comentarii, a fost plasată de website-ul CONSORT. Comitetul de iniţiativă STARD a discutat toate comentariile şi a elaborat lista finală.

Rezultate

Trecerea în revistă a ghidurilor referitoare la cercetarea diagnostică a furnizat 33 de liste. Pe baza ghidurilor publicate şi a celor furnizate de membrii grupului STARD, comitetul a elaborat o listă cu 75 de subiecte. În timpul întrunirii pentru consens, din 16-17 septembrie 2000, participanţii au susţinut sau au eliminat unele subiecte, lista de control finală rămânând cu doar 25 de subiecte. Participanţii la conferinţă au făcut o revizuire importantă a prezentării şi a formatului listei de control.

Grupul STARD a primit observaţii şi comentarii importante în timpul diferitelor stadii de evaluare de după conferinţă, care au dus la versiunea finală a listei de control, prezentată în tabel.


Prototip de diagramă de flux pentru un studiu asupra acurateţei diagnostice

Diagrama de flux furnizează informaţii despre metoda de selectare a pacienţilor (de exemplu, recrutarea unor serii consecutive de pacienţi cu simptome specifice sau a cazurilor şi a grupurilor de control), nivelul de efectuare a testului şi numărul de pacienţi supuşi testului evaluat (test indicator) şi testului de referinţă. Figura arată un prototip de diagramă de flux, care reflectă protocolul utilizat cel mai frecvent în cercetarea diagnostică. Pe website-ul STARD (www.consort-statement.org/stardstatement.htm) sunt disponibile exemple care reflectă şi alte protocoale.

Lista de control STARD pentru raportarea studiilor referitoare la rigurozitatea diagnostică


Secţiune şi temă Subiect Descriere
Titlu, rezumat şi cuvinte cheie 1 Identifică articolul ca studiu al rigurozităţii diagnostice (recomandă titlul MeSH "sensibilitate şi specificitate")
Introducere  2 Prezintă obiectivele cercetării, cum ar fi estimarea sau compararea rigurozităţii diagnostice
Metode:
Participanţi 3 Descriu populaţia de studiu: criteriile de includere şi excludere, localizarea instituţiilor de unde au fost colectate datele
  4 Descriu selectarea participanţilor: A fost cumva influenţată de simptomele prezente, de rezultatele testelor anterioare sau de faptul că subiecţii au fost supuşi testului indicator sau celui standard?
  5 Descriu eşantionul participanţilor: este o serie consecutivă de pacienţi definiţi prin criteriile de selecţie de la punctele 3 şi 4? Dacă nu, se specifică modul în care s-a făcut selecţia ulterioară a participanţilor
  6 Descriu colectarea datelor: a fost colectarea datelor planificată înainte de efectuarea testelor indicator şi a celor standard, de referinţă (studii prospective) sau ulterior (studii retrospective)?
Metode test 7 Descriu standardul de referinţă şi justificarea sa
  8 Descriu specificaţiile tehnice ale materialului şi metodelor implicate, inclusiv modul şi momentul în care au fost efectuate determinările, citează indicaţiile pentru testele indicator sau cele de referinţă, ori pentru ambele
  9 Descriu definiţia şi justificarea unităţilor, termenelor limită sau categoriilor de rezultate pentru testele indicator şi cele de referinţă
  10 Descriu numărul, pregătirea şi specialitatea celor care au efectuat şi interpretat testele indicator şi standardele de referinţă
  11 Cei care au interpretat testele indicator şi standardul de referinţă au fost "orbi" la (nu au cunoscut) rezultatele altor teste? Prezintă orice altă informaţie clinică disponibilă acestora
 
Metode statistice 12 Descriu metodele pentru calcularea sau compararea determinărilor rigurozităţii diagnostice şi metodele statistice utilizate pentru cuantificarea incertitudinii (de exemplu, intervalele de încredere de 95%)
  13 Descriu metodele de calcul al reproductibilităţii testului, dacă sunt disponibile
Rezultate:
Participanţi 14 Consemnează când a fost efectuat studiul, inclusiv datele începerii şi încheierii recrutării
  15 Consemnează caracteristicile clinice şi demografice (de exemplu, vârsta, sexul, spectrul de simptome, comorbiditatea, tratamentele curente şi centrul de selectare)
  16 Consemnează gradul în care participanţii au satisfăcut criteriile de includere, dacă au făcut testele indicator sau pe cel standard, de referinţă, ori pe ambele; descriu motivul pentru care subiecţii nu au făcut fiecare test (este recomandată o diagramă de flux)
Rezultatele testelor 17 Consemnează intervalul de timp de la testele indicator la standardul de referinţă şi orice tratament administrat în intervalul respectiv
  18 Consemnează distribuţia severităţii afecţiunii (criterii definitorii), la cei cu afecţiunea ţintă, şi alte diagnostice la participanţii fără afecţiunea ţintă
  19 Consemnează rezultatele testelor indicator (inclusiv a celor nedeterminate sau absente), în paralel cu rezultatele standardului de referinţă; pentru rezultatele continue, consemnează distribuţia rezultatelor testului prin rezultatele standardului de referinţă
  20 Consemnează efectele adverse manifestate în urma efectuării testelor indicator sau a standardului de referinţă
Estimări 21 Consemnează estimările rigurozităţii diagnostice şi determinarea incertitudinii statistice (de exemplu, intervalele de încredere de 95%)
  22 Consemnează maniera de abordare a rezultatelor neclare, a răspunsurilor absente şi a celor care nu au făcut testele indicator
  23 Consemnează variabilitatea rigurozităţii diagnostice (în cazurile în care a fost determinată) la nivelul persoanelor care 

interpretează testele, a centrelor sau a subgrupelor de participanţi

  24 Consemnează reproductibilitatea testului, în cazurile în care a fost determinată
Discuţii 25 Discută aplicabilitatea clinică a datelor din studiu

Discuţii

Scopul iniţiativei STARD este de-a îmbunătăţi calitatea raportării studiilor diagnostice. Subiectele din lista de control şi diagrama de flux îi ajută pe autori să descrie elementele esenţiale ale protocolului de studiu şi modul de desfăşurare a studiului, efectuarea testelor şi rezultatele. Am aranjat subiectele conform structurii uzuale a articolelor medicale, ceea ce nu înseamnă, însă, că am intenţionat să impunem o anumită succesiune a lor în cadrul textului.

Principiul care a guvernat elaborarea listei de control STARD a fost selectarea subiectelor care să-i ajute pe cititori să aprecieze potenţialul de eroare din studiu şi aplicabilitatea observaţiilor. Alte două consideraţii generale vizează conţinutul şi aspectul listei de control. În primul rând, grupul STARD apreciază că o listă general valabilă pentru studiile referitoare la rigurozitatea diagnostică va fi mai uşor de acceptat de autori, corectori şi editori şi se va răspândi pe scară mai largă decât listele întocmite separat, pe domenii. Evaluarea testelor imagistice diferă de cele de laborator, dar apreciem că diferenţele sunt mai degrabă de formă decât de fond. O a doua consideraţie a fost elaborarea unei liste de control specifică, destinată studiilor de rigurozitate diagnostică. Nu am inclus aspectele generale ale prezentării rezultatelor cercetării, cum sunt, de pildă, recomandările generale pentru autorii care trimit un manuscris spre publicare în revistele biomedicale.14

Ori de câte ori a fost posibil, grupul STARD şi-a bazat deciziile de includere a unui subiect pe datele care-l corelau cu estimările eronate (validitatea internă) sau cu variaţiile determinărilor rigurozităţii diagnostice (validitatea externă). Datele au variat, de la articolele descriptive (care explicau principiile teoretice) şi lucrările ce prezentau rezultatele modelelor statistice la datele empirice, derivate din studiile diagnostice. Pentru mai multe subiecte, datele au fost destul de limitate.

Un document separat explică semnificaţia şi justificarea fiecărui subiect şi face o succintă trecere în revistă a tipului şi volumului datelor.15 Documentul respectiv trebuie să stimuleze utilizarea, înţelegerea şi diseminarea listei de control STARD.

Grupul STARD a făcut eforturi considerabile în direcţia elaborării unei diagrame de flux pentru studiile diagnostice. O diagramă de flux are potenţialul de a comunica, într-o manieră transparentă, informaţii cruciale despre protocolul de studiu şi fluxul participanţilor.16 O diagramă de flux comparabilă a devenit elementul esenţial în standardele CONSORT pentru raportarea experimentelor statistice.12,16 Diagrama de flux poate fi şi mai importantă în studiile diagnostice, dată fiind varietatea protocoalelor de studiu utilizate în cercetarea diagnostică. Diagramele de flux din raportarea studiilor referitoare la rigurozitatea diagnostică indică procesul de eşantionare şi selectare a participanţilor (validitatea externă), fluxul participanţilor în corelaţie cu timpul şi cu rezultatele testelor, numărul de subiecţi care nu au efectuat testul indicator ori standardul de referinţă, sau ambele teste (potenţial pentru eroare de verificare17-19) şi numărul de subiecţi din fiecare etapă de studiu, ceea ce furnizează un numitor corect pentru procente (consistenţa internă).

Grupul STARD urmăreşte să determine impactul declaraţiei asupra calităţii raportărilor referitoare la rigurozitatea diagnostică, în care s-a făcut o evaluare iniţială şi alta finală.13 Documentele care consemnează iniţiativa STARD vor fi prezentate într-o formă actualizată de îndată ce vor fi disponibile noi informaţii despre sursele de eroare sau de variabilitate. Primim bucuroşi orice comentariu, fie el pe marginea conţinutului ori a formei, pentru îmbunătăţirea versiunii curente.

Iniţiativa pentru îmbunătăţirea raportării studiilor a avut numeroşi susţinători din întreaga lume, care au făcut comentarii pe marginea versiunilor mai vechi. Prezentul articol a fost publicat şi în primul număr din 2003 al revistelor Annals of Internal Medicine, Clinical Chemistry, Journal of Clinical Microbiology, Lancet şi Radiology. Clinical Chemistry a publicat şi prima variantă a documentului.

Contribuţii: PMB şi JGL sunt iniţiatorii proiectului STARD. Rijk van Ginkel a făcut prima documentare în scopul identificării ghidurilor privind protocolul şi efectuarea studiilor diagnostice. Toţi autorii au contribuit la lista de subiecte potenţiale. PMB, JBR şi JGL au pregătit întrunirea pentru consens. Toţi autorii au discutat comentariile primite în diferitele etape ale procesului de evaluare şi au fost implicaţi în finalizarea listei de control. JBR a scris prima formă a articolului, toţi autorii contribuind la forma finală. PMB, JBR şi JGL sunt garanţii.

Finanţare: Sprijinul financiar pentru grupul STARD a fost furnizat, în parte, de Dutch Health Care Insurance Board, Amstelveen, Olanda, de International Federation of Clinical Chemistry, Milano, Italia, de Medical Research Council's Health Services Research Collaboration, Bristol, şi de Academic Medical Cencer, Amsterdam, Olanda.

Conflict de interese: Nici unul declarat.

Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative 
BMJ 2003;326:41-4

Department of Clinical Epidemiology and Biostatistics, Academic Medical Center, University of Amsterdam, PO Box 22700, 1100 DE Amsterdam, Netherlands 
Patrick M Bossuyt professor of clinical epidemiology 
Johannes B Reitsma clinical epidemiologist 
Jeroen G Lijmer clinical epidemiologist 
Clinical Chemistry, University of Virginia, Charlottesville, VA 22903­0757, USA 
David E Bruns editor 
Center for Statistical Sciences, Brown University, Providence, RI 02912, USA Constantine
 A Gatsonis professor of medical science (biostatistics) and applied mathematics
Correspondence to: P Bossuyt stard@amc.uva.nl 
School of Population Health, University of Queensland, Brisbane, Queensland 4006, Australia 
Paul P Glasziou professor of evidence based practice 
Department of Public Health and Community Medicine, University of Sydney, Sydney, NSW 2006, Australia 
Les M Irwig professor of epidemiology 
Thomas C Chalmer's  Center for Systematic Reviews, Children's Hospital of Eastern Ontario Research Institute, Ottawa, ON K1H 8LI, Canada 
David Moher director 
JAMA, 515 N State St, Chicago, IL 60610, USA 
Drummond Rennie deputy editor Institute for Research in Extramural Medicine, 
VU University Medical Center, 1081 BT Amsterdam, Netherlands 
Henrica C W de Vet professor of epidemiology 

Bibliografie


1 Guyatt GH, Tugwell PX, Feeny DH, Haynes RB, Drummond M. A framework for clinical evaluation of diagnostic technologies. Can Med Assoc J 1986;134:587­94.

2 Fryback DG, Thornbury JR. The efficacy of diagnostic imaging. Med Decis Making 1991;11:88­94.

3 Kent DL, Larson EB. Disease, level of impact, and quality of researc methods. Three dimensions of clinical efficacy assessment applied to magnetic resonance imaging. Invest Radiol 1992;27:245­54.

4 Griner PF, Mayewski RJ, Mushlin AI, Greenland P. Selection and interpretation of diagnostic tests and procedures. Principles and applica­ tions. Ann Intern Med 1981;94:557­92.

5 Sackett DL, Haynes RB, Guyatt GH, Tugwell P. The selection of diagnostic tests. In: Sackett D, ed. Clinical epidemiology. Boston, Toronto, and London: Little, Brown and Company, 1991:47­57.

6 Metz CE. Basic principles of ROC analysis. Semin Nucl Med 1978;8:283­98.

7 Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research. Getting better but still not good. JAMA 1995;274:645­51.

8 Nelemans PJ, Leiner T, de Vet HCW, van Engelshoven JMA. Peripheral arterial disease: meta­analysis of the diagnostic performance of MR angiography. Radiology 2000;217:105­14.

9 Devries SO, Hunink MGM, Polak JF. Summary receiver operating characteristic curves as a technique for meta­analysis of the diagnostic performance of duplex ultrasonography in peripheral arterial disease. Acad Radiol 1996;3:361­9.

10 Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, van der Meulen JH, et al. Empirical evidence of design­related bias in studies of diagnostic tests. JAMA 1999;282:1061­6.

11 Begg C, Cho M, Eastwood S, Horton R, Moher D, Olkin I, et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement. JAMA 1996;276:637­9.

12 Moher D, Schulz KF, Altman D. The CONSORT statement: revised recommendations for improving the quality of reports of parallel­group randomized trials. JAMA 2001;285:1987­91.

13 Moher D, Jones A, Lepage L. Use of the CONSORT statement and quality of reports of randomized trials. A comparative before­and­after evaluation. JAMA 2001;285:1992­5.

14 International Committee of Medical Journal Editors. Uniform require­ ments for manuscripts submitted to biomedical journals. JAMA 1997;277:927­34. http://www.acponline.org/journals/annals/01jan97/ unifreqr.htm (accessed 7 Nov 2002).

15 Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al. The STARD statement for reporting studies of diagnostic accuracy: explanation and elaboration. Clin Chem 2003;49:7­18.

16 Egger M, J¸ni P, Barlett C. Value of flow diagrams in reports of randomized controlled trials. JAMA 2001;285:1996­9.

17 Knottnerus JA. The effects of disease verification and referral on the relationship between symptoms and diseases. Med Decis Making 1987;7:139­48.

18 Panzer RJ, Suchman AL, Griner PF. Workup bias in prediction research. Med Decis Making 1987;7:115­9.

19 Begg CB. Biases in the assessment of diagnostic tests. Stat Med 1987;6:411­23.

Rate this article: 
Încă nu sunt voturi
Bibliografie: 
Traducere: 
Dr. Rodica Chirculescu
Autor: