بیشتر درمانهای پزشکی با شواهد باکیفیت حمایت نمیشوند
وقتی به پزشک مراجعه میکنید، ممکن است چنین فرض کنید که شواهد محکمی در حمایت از درمانی وجود دارد که آنها تجویز میکنند؛ اما اشتباه میکنید. پژوهشی که سپتامبر سال جاری منتشر شد، نشان میدهد که از هر دَه درمان پزشکی، فقط یک مورد با شواهد با کیفیت بیشتر پشتیبانی میشود. تجزیهوتحلیل مذکور در مجلهی Journal of Clinical Epidemiology منتشر شده است و ۱۵۴ مرور نظاممند را شامل میشود که بین سالهای ۲۰۱۵ تا ۲۰۱۹ منتشر شدهاند. براساس روش استاندارد طلایی (سیستم GRADE)، فقط ۱۵ مورد (۹/۹ درصد) از شواهد با کیفیت زیاد بهره میبردند. از این موارد، تنها دو مورد نتایجی بهدست آورده بودند که ازنظر آماری معنیدار بود. بدینمعنا که بعید بود نتایج آنها ناشی از خطای تصادفی بوده باشد و بهاعتقاد نویسندگان، میتوانستند استفادهی بالینی شوند. با استفاده از همین سیستم، ۳۷ درصد دارای شواهد با کیفیت متوسط، ۳۱ درصد دارای شواهد با کیفیت اندک و ۲۲ درصد دارای شواهد با کیفیت بسیار کم بودند.
سیستم GRADE مواردی مانند خطر سوگیری را بررسی میکند. برای مثال، مطالعاتی که کور هستند (یعنی در آنها بیماران نمیدانند درمان واقعی یا دارونما را دریافت میکنند)، درمقایسهبا مطالعات غیرکور شواهد با کیفیت بیشتری فراهم میکنند. کوربودن آزمایش مهم است؛ زیرا افرادی که میدانند چه درمانی دریافت میکنند، درمقایسهبا کسانی که نمیدانند چه درمانی دریافت کردهاند، ممکن است اثرهای دارونمای بیشتری تجربه کنند. علاوهبراین، GRADE تفاوت در روشهای استفاده از درمان و تأثیر آن روی دقت مطالعه را در نظر میگیرد.
براساس مطالعهی مروری که سال ۲۰۱۶ منتشر شد، ۱۳/۵ درصد (حدود یک از هفت مورد) از مطالعات گزارش میکردند که درمانهای آنها با شواهد دارای کیفیت درخورتوجه حمایت میشود. طبق GRADE، فقدان شواهد دارای کیفیت چشمگیر بهمعنای آن است که مطالعات آینده ممکن است نتایج آنها را باطل کنند.
۱۵۴ مطالعه به این دلیل انتخاب شده بودند که بهروزرسانیهایی از ۶۰۸ مرور نظاممند پیشین بودند که در سال ۲۰۱۶ انجام شده بود. این امر به پژوهشگران کمک کرد تا بررسی کنند آیا مرورهای بهروزشده با شواهد جدید شواهد با کیفیت بیشتر دارند یا خیر؛ البته چنین نبود. در مطالعهی سال ۲۰۱۶، ۱۳/۵ درصد گزارش کردند که درمانها با شواهد دارای کیفیت بیشتر حمایت میشدند و با جمعآوری شواهد بیشتر روندی بهسوی کیفیت کمتر دیده میشد.
البته مطالعهی سال ۲۰۱۶ محدودیتهایی داشت. برای مثال، اندازهی نمونهی آن ممکن است نشانگر کل مطالعات نبوده باشد. مطالعات مشابه دیگر دریافتهاند که احتمالا بیش از ۴۰ درصد از درمانهای پزشکی مؤثر هستند. همچنین، نمونهی موجود در مطالعه بهاندازهی کافی بزرگ نبود تا بتواند بررسی کند که آیا انواعی از درمانهای پزشکی (دارویی و جراحی و روانشناختی) بهتر از بقیه درمانها هستند. افزونبراین، ممکن است استاندارد طلایی برای رتبهبندی شواهد (GRADE) بیشازحد سختگیرانه باشد.
مطالعات بیکیفیت بسیار زیاد
کارآزماییهای بیکیفیت بسیاری منتشر میشوند. بهدلیل فشار «منتشر کن یا نابود شو» برای ماندن در محیطهای دانشگاهی، مطالعات بسیاری در حال انجام است. فقط در PubMed که یکی از پایگاههای دادهی مقالات پزشکی است، هرساله بیش از ۱۲ هزار کارآزمایی بالینی جدید منتشر میشود. مرورهای نظاممند برای تلفیق این مطالعات طراح شدند؛ اما اکنون تعداد بسیار زیادی از آنها نیز وجود دارد؛ بهگونهای که فقط در PubMed بیش از دوهزار مورد در سال منتشر میشود.
بیش از ۳۰ سال است که جنبش پزشکی مبتنیبر شواهد بر لزوم بهبود کیفیت پژوهشها تأکید میکند؛ اما با وجود دستورالعملها و راهنماییهای زیادی که دراینباره وجود دارد، هیچ شاهدی مبنیبر بهبود اوضاع موجود نیست.
در سال ۱۹۹۴، داگ آلتمن، استاد آمار پزشکی در دانشگاه آکسفورد، خواستار انجام پژوهشهای کمتر، ولی باکیفیتتر شد. این پیشنهاد میتوانست مطلوب باشد؛ اما برعکس آن اتفاق افتاد. سونامی کارآزماییهای منتشرشده در هر سال همراهبا نیاز به انتشار مقاله برای بقا در دانشگاه، به انتشار مقالات بیکیفیت زیادی منجر شد و این روند در طول زمان تغییر نکرده است. مشکل شواهد بیکیفیت جدی است: بدون شواهد مناسب متوجه نخواهیم شد که آیا درمانهای استفادهشده تأثیرگذار است یا خیر.
سیستم GRADE خیلی سختگیرانه است
نجار باید بهعنوان آخرین چاره ابزار خود را مقصر بداند؛ بنابراین، باید دربارهی این بهانه احتیاط کنیم که GRADE کارایی ندارد. بااینحال، ممکن است درست باشد که سیستم GRADE در برخی زمینهها بسیار سختگیرانه است. برای مثال، تقریبا ناممکن است کارآزماییای که رژیم ورزشی خاصی را ارزیابی میکند، کیفیت چشمگیری داشته باشد. کارآزمایی ورزشی نمیتواند کور باشد: کسی که ورزش میکند، میداند در گروه ورزش قرار دارد؛ درحالیکه کسانی که در گروه کنترل قرار دارند، میدانند ورزش نمیکنند. همچنین، دشوار است که گروههای بزرگی از افراد دقیقا مانند هم ورزش کنند؛ درحالیکه دادن یک نوع قرص به همه آسانتر است. این مشکلات ذاتی موجب میشود کارآزماییهای ورزش بهعنوان کارآزماییهای دارای کیفیت کمتر قضاوت شوند.
همچنین، روش انجام مطالعهی جدید نیز سختگیرانه بود. درحالیکه مرورهای نظاممند نتایج زیادی داشتند (هریک میتوانست از کیفیت بیشتری برخوردار باشد)، پژوهشگران روی نتایج اصلی تمرکز کردند. بهعنوان مثال، نتیجهی اصلی مرور داروهای مسکن کاهش درد است. درعینحال، آنها ممکن است پیامدهای ثانویهی مختلفی مانند کاهش اضطراب یا رضایت بیمار را نیز اندازهگیری کنند. تمرکز بر نتایج اصلی از یافتههای جعلی جلوگیری میکند. اگر نتایج زیادی بررسی شود، این خطر وجود دارد که یکی از آنها بهطور تصادفی از کیفیت بیشتری برخوردار باشد.
بهطور میانگین، بیشتر درمانهای پزشکی که اثربخشی آنها در مرورهای نظاممند آزمایش شده بود، با شواهد دارای کیفیت بیشتر حمایت نمیشوند. برای حل این مشکل و کسب اطمینان بیشتر دربارهی درمانهای که استفاده میکنیم، به پژوهشهای کمتر، ولی بهتر نیاز داریم.
نظرات