زمینه و هدف: یکی از مشکلات اساسی در درمان بیماری سرطان، عدم وجود روشی مناسب در تشخیص زودرس آن میباشد. سرطان پستان یکی از بیماریهای شایع در بین زنان میباشد که تشخیص در مراحل اولیه میتواند تأثیر بسزایی در میزان مرگ و میر زنان داشته باشد. در حال حاضر، نشانگرهای تومور مناسب برای تشخیص زودرس این بیماری وجود ندارد. واکنشهای شیمیایی درون یک عضو زنده میتواند بصورت الگوهایی پروتئینی در مایعاتی نظیر خون، خلط و ادرار انعکاس داده شود. طیفسنج جرمی جذب- یونیزاسیون لیزری سطحی ارتقاء یافته زمان پروازی یک ابزار مناسب جهت تهیه پروفایلهای پروتئینی از نمونههای بیولوژیک میباشد. ارایه یک روش دادهکاوی جهت انتخاب نشانگرهای حیاتی تفکیک کننده گروههای سالم از سرطانی، جزء چالشهای مهم در تحلیل الگوهای پروتئینی محسوب میشود.
روش بررسی: در این تحقیق، دادههای پروفایل پروتئینی خونابه بیماران مبتلا به سرطان پستان مورد تحلیل قرارگرفت. با ارایه یک مدل ریاضی و استفاده از تبدیل موجک گسسته، اغتشاشات خط زمینه و نویز الکتریکی در مرحله پیشپردازش حذف گردید و سپس، تمام سیگنالهای طیف جرمی نرمالیزه شدند. در این مقاله، یک الگوریتم داده کاوی ترکیبی مبتنی بر سه معیار آزمون آماری، اندازه تفکیکپذیری کلاس و امتیازدهی نقاط، معرفی شده است. با روش پیشنهاد شده، بهترین زیرمجموعه پروتئینها از بین 13488 نقطه موجود با حفظ ارزش اطلاعاتی و قدرت تفکیکپذیری انتخاب شد و برای تعیین نشانگرهای حیاتی استفاده گردید. با استفاده از روش ارزیابی متقابل K چرخشی، نمونههای موجود در مجموعه داده به دو دسته یادگیری و آزمون، بطور تصادفی تقسیم شدند. حداقل آستانه برای آمارگان T مقدار 96/1 انتخاب شد. الگوریتم دادهکاوی به نقاط باقیمانده از مرحله آستانهدهی اعمال شد و بهترین زیرمجموعه ویژگیها شامل نشانگرهای حیاتی با قدرت تمایز بالا انتخاب گردید.
یافته ها: با استفاده از روش تحلیل تمایز خطی، تعداد 19 پروتئین بعنوان نشانگر حیاتی برگزیده شد که توانست نمونههای سالم و سرطانی را با دقت تشخیص 100%، حساسیت 100% و قطعیت 100% از هم تمیز دهد.
بحث و نتیجهگیری: با تولید اطلاعات کامل از نمونههای بیولوژیک میتوان از آنها در تشخیص بیماریهای با عوامل تشخیصی ضعیف نظیر سرطان استفاده نمود. تشخیص بیماری نمونهای از تفکیک الگو میباشد. در این مقاله، یک الگوریتم داده کاوی جهت انتخاب بهترین زیرمجموعه از پروتئینها معرفی گردید. روش پیشنهادی نشان داد که با کاهش تعداد نشانگرهای حیاتی منتخب، که از مزیتهای این روش میباشد، قدرت تفکیکپذیری از سطح مناسبی برخوردار است. نتایج بدست آمده تأکید دارد که انتخاب مناسب زیرمجموعه پروتئینهای شاخص تأثیر بسزایی در تعیین نشانگرهای حیاتی جهت تشخیص صحیح بیماری دارد.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |