آناليز بقا
آناليز بقا
يكي از انواع داده ها كه مورد علاقه ي شديد محققين است اهميت دادن به فاصله زماني تا وقوع بعضي حوادث مانند مرگ ومير و ... مي باشد.
يعني پرداختن و توجه نمودن به گروهي از افراد به طوريكه پس از مدتي براي هركدام از آن ها يك نقطه ي زماني به نام شكست يا وقوع حادثه تعريف مي گردد.
شكست يا حادثه ي مورد نظر مي تواند حداكثر يك بار براي هر فرد اتفاق افتد.از جمله مواردي كه مي تواند مصداق شكست يا واقعه ي مورد نظر باشد،طول عمر يك ماشين صنعتي ،اولين زمان مراجعه ي يك اتومبيل نو به تعمير گاه و...مثال هايي از اين قبيل هستند.
از آن جايي كه اين روش ها در ابتدا غالباً براي مطالعات مرگ و مير به كار برده مي شد و اصلاً بدين منظور طراحي گرديده بود، به همين جهت نام تجزيه و تحليل زمان بقا بر آن نهاده شده است .
تحليل بقا از نظر علم آمار عبارت است از استفاده از فنون مختلف آماري در تحليل متغيرهاي تصادفي نامنفي پيشينه ي تحليل بقا كارهاي است که در گذشته در مورد جداول عمر انجام شده که در قرن 17 میلادی شخصی به نام grount اولین فهرست هفتگی مرگ ومیر را در لندن منتشر کرد.
در طول جنگ جهانی دوم نیز استحکام و پایایی ابزار آلات جنگی بسیار مطرح بود وبه همین دلیل استفاده از روش های بررسی مطالعه ی طول عمر ابزار آلات صنعتی بسیار حیاتی بود. در سال های بعد از پایان جنگ، این روش ها برای مطالعه ی زمان بقای بیماران سرطانی به کار رفتند و به جای واژه ی آنالیز بقا توسط محققان جایگزین گشت.
ویژگی های زمان بقا
زمان بقا ،یک متغیر تصادفی غیر منفی است که فاصله ی زمانی بین شروع وقوع یک پدیده ی خاص را اندازه گیری می کند.به خاطر دو ویژگی خاص زمان بقا را نمی توان با روش های آماری استاندارد بررسی کرد.
اول اینکه زمان بقای واقعی ممکن است بیشتر از مدت زمان مطالعه باشد ونتوان آن را کامل اندازه گیری کرد.همچنین در بسیاری از مطالعات بالینی ،افراد شرکت کننده قبل از پایان مطالعه و به سادگی و یا به علتی غیر از علت مورد بررسی از مطالعه خارج می شوند. این اطلاعات ناقص ، اطلاعات سانسور شده نامیده می شوند . به همین دلیل استفاده از روش های معمولی آماری در مورد زمان بقا کارایی ندارد.
خصوصیت دوم زمان بقا این است که این متغیر به جای پیروی از توزیع نرمال از توزیع چوله پیروی می کند.
توابع بقا
توزیع T ، زمان بقا از نقطه ی مثبت یا نقطه ی آغاز تا پیشامد مورد نظر که به صورت یک متغیر تصادفی در نظر گرفته می شود ، به وسیله ی هریک از دو تابع هم ارز تابع بقا و خطر مشخص می شود. تابع بقا را با S(t) نشان می دهیم وبا احتمالی که یک فرد بیشتر از t واحد زمانی زنده بماند تعریف شده:
S(∞)=0 , S(0)=1 , S(t)=Pr(T>t)
نموداری که S(t) را بر حسب t نشان می دهد نمودار بقا نامیده می شود که همواره از عدد 1 شروع و به طرف صفر نزول می کند،منتها با شیب تند،بقای کوتاهتر و منحنی با شیب کمتر یا یکنواخت بقای طولانی تر را نشان میدهد.
میانگین معمولاً برای نشان دادن تمایل مرکزی توزیع ها استفاده می شود ولی در توزیع های بقا به خاطر چولگی ، میانه شاخص بهتری می بشپاشد و زمانی است که S(T0.5)=0.5 .میانگین توسط مساحت زیر منحنی بقا نشان داده می شود و چون اغلب منحنی های بقا چولگی مثبت دارند T0.5<0.5 .
معمولاًتوزیع T مانند یک متغیر تصادفی است که بوسیله ی تابع چگالی احتمال f(t) یا تابع توزیع تجمعی F(t) مشخص می شود. F(t)=lim (Pr (t Δ─>0 F(t)=Pr(T ≤ t)= ∫f(x)=1-S(t) تابع خطر تابع خطر، برآورد احتمال از دست رفتن به صورت تابعی از زمان است که این مقدار h(t) می تواند بیش از یک باشد واحتمال واقعی نیست. h(t)= lim (Pr(t Δ─>0 این تابع با تابع چگالی تفاوت دارد و به صورت کسر یک احتمال شرطی است.تابع خطر می تواند در طول زمان افزایشی، کاهشی یا ثابت باشد. توزیع های بقا زمان بقا نیز مانند هر متغیر تصادفی دیگری یک توزیع احتمال بوجود می آورد. این داده ها بنابر ویژگی های خاص خودشان یک سری نوزیع های خاص بوجود می آورند. توزیع نمایی این توزیع ساده ترین و در عین حال مهم ترین توزیع در مطالعات بقا است.این توزیع معلول توزیع نرمال در سایر حیطه های آماری است. S(t)= e-λ به ازای هر t ≥0 و h(t)=λ و λ تنها پارامتر و مقداری ثابت است. توزیع وایبل این توزیع تعمیم توزیع نمایی است، اما برخلاف توزیع نمایی، خطرثابت نیست. این توزیع دو پارامتر λ و Γ دارد که به ترتیب تعیین کننده مقیاس یا اندازه ی تابع خطر و تعیین کننده ی شکل منحنی تابع خطر خواهد بود. توزیع نمایی خواهد شد.h(t)=λ Γ(λt)Γ if λ =1 ─> روش های آماری آنالیز بقا هدف نهایی در آنالیز بقا بدست آوردن زمان بقا،توزیع بقا و در نهایت مقایسه ی توزیع های زمان بقا بین چند گروه می باشد.دو روش متداول برای آنالیز داده های بقا وجود دارد: 1:روش کاپلان_میر 2: روش آماری روش آماری این روش از کارهای مورد استفاده ی کارمندان آماری اداره های بیمه اتخاذ شده است که به محاسبه ی امید زندگی مراجعین خود اهمیت به سزا می دهند.در این روش داریم :qi=Di/(Ri-Li) افراد سانسور شده=Li احتمال وقوع پیشامد در طول دوره یi = qi تعداد افراد در معرض خطر= Ri تعداد وقوع پیشامد در دوره یi =Di و داریم:S(t)=Π(1-qi) روش حد حاصل ضرب کاپلان _میر این روش یک حالت خاص از جداول عمر است که در آن توالی های زمانی طوری شکل گرفته اند که تنها یک واقعه در هر توالی رخ دهد و این واقعه در ابتدای توالی می باشد.این روش برای تخمین حاصل ضرب مجموعه ای از احتمالات شرطی تخمین شده می باشد و احتمال بقا در زمان بیش از k به صورت زیر محاسبه می شود: P(t>k)=P1P2…Pkكه p1 يانگر احتمال بقاي افراد دردوره ي زماني (1-0)،p2 احتمال بقا در دورخ ي (2-1)به شرطي كه سال اول زنده بوده باشد و به همين ترتيب تا pk . اساس محاسبه ي ميزان بقا مشابه روش آماري است با اين تفاوت كه اساس تفاوت فاصله هاي زماني در روش كاپلان _مير بر اساس زمان وقوع پيشامد است.براي محاسبه ي بقا داريم: S(ti)=((ri-di)/ri)×S(ti) وقوع پيشامد در هر دوره ي زماني= di تعداد افراد باقي مانده در معرض خطر در زمان i = ri و اين محاسبه را زماني محاسبه مي كنيم كه واقعه ي جديدي رخ داده باشد. مقايسه ي داده هاي بقا براي مقايسه ي داده هاي بقا در چند گروه،چندين تست آماري وجود دارد كه مهمترين آن ها log_rank و تست Wilcoxon مي باشد. تست log_rank در واقع تستي مشابه كاي دو است كه از طريق محاسبه ي كاي دو،به بررسي زمان هاي بقا و آزمون فرض مي پردازد.فرضيه ي صفر،عدم وجود اختلاف بين چند گروه را نشان مي دهد. تست Wilcoxon نیز شباهت بسیاری به تست log_rank دارد،با این تفاوت که در این تست،وزنی متناسب با تعداد هفراد شرکت کننده در آن فاصله ی زمانی داده خواهد شد. n=2(z1-α/2+z1-β)2/(Ln σ)2 (نسبت)میزان خطر= σ حجم نمونه تحقیقی که به پشتوانه مطالب عنوان شده انجام شده،با عنوان میزان بررسی کارایی و بازدهی خودروهای شرکت سایپا و ایران خودرو مورد بررسی قرار گرفته است که هدف اصلی، سنجیدن نقاط قدرت و ضعف خودروهاست که در نهایت منجر به ارائه ی محصولی با شرایط مطلوب همراه با رضایت مشتری و افزایش سهم بازار و اثر بخشی محصولات گردد. جامعه ی آماری شامل 200 خودرو از محصولات دو شرکت در سطح شهرستان بهشهر می باشد که از طریق فرمول حجم نمونه در بالا محاسبه گردید.روش جمع آوری اطلاعات از طریق پرسشنامه بوده است.سوالات شامل متغیرهایی نظیر:نوع خودرو،نوع شرکت،زمان خرید،زمان اولین نقص بوده است.روش های آماری مورد استفاده شامل آزمون بقای کاپلان_میر و تست log_rank می باشد.زمان بقا،مدت زمان بین خرید خودرو تا بروز اولین نقص در خودرو می باشد.اهم نتایج به صورت زیر می باشد. 1.خرید خودرو در 6ماه اول سال بیشتر از 6ماه دوم است. 2.هفت دستگاه خودرو در همان روز خرید دچار نقص شده اند. 3.بین نوع شرکت سازنده و تعداد نقص رابطه ی معنی داری وجود دارد. 4. بین نوع خودرو و تعداد نقص رابطه ی معنی داری وجود دارد. 5. نقص ها در شرکت سایپا محسوس تر از ایران خودرو است. 6. مقایسه ی احتمال بقا در خودرو دو شرکت: در20 روزپس ازخرید S(t)=0.9084 (ایران خودرو) S(t)=0.2985 (سایپا) در 50 روز پس از خرید S(t)=0.7254 (ایران خودرو) S(t)=0.0936 (سایپا). 7. با استفاده از تست log_rank،فرضیه ی صفر برای مقایسه ی توزیع زمان بقا رد می شود و بنابراین بین توزیع زمان بقای محصولات شرکت سایپا و محصولات شرکت ایران خودرو اختلاف معنادار وجود دارد. 8. شرکت ایران خودرو بقای طولانی تری نسبت به شرکت سایپا دارد(به علت شیب منحنی های بقا). 9.میزان خطر در محصولات هر دو شرکت افزایشی،ودر شرکت سایپا در یک ماه اول پس از خرید 1.7 ودر شرکت ایران خودرو برابر با 0.03 بوده است. داده های بورسی(علی نوری)
پارامتر شاخص بدست آمده از جامعه آماری با استفاده از سرشماری است و شاخص بدست آمده از یک نمونه n تائی از جامعه آماره نامیده می شود. برای مثال میانگین جامعه یا µ یک پارامتر مهم جامعه است. چون میانگین جامعه همیشه در دسترس نیست به همین خاطر از میانگین نمونه یا 













