کشیدگی آماری (Kurtosis)

کشیدگی آماری (Kurtosis) در لغت به معنای قوس‌دار یا خمیده است، که اغلب ازنظر قله مرکزی توزیع، توضیح داده می‌شود. قله‌های بالاتر از آن، اوج بالاتر و قله های کوچک‌تر از قله مرکزی نشانگر اوج پایین‌تر در نظر گرفته می‌شوند. این معیار در واقع یک معیار توصیفی است که میزان قله‌ای بودن و مسطح بودن یک توزیع احتمالی را تعیین می‌کند.

نحوه محاسبه کشیدگی آماری:

برای متغیر \(x\) ، کشیدگی برابر است با:

در توزیع نرمال (Gaussian distribution) کشیدگی برابر 3 است.

منظور از گشتاور چهارم:

 

گشتاور چهارم و کشیدگی

بیایید از اولین گشتاور (moment) را بررسی کنیم تا به گشتاور چهارم برسیم:

گشتاور اول در توزیع آماری، میانگین یا امید ریاضی داده‌ها است. گشتاور دوم واریانس است. گشتاور سوم ایده‌ای از تقارن توزیع احتمال در اطراف میانگین می‌دهد. (به عبارتی دیگر میزان چولگی را نشان می‌دهد.)

گشتاور چهارم همان کشیدگی آماری است که در صدد یافتن میزان انحرافات از مقدار میانگین است. به عبارت دیگر دمهای یک توزیع چقدر سنگین هستند. اگر مقدار کشیدگی آماری بزرگ باشد، منحنی توزیع را برجسته می‌گویند. همچنین زمانی که منحنی توزیع دارای کشیدگی آماری کوچکتر باشد، منحنی را مسطح می‌نامند.

زمانی که میزان کشیدگی بزرگ باشد، احتمال مشاهده مقادیر پرت کم است، در حالی که کوچک بودن این شاخص، بیانگر احتمال بیشتر برای مشاهده داده‌ها پرت است.

انواع کشیدگی آماری:

همان‌طور که در تصویر می‌بینید سه نوع کشیدگی وجود دارد:

انواع کشیدگی آماری

Leptokurtic ( منحنی اوج_مقدار مثبت زیاد):

در این توزیع مقادیر بیشتری در دم و همچنین نزدیک به میانگین هستند. میزان Kurtosis بزرگ‌تر از صفر است و این به معنی دم‌های نازک‌تر است. (به‌عنوان‌مثال توزیع لاپلاس)

Mesokurtic (مقدار صفر):

توزیع‌هایی که از نظر عرضی متوسط و منحنی‌هایی که قله‌های آن دارای ارتفاع متوسط است.

در واقع توزیعی که میزان Kurtosis در آن برابر با صفر است به معنای باریک بودن دم‌ها نسبت به  توزیع‌های مشابه معمولی است.

Platykurtic (منحنی مسطح_مقدار منفی زیاد):

در این توزیع مقادیر کمتری در دم‌ها و همچنین نزدیک به میانگین وجود دارد (یعنی منحنی دارای اوج مسطح است و دارای نمرات پراکنده‌تر با دم‌های سبک‌تر). در این حالت میزان Kurtosis کوچک‌تر از صفر است که این به معنی دم‌های ضخیم‌تر یا انحراف شدیدتر از میانگین است. (به‌عنوان‌مثال توزیع یکنواخت)

مثال کاربردی:

ویروس Covid 19 مفاهیم جدید زیادی را برپا کرده است. یکی از آن مفاهیم در مورد “مسطح کردن منحنی (flattening the curve)” است، این کار به این امید صورت می‌گیرد که انجام آن باعث کاهش تعداد مراجعین به بیمارستان‌ها باشد.

 

هموارسازی منحنی و مفهوم کشیدگی آماری

در کشیدگی آماری، افزایش اندازه نمونه اغلب منحنی را فشرده و تنگ‌تر می‌کند، و این باعث می‌شود اوج بیشتری (قله بلندتری) در توزیع به وجود بیاید.

بنابراین با توجه به کشیدگی (kurtosis) بخشی از “مسطح کردن منحنی” در بحران کنونی به معنی پایین نگه‌داشتن تعداد موارد مبتلایان است.

 

1 نظر
  1. صدرا می گوید

    ممنون.مطلب مفیدی بود.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.