آزمون دقیق فیشر (Fisher’s Exact Test)

آزمون دقیق فیشر که استقلال فیشر نیز نامیده می‌شود، یک آزمون آماری کاربردی در حوزه‌های مختلف ازجمله یادگیری عمیق و یادگیری ماشین است. زمانی که به دنبال یافتن تفاوت بین دو متغیر اسمی هستیم، این آزمون کاربرد دارد. تست دقیق فیشر برای داده‌های کم استفاده می‌شود، اما نتایج آن برای هر تعداد نمونه‌ای معتبر است.

آزمون خی دو:

آزمون توزیع نرمال یا آزمون مربع خی (Chi-squared test) از آزمون‌های آماری است و برای ارزیابی میزان ارتباط متغیرهای اسمی نسبت به هم به‌کار می‌رود. مقدار خی-۲ طبق رابطه زیر محاسبه می‌شود:

\[
\chi^{2}=\sum_{t=1}^{m} \frac{\left(O_{t}-E_{t}\right)^{2}}{E_{t}}
\]

در فرمول بالا ( O = مقدار مشاهده‌شده (فراوانی هر داده) و E = فراوانی‌های مورد انتظار پس از محاسبه ) است.

نتیجه گیری از آزمون خی دو:

پس از محاسبه خروجی بالا و محاسبه مقدار درجه آزادی و بررسی مقادیر در جدول توزیع مربع خی دو می‌توان در مورد اینکه دو متغیر باهم ارتباط دارند یا خیر نتیجه‌گیری کرد.

آزمون مربع خی دو برای تعیین تفاوت‌ها میان چند موجودیت هم بکار می‌رود. یکی از اساسی‌ترین کاربردهای آن در علوم کامپیوتر به‌خصوص مبحث یادگیری ماشین و یادگیری عمیق است .

ارتباط آزمون خی دو و آزمون دقیق فیشر:

آزمون دقیق فیشر (Fisher’s exact test) یکی از آزمون‌های خانواده خی دو است که در بالا بیان شد،که به بررسی وجود ارتباط و یا مستقل بودن دو کمیت گروه‌بندی‌شده می‌پردازد.

نکته مهم: آزمون‌های خی 2 مبتنی بر روش‌های تقریبی هستند و آزمایش دقیق فیشر بر اساس روش‌های دقیق انجام می‌شوند.

نمونه آزمون دقیق فیشر:

به‌عنوان مثال، فرض کنید جامعه آماری ما شامل یک نمونه از نوجوانان است، که برخی از آنها تحصیل می‌کنند و برخی خیر. برای مثال فرض می‌کنیم که تعداد افراد محصل در بین زنان بیشتر از مردان است و می‌خواهیم آزمایش کنیم که آیا اختلاف نسبت‌هایی که مشاهده می‌کنیم، قابل توجیه است یا خیر. داده‌ها به‌صورت زیر می‌باشد:

 

\[
\begin{array}{|c|c|c|c|}
\hline & \text { Men } & \text { Women } & \text { Row total } \\
\hline \text { Studying } & 1 & 9 & 10 \\
\hline \text { Not-studying } & 11 & 3 & 14 \\
\hline \text { Column total } & 12 & 12 & 24 \\
\hline
\end{array}
\]

سؤالی که در مورد این داده‌ها ایجاد می‌شود:

۱۰ نفر از این ۲۴ نوجوان مشغول به تحصیل هستند و ۱۲ نفر از ۲۴ نفر آنها زن هستند. حال با فرضی مبنی بر یکسان بودن تعداد زن و مردهایی که محصل هستند، آیا این احتمال وجود دارد که این ۱۰ نوجوان که تحصیل می‌کنند، دارای توزیع یکنواختی بین زنان و مردان باشند؟

(منظور از توزیع یکنواخت این است که از این ۱۰ نفر، ۵ نفر زن هستن و ۵ نفر مرد.)

برای محاسبه این احتمال از فرمول زیر استفاده می‌کنیم:

\[
\begin{array}{|c|c|c|c|}
\hline & \text { Men } & \text { Women } & \text { Row Total } \\
\hline \text { Studying } & a & b & a+b \\
\hline \text { Non-studying } & c & d & c+d \\
\hline \text { Column Total } & a+c & b+d & a+b+c+d(=n) \\
\hline
\end{array}
\]

 

\[
p=\frac{\left(\begin{array}{c}
a+b \\
a
\end{array}\right)\left(\begin{array}{c}
c+d \\
c
\end{array}\right)}{\left(\begin{array}{c}
n \\
a+c
\end{array}\right)}=\frac{\left(\begin{array}{c}
a+b \\
b
\end{array}\right)\left(\begin{array}{c}
c+d \\
d
\end{array}\right)}{\left(\begin{array}{c}
n \\
b+d
\end{array}\right)}=\frac{(a+b) !(c+d) !(a+c) !(b+d) !}{a ! b ! c ! d ! n !}
\]

 

حال با جایگذاری در فرمول بالا داریم:

\[
p=\left(\begin{array}{c}
10 \\
1
\end{array}\right)\left(\begin{array}{c}
14 \\
11
\end{array}\right) /\left(\begin{array}{c}
24 \\
12
\end{array}\right)=\frac{10 ! 14 ! 12 ! 12 !}{1 ! 9 ! 11 ! 3 ! 24 !} \approx 0.001346076
\]

با احتمال ۰٫۰۰۱۳، این ۱۰ نوجوان که تحصیل می‌کنند، به‌طور یکنواخت بین زنان و مردان توزیع می‌شوند. چون مقدار کوچکی است پس نشان می‌دهد این فرضیه نامعتبر است.

به‌طورکلی آزمون دقیق فیشر نشان داد که برای بررسی یک سطح، ما فقط باید مواردی را در نظر بگیریم که جمع حاشیه‌ای همان سطح است، همان‌طور که در بالا مشاهده می‌کنید. (به‌طور مثال: انتخاب a از a+b در ترکیب بالا نشان می‌دهد، که این انتخاب فقط از سطر اول جدول انجام شده است.)

مثال کاربردی:

در مقاله‌ای در حوزه رادیولوژی و پردازش تصاویر پزشکی (لینک مقاله) از آزمون دقیق فیشر استفاده شده است. که در زیر به نحوه کاربرد آن می‌پردازیم.

از ۱۱۰ بیمار از ۵ موسسه با گلیومای درجه پایین از اطلس (گالری تصاویر)، تصویربرداری قبل از عمل و داده‌های ژنومی استفاده کردیم. بر اساس تقسیم‌بندی یادگیری عمیق اتوماتیک، ما سه ویژگی استخراج کردیم که ویژگی‌های دو بعدی و سه بعدی تومورها را تعیین می‌کنند.

داده‌های ژنومی برای گروه مورد تجزیه و تحلیل بیماران شامل خوشه‌های ژنومی قبلاً شناسایی شده بر اساس جهش IDH و حذف 1p / 19q، حذف DNA، بیان ژن، تعداد نسخه‌های DNA و بیان ریز RNA هستند.

برای تجزیه‌وتحلیل رابطه بین ویژگی‌های تصویربرداری شده و خوشه‌های ژنومی (که دو متغیر اسمی هستند)، تست دقیق فیشر را برای ۱۰ فرضیه‌ی مطرح در این حوزه انجام داده و روابط بین آنها را مورد بررسی قرار دادند.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.