مقایسه دوگروه

شما یک متغیر را در دو گروه اندازه گیری کرده اید و میانگین ها (و میانه های) این دو متمایز می باشند. آیا این تفاوتها با توجه به شانس اتفاق افتاده است؟ یا به شما می گوید که دو گروه واقعا متفاوت هستند؟

آزمون t و آزمونهای غیر پارامتری مربوط به آن، دو مجموعه  از نمونه ها، اندازه گیری ها و متغیرهایی را که به صورت عددی جمع آوری شده و با استفاده از فاصله یا مقیاس نسبت بیان شده اند را با هم مقایسه می کنند. اگر در حال کار کردن با سه گروه و یا بیشتر هستید از آنالیز واریانس یکطرفه استفاده کنید.

وارد کردن داده های آزمون t

دو گروه داده ای که وارد می کنید باید توسط ستون ها تعریف شوند. امکان تعریف دو گروه با یک متغیر دسته بندی وجود ندارد. داده های یک گروه را در ستون A و گروه دیگر را در ستون B وارد کنید. می توانید داده هایتان را در چندین ستون وارد کنید و پس از انتخاب دکمه Analyze یک سری داده را سمت راست می بینید که دو به دو قابل مقایسه اند.

داده ها را می توانید به صورت میانگین، SD (و یا SEM) و N وارد کنید اما در این صورت فقط از آزمون t غیر زوجی می توانید بهره ببرید. همچنین نمی توانید داده های بسیاری را در یک جدول وارد کنید و چندین آزمون t را به صورت همزمان انجام دهید.

انتخاب آزمون t مناسب

آزمون t پنج نوع تست را برای مقایسه گروه داده ها معرفی می کند برای انتخاب تست مناسب به سه سوال باید پاسخ بدهید:

  1. آیا داده ها زوج هستند؟

زمانی تست زوجی را انتخاب کنید که داده های موجود در ستون ها با هم یکسان هستند. مثال:

  • یک متغیر را در بعد از یک معادله مجددا اندازه گیری می کنید.
  • گروه هایی به عنوان متغیر یا جفت مانند سن، گروه قومی و شدت بیماری. یکی از این جفت ها یک درمان گرفته و گروهی دیگری درمانی جایگزین.
  • برای چندین بار اجرای یک آزمایش آزمایشگاهی ، هر بار با یک کنترل و آماده سازی به موازات یکدیگر.
  • یک متغیر را در جفت های دوقلوها یا کودک / پدر و مادر اندازه گیری می کنید.

تطبیق باید با طراحی تجربی تعیین شود، اگر شما در حال مقایسه فشار خون در هر دو گروه هستید مجازید که برای مطابقت بر اساس سن و یا کد پستی از t زوجی استفاده کنید اما نه برای مطابقت بر اساس فشار خون.

  1. آیا داده ها غیر پارامتری هستند یا از یک توزیع گاوسی پیروی می کنند؟

در بسیاری از تست های زیست شناسی توزیع نرمال نیست اما درصورتیکه تعداد نمونه ها خیلی زیاد باشد و توزیع تقریبا نرمال باشد هم می توان از آزمون t برای مقایسه دو گروه بهره جست.

  1. آیا واریانس (انحراف معیار) دو گروه با هم برابر است؟

درصورتیکه دوگروه انحراف معیار یکسانی ندارند می توانید این طور فرض کنید و از تصحیح ولش استفاده کنید. آنالیزها در این صورت واریانس را یکسان در نظر نمی گیرند.

براساس پاسخ هایی که به این سوال ها می دهید می توانید یکی از انواع آزمون t را انتخاب کنید. جدول زیر خصوصیات هر نوع تست را نشان می دهد.

تست

زوجی

غیر پارامتری

تصحیح ولش

غیر زوجی

خیر

خیر

خیر

ولش

خیر

خیر

بله

زوجی

بله

خیر

کاربردی ندارد.

من-ویتنی

خیر

بله

کاربردی ندارد.

آزمون t غیر زوجی

الف. وارد کردن داده های خام

1.     جدول داده ها را ایجاد کرده و داده ها را وارد کنید.

از قسمت welcome (یا جدول و نمودار جدید)، تب ستون را انتخاب کنید، و سپس یک پلات پراکنده را با یک خط در وسط انتخاب کنید.

می توانید ابتدا از نمونه های آماده برنامه استفاده کنید (sample data).

داده های هر گروه را وارد کنید. دوگروه می توانند نمونه های مساوی نداشته باشند پس ایرادی ندارد اگر بعضی از خانه ها خالی بمانند.

2.     آزمون t غیرزوجی را انتخاب کنید.

در تولبار دکمه آنالیز () را انتخاب کنید. ار لیست ستون آنالیزها آزمون t و سپس آزمون t غیرزوجی را انتخاب کنید.

P value که در پنجره بالا انتخاب می کنید می تواند یک یا دوسویه باشد. یک سویه برای گروه هایی است که پیش از جمع آوری داده ها تخمین زده می شود میانگین بیشتری دارند. درصورتیکه در این مورد شک دارید حالت دوسویه را انتخاب کنید.

3.     نتایج را بررسی کنید.

آزمون t بررسی م یکند که آیا تفاوت میان میانگین های دوگروه تصادفی است یا خیر. بنابراین بهترین نتایج فاصله اطمینان %95 برای این تفاوتها و P value است.

ب. وارد کردن میانگین داده ها

1.     داده ها را وارد کنید.

از منوی welcome (یا جدول و نمودار جدید) تب Grouped را انتخاب کنید.

نمودار میله ای لایه ای را انتخاب کنید، داده ها را به صورت میانگین، انحراف معیار و N (یا به صورت میانگین​​، SEM و N) وارد کنید.

همه داده ها را در یک ردیف وارد کنید. ( آزمون t عموما برای جدول داده های ستونی انجام می شود اما پریسم به شما اجازه نمی دهد که جدول ستونی با زیر ستون ایجاد کنید. به جای آن می توانید یک جدول گروه بندی شده (Grouped) درست کرده و داده ها را در یک ردیف وارد کنید.)

2.     آزمون t غیر زوجی را انتخاب کنید.

3.     نتایج را برسی کنید.

این قسمت ها با وارد کردن داده های خام یکی است.

4.      نمودار را آرایش دهید.

  • مطمئن شوید که در شکل و یا بخش روش ها مشحص کرده اید که error bars نشان دهنده SD یا SEM هستند.
  • می توانید توضیحاتی نظیر معنی دار یا غیر معنی دار را از جدول روی نمودار کپی کنید.
  • برای درک بهتر نمودار، از محورهای لگاریتمی استفاده نکنید، شروع محور Y روی مقادیری  به غیر از صفر قرار ندهید و یک محور Y ناپیوسته نداشته باشید.

پ. تفسیر نتایج

فاصله اطمینان

آزمون t غیر زوجی میانگین دو گروه را مقایسه می کند که مفید ترین نتیجه آن فاصله اطمینان برای تفاوت های میان میانگین ها است. اگر مفروضات تجزیه و تحلیل درست باشد، شما می توانید 95٪ مطمئن باشید که 95٪ فاصله اطمینان تفاوت واقعی بین میانگین ها است. دلیل استفاده از آزمون آزمایش بررسی تفاوتهای دو میانگین بود. فاصله اطمینان به شما می گوید که تفاوت به دست آمده چقدر دقیق است.

برای بسیاری از اهداف، این فاصله اطمینان  همه آن چیزی است که شما به آن نیاز دارید.

P value

P Value برای این است که ببینیم آیا تفاوت بین میانگین دو گروه با توجه به شانس پیش آمده است یا خیر و به این سوال پاسخ می دهد که:

اگر دو جامعه میانگین واقعا یکسیانی داشته باشند، استفاده از نمونه گیری تصادفی تا چه حد در تفاوتهایی که در این آزمایش دیده می شود موثر است؟

به صورت سنتی از P value برای بررسی معنی دار بودن تفاوت میان دو میانگین استفاده می شد، اما ممکن است نیازی به آن نباشد و حتی کارایی نداشته باشد اما براساس کوچکی یا بزرگی مقدار P value نتایج قابل تفسیرند.