باسمه تعالي
Simple Analysis of Variance

فصل 11 از کتاب Statistical Methods for Psychology

(صفحات 332 – 317)

ترجمه از: محمد ناصری

دانشجوی کارشناسی ارشد روانشناسی تربیتی

اهداف

معرفی آنالیز واریانس به عنوان روشی برای آزمودن تفاوت‌های بین دو یا چند میانگین

فهرست مطالب

عنوان صفحه

11.1 یک مثال.. 1
11.2 مدل زیربنایی.. 3
مدل بنیادی... 4
فرضیه.. 5
همگنی واریانس...... 5
حالت به هنجار.. 6
استقلال مشاهدات.... 6
فرضیۀ صفر... 6
11.3 منطق آنالیز واریانس..... 7
برآورد واریانس...... 9
11.4 محاسبات در آنالیز واریانس..... 10
مجموع مجذورات.... 10
اطلاعات.... 10
جدول خلاصه.. 14
نتایج... 18
11.5 نوشتن نتایج.. 19
11.6 راه حل‌های کامپیوتری.. 20

آنالیز واریانس (آنوا) مدت زمان زیادی است که بیشترین استفاده (عده‌ای می‌گویند سوء استفاده) را در میان تکنیک‌های آماری در تحقیقات روانشناسی داشته است. اعتبار و استفاده از این تکنیک می‌تواند به دو منبع نسبت داده شود. اول اینکه، آنالیز واریانس مثل آزمون “t” به تفاوت‌های بین دو یا چند میانگین‌ها تحمیل نمی‌کند. به جای اینکه ما سؤال کنیم که آیا 2 میانگین تفاوت دارند ما می‌توانیم سؤال کنیم که آیا سه، چهار، پنج یا K میانگین تفاوت دارند. آنالیز واریانس همچنین به ما اجازه می‌دهد که به دو یا چند متغیر مستقل به طور همزمان بپردازیم که نه تنها می‌توان اثرات هر متغیّر را به صورت جدا بررسی کرد، بلکه می‌توان تعامل اثر آن متغیرها را بررسی کرد.

این فصل بر منطق زیربنایی آنالیز واریانس و تجزیه و تحلیل نتایج آزمایشات با به کارگیری فقط یک متغیر مستقل متمرکز خواهد شد. ما همچنین به بررسی تعدادی از عناوین مرتبط با آنالیز واریانس یکراهه (تک متغیری) که آسانتر فهمیده می‌شوند، بپردازیم. فصل‌های بعدی با تجزیه و تحلیل آزمایشاتی که دارای دو یا چند متغیر مستقل هستند و با طرح‌هایی که اندازه‌گیری‌های مکرّر را روی هر آزمودنی انجام می‌دهند، به مقایسه بین میانگین‌های نمونه‌ای خاص می‌پردازد.

11.1 یک مثال

تعداد زیادی از ویژگی‌های آنالیز واریانس می‌تواند به وسیلۀ یک مثال ساده بهتر نشان داده شود. بنابراین ما کار را با مطالعه‌ای که توسط آیزنک (1974) در مورد یادآوری مواد کلامی که به عنوان تابعی از سطوح پردازش است، شروع خواهیم کرد. اطلاعاتی که ما استفاده می‌کنیم دارای میانگین‌های گروهی و انحراف استانداردهای یکسانی هستند که توسط آیزنک گزارش شدند؛ اما مشاهدات شخصی، غیرواقعی هستند. این مطالعه ممکن است مطالعه‌ای قدیمی باشد، اما هنوز مطالب مهمی برای گفتن به ما دارد و هنوز هم به طور گسترده‌ای به آن استناد می‌شود.

کریک و لاکهارت (1972) مدلی از حافظه را پیشنهاد کردند که در آن مقدار مواد کلامی که توسط آرمودنی به یادآورده می‌شود، تابع سطح پردازشی است که در ابتدا روی مواد ارائه شده صورت گرفته است. بنابراین برای مثال، اگر شما تلاش کنید که لیستی از کلمات را به خاطر بسپارید، با تکرار کردن یک کلمه برای خودتان (یک سطح پایین پردازش) به یادآوری خوبی منتهی نخواهید شد. در حالی که فکر کردن در مورد یک کلمه و تلاش برای شکل‌دهی ارتباطی بین آن کلمه و چند کلمه دیگر نتایج بهتری خواهد داشت. آیزنک (1974) علاقمند به آرفون کردن این مدل بود و مهمتر از آن در جستجوی این بود که آیا این مدل می‌تواند تفاوت‌های گزارش شده بین آزمودنی‌های جوان و پیر را در توانایی‌شان برای یادآوری مواد کلامی توضیح دهد. بررسی اطلاعات آیزنک روی تفاوت‌های سنی تا فصل 13 به تعویق افتاده است و ما در اینجا روی تفاوت‌هایی که به علت سطح پردازش ایجاد می‌شود، تمرکز خواهیم کرد. آیزنک به صورت تصادفی 50 آزمودنی بین سنین 55 تا 65 ساله را به یکی از 5 گروه- 5 گروه یادگیری اتفاقی و یک گروه یادگیری با طراحی قبلی- اختصاص داد. (یادگیری اتفاقی نوعی از یادگیری است که در آن، این انتظار وجود ندارد که مواد و مطالب نیاز دارد که بعداً یادآوری شوند)، از گروه شمارش خواسته شد تا لیستی از کلمات را بخواند و به سادگی تعداد حرف‌های هر کلمه را بشمارد. این گروه درگیر پایین‌ترین سطح پردازش شد، زیرا آزمودنی‌ها نیاز نداشتند تا به هر کلمه چیزی بیشتر از مجموعه‌ای از حروف بپردازند. از گروه منظوم خواسته شد تا هر کلمه را بخواند و در مورد وزن و نظم هر کلمه فکر کند. این کار مستلزم بررسی صدای هر کلمه بود، اما نیاز به بررسی معنی کلمه نداشت. گروه صفت باید کلمات را تا حدی پردازش می‌کرد تا صفتی را که از نظر منطقی می‌توانست هر کلمه لیست را تغییر دهد، ارائه دهد. به گروه تصویرسازی ذهنی آموزش داده شد تا تلاش کنند و تصویرهای واضحی از هر کلمه را شکل دهند. این گروه به نظر می‌رسد که نیاز به عمیق‌ترین سطح پردازش بین چهار گروه اتفاقی داشته باشد. به هیچ یک از این گروههای چهارگانه گفته نشده بود که از آنها بعداً خواسته می‌شود تا موارد خوانده شده را به یاد آورند. در نهایت به گروه یادگیری با طراحی قبلی گفته شده بود تا لیستی از کلمات را بخواند و آنها را برای یادآوری بعدی به خاطر بسپارد. بعد از اینکه آزمودنی‌ها یک لیست 27 موردی را 3 بار خواندند، به آنها یک برگه کاغذ داده شد تا روی آن کلماتی را که می‌توانستند به یاد آورند، بنویسند.

اگر یادگیری چیزی بیشتر از موادی که در معرض آن قرار گرفته بودند، شامل نشود (روشی که بیشتر ما یک روزنامه را می‌خوانیم، یا خدای نکرده یک تکلیف کلاسی را انجام می‌دهیم)، پنج گروه باید یادآوری مساوی را نشان دهند- بعد آنها، همه آنها کلمات را می‌دیدند. اگر سطح پردازش مطالب مهم باشد، تفاوت‌های قابل توجهی بین میانگین‌های گروهها دیده می‌شود. اطلاعات در جدول 1-11 ارائه شده است.

جدول 1-11: تعداد کلمات یادآوری شده به عنوان عملکردی از سطح پردازش

جمع کل طراحی عمدی تصویرسازی صفت منظوم شمارش
10 12 11 7 9
19 11 13 9 8
14 16 8 6 6
5 11 6 6 8
10 9 14 6 10
11 23 11 11 4
14 12 13 6 6
15 10 13 3 5
11 19 10 8 7
11 11 11 7 7
06/10 00/12 40/13 00/11 90/6 00/7 میانگین
01/4 74/3 50/4 49/2 13/2 83/1 انحراف معیار
058/16 00/14 27/20 22/6 54/4 33/3 واریانس

11.2 مدل زیربنایی

آنالیز واریانس مثل همه پروسه‌های آماری بر اساس یک مدل زیربنایی تشکیل شده است. من قصد ندارم تا این مدل را بشکافم و همه شاخه‌هایش را مورد بحث قرار دهد؛ اما درک عمومی و کلی این مدل به منظور درک آنچه که آنالیز واریانس در موردش صحبت می‌کند و نیز درک مدل‌های پیچیده‌تری که در فصل‌های بعدی خواهد آمد، مهم است.

برای شروع با یک مثال که به جنبۀ جسمی برمی‌گردد، تصوّر کنید که میانگین قد همه بزرگسالان آمریکایی 57 اینچ می‌باشد و مردان بزرگسال در حدود 2 اینچ بلندتر از بزرگسالان به طور کلی هستند. حال با کمی فرض بیشتر تصوّر کنید که شما یک مرد بزرگسال هستید. حال می‌توان قد شما را به 3 مؤلفه تقسیم کرد و بررسی کرد؛ یکی از آنها میانگین قد همۀ بزرگسالان آمریکایی است؛ یکی دیگر به علت جنسیّت شماست؛ و سوّمین مؤلفه شرایط منحصر به فرد و خاص شماست. بنابراین من می‌توانم تعیین کنم که قد شما 57 اینچ به اضافه 2 اینچ به علت مذکر بودن شماست؛ بیشتر یا کمتر از 2 اینچ برای محاسبه این واقعیت که تغییر در قد مردان وجود دارد. (ما می‌توانستیم این مدل را با تأثیر تفاوت ملیت‌ها در متفاوت بودن قد پیچیده‌تر کنیم؛ اما ما آن را اینجا انجام نخواهیم داد). ما می‌توانیم این مدل را به صورت زیر بنویسیم:

ویژگی‌های انحصاری شخص+ =قد

در اینجا ویژگی‌های انحصاری شخص نشان دهندۀ انحراف از میانگین برای مردان است. راه دیگر برای نوشتن این مدل به صورت زیر است:

ویژگی‌های منحصر به فرد+ مؤلفه جنسیتی+ میانگین اصلی= قد

اگر ما بخواهیم اظهارات بالا را با اصطلاحات کلی‌تری نشان دهیم، ما می‌توانیم علامت اختصاری μ را برای میانگین قد جمعیت همه بزرگسالان آمریکایی به کار ببریم؛ Tmale را به عنوان مؤلفه اضافی به علت مذکر بودن به کار ببریم ، εyou را برای ویژگی و فعالیت‌های منحصر به فردتان در مدل به کار ببریم. در این صورت مدل به صورت زیر می‌شود:

حال اجازه دهید از مدل جسمی‌مان در مورد قد به سمت مدلی برویم که به صورت مستقیم‌تری زیربنای مثالمان را تشکیل دهد. ما به این مدل در آزمایش آیزنک از اصطلاح یادآوری مواد کلامی استفاده می‌کنیم. در اینجا Xij نشان دهندۀ نمره قد شخص i در شرایط j است. (به عنوان مثال X32 نشان دهندۀ سومین شخص در گروه منظوم است، ما علامت μ را به عنوان نمایندۀ میانگین همه آزمودنی‌هایی که می‌توانستند به لحاظ نظری در آزمایش آیزنک بدون توجه به شرایط شرکت کنند، به کار می‌بریم. علامت Mj نمایندۀ میانگین جمعیت گروه j است (به عنوان مثال M2 میانگین گروه منظوم است)، و Tj میزان انحراف میانگین گروه j از میانگین اصلی است . در نهایت و مقداری است که شخص i در گروه j از میانگین گروهش انحراف پیدا می‌کند . تصوّر کنید که شما یک آزمودنی در مطالعۀ حافظه آیزنک می‌باشید که توصیف شد. ما می‌توانیم نمرۀ حافظۀ شما را به عنوان تابعی از اجزاء تعیین کنیم.

مدل بنیادی

این مدل بنیادی است که زیربنای آنالیزواریانس را تشکیل می‌دهد. در فصل‌های آینده ما این مدل را به موقعیت‌های پیچیده‌تری گسترش خواهیم داد؛ اما ایدۀ اصلی مدل همچنان یکسان خواهد ماند. البته ما ارزش مشخصه‌های گوناگون در این مدل را نمی‌دانیم، اما این مطلب باعث نمی‌شود که این مدل را ثابت و مسلّم فرض کنیم.

فرضیه

همانطور که ما می‌دانیم، آیزنک علاقمند بود یادآوری مطالب تحت پنج حالت را مورد مطالعه قرار دهد. ما می‌توانیم این حالت را در تصویر 11.1 نشان دهیم و جایی که jμ و نشان دهندۀ میانگین و واریانس کسب شده از کلیۀ افرادی است که تحت این حالت‌ها مطالعه شدند. آنالیز واریانس بر پایۀ این فرضیۀ قطعی در مورد این جمعیت‌ها و ویژگی‌هایشان است. در تصویر فوق حقیقت این است که توزیعی که در قسمت راست توزیع دیگر قرار دارد، در مورد اینکه آیا میانگین توزیع از دیگران متفاوت است یا خیر، چیزی نمی‌گویند.

همگنی واریانس

یک فرض اساسی زیربنایی در آنالیز واریانس این است که هر کدام از گروهها واریانس مشابهی دارد. به عبارت دیگر:

در اینجا علامت برای دلالت بر مقدار معمول واریانس‌های پنج گروه استفاده می‌شود. این فرضیه، فرضیۀ همگنی واریانس نامیده می‌شود.
زیرنویس “e” مخفّف error (اشتباه) می‌باشد و این واریانس، واریانس اشتباه است- واریانس غیرمرتبط با همۀ تفاوت‌های اعمال شده که نشان دهندۀ تغییرپذیری مقدارها بین گروههای یکسان است. همگنی واریانس انتظار می‌رود زمانی اتفاق بیفتد که اثر هر اعمال روشی، یکنواختی خاصی را به امتیاز و نمرۀ هر فرد اضافه می‌کند. اگر به عنوان مثال، هر کدام از افراد گروه صفات در مطالعه آیزنک بیشتر از 5 کلمه را یادآوری کنند از کلماتی که آنها یادآوری کرده بودند.


تصویر 11.1: نمایش تصویری گروهی از امتیازهای یادآوری

همانطور که بعداً می‌بینیم، تحت شرایط خاصی فرضیۀ همگنی واریانس می‌تواند بدون اینکه ضربۀ زیادی به آزمون وارد کند، به دست آید؛ گرچه ممکن است نتیجه را تغییر دهد. با این وجود، موادی نیز وجود دارند که همگنی واریانس به صورت یک مشکل درمی‌آید. (گروههایی که واریانس‌های متفاوتی دارند.)

حالت به هنجار

یک فرضیۀ دوم در آنالیز واریانس این است که نمره‌های یادآوری برای هر گروه به صورت هنجار در اطراف میانگین توزیع شدند. به عبارت دیگر هر کدام از توزیع‌ها در شکل 11.1 نرمال است. از آنجایی که eij نشان دهندۀ تغییرپذیری نمرۀ هر شخص در اطراف میانگین هر گروه است. فرضیۀ ما می‌گوید که اعداد به صورت هنجار در گروهها توزیع شدند. بنابراین شما اغلب این فرضیه را می‌بینید که با اصطلاح «توزیع به هنجار اشتباه» بیان شده است. کشفیات عادی از به هنجار سازی معمولاً مهلک نیستند. ما در اینجا مطالب یکسانی را هنگام نگاه به آزمون t برای دو نمونه مستقل گفتیم که واقعاً موردی خاص از آنالیز واریانس است.

استقلال مشاهدات

فرضیۀ سوّم این است که در آنالیز واریانس مشاهدات مستقل از یکدیگر هستند (از نظر فنی این فرضیه در حقیقت می‌گوید که اجزاء اشتباه [eij] مستقل هستند؛ اما آن با چیزهای یکسان در اینجا برابر هستند). بنابراین برای هر دو مشاهده با یک متغیّر آزمایشی ما فرض می‌کنیم که دانستن اینکه چطور یکی از این مشاهدات در ارتباط با متغیر آزمایشی قرار می‌گیرد، به ما در مورد مشاهده و آزمایش دیگر اطلاعاتی نمی‌دهد. این یکی از دلایل مهمی است که چرا آزمودنی‌ها به طور تصادفی به گروهها اختصاص می‌یابند. تخلّف از فرضیۀ استقلال آزمایشات می‌تواند عواقب بعدی برای هر آنالیز واریانس داشته باشد.

فرضیۀ صفر

همانطور که ما می‌دانیم، آیزنک علاقمند به مطالعه و تحقیق روی فرضیۀ تناسب سطح تغییرات یادآوری با سطح پردازش بود. حمایت از این فرضیه از عدم پذیرش فرضیۀ استاندارد صفر ناشی می‌شود.

فرضیۀ صفر می‌توادن در بعضی موارد اشتباه باشد (مثلاً همۀ میانگین‌ها می‌توانستند از یکدیگر متفاوت باشند، یا میانگین اوّل و دوّم می‌توانستند با یکدیگر مساوی؛ اما با سوّمی متفاوت باشند و ...). اما حالا ما می‌خواهیم فقط روی این مسأله تمرکز کنیم که آیا فرضیۀ صفر کاملاً صحیح یا اشتباه است. در فصل 12 ما به این مشکل می‌پردازیم که آیا زیرمجموعه‌های میانگین‌ها مساوی یا نامساوی هستند.

11.3 منطق آنالیز واریانس

منطق زیربنایی آنالیز واریانس واقعاً خیلی ساده است و اگر شما یک بار آن را بفهمید، بقیه بحث را با درایت بیشتری بررسی خواهید کرد. برای یک لحظه اثر سه فرضیۀ اصلی‌مان را در نظر بگیرید- هنجار بودن و نرمال بودن، همگنی واریانس‌ها و استقلال آزمایشات- در ابتدا با توجه به دو تا از فرضیات ما گفتیم که پنج توزیع نشان داده شده در شکل 11.1 شکل و پراکندگی یکسانی دارند. در نتیجه تنها راهی که باعث متفاوت بودنشان می‌شود در میانگین‌شان است (به یاد آورید که توزیع نرمال وابسته است فقط به دو پارامتر μ و σ). ما هیچ فرضیه‌ای را با تمرکز روی فرضیۀ صفر Ho شروع نخواهیم کرد، زیرا آن ممکن است درست یا اشتباه باشد. برای فقط یک متغیر آزمایشی، واریانس 10 نمره در آن گروه برآوردی از واریانس گروههایی خواهد بود که نمره‌هایشان ترسیم شده بود: به این خاطر که ما فرض می‌کنیم که همۀ گروهها دارای واریانس یکسان هستند. آن همچنین یک برآوردی از واریانس گروه مشترک است ( ) . اگر شما به ترجیح فرمول‌ها بپردازید، شما می‌توانید فکر کنید:

در اینجا خوانده می‌شود به عنوان «تخمین زده شده است با». به خاطر فرضیۀ همگنی واریانس‌ها، همۀ این برآوردها، برآوردی از هستند. به منظور افزایش اعتبار، ما می‌توانیم همۀ این پنج برآورد را با تفکر در مورد میانگین‌هایشان یک ماسه می‌کنیم.

اگر n1=n2=…=n5 بنابراین:

در اینجا K برابر است با تعداد متغیرهای آزمایشی (در این مورد 5 تا). این به ما برآوردی از واریانس گروهی که بعداً به عنوان MSerror یا گاهی اوقات MSwithin نامیده می‌شود، می‌دهد (خوانده می‌شود اشتباه میدانی میانگین). مهم است که اینجا ذکر کنیم که این برآورد وابسته به درستی یا غلطی فرضیۀ صفر نیست، به خاطر اینکه برای هر نمونه به صورت جدا محاسبه شده است. در ارتباط با اطلاعات حاصله از مطالعۀ آیزنک، برآورد ما از به صورت زیر خواهد بود:

حالا اجازه دهید به ما که فرض کنیم فرضیۀ صفر درست است. اگر این موضوع رخ دهد، 5 نمونۀ 10 موردی‌مان می‌تواند به عنوان 5 نمونۀ مستقل هنوز شود که این 5 نمونه مستقل از یک گروه یکسان هستند (یا به طور معادل از 5 گروه یکسان) و ما می‌توانیم برآورد ممکن دیگری را از تولید کنیم. به یاد آورید که در فصل 7 گفته شد، قضیۀ حد مرکزی بیان می‌کند که واریانس میانگین‌های ترسیم شده از یک گروه یکسان برابر است با واریانس گروهها تقسیم بر اندازۀ نمونه. اگر فرضیۀ صفر درست باشد، میانگین‌های نمونه از گروه یکسانی ترسیم شده بود و بنابراین واریانس میانگین‌های 5 نمونه‌مان به صورت برآورد می‌شود.

در اینجا n اندازۀ هر نمونه است. بنابراین ما می‌توانیم دستورالعمل معمول مسأله را وارونه کنیم و واریانس میانگین‌های نمونه‌مان را محاسبه کنیم تا دوّمین برآورد را به دست آوریم.

این اصطلاح به عنوان MStreatment ارجاع داده می‌شود که اغلب به صورت خلاصه MStreat گفته می‌شود؛ ما آن را می‌چرخانیم تا به صورت کوتاه درآید. ما حال 2 برآورد از واریانس گروهی می‌دانیم. یکی از این برآوردها (MSerror) از درستی یا غلطی Ho مستقل است. دیگری (MStreatment) برآوردی از است به شرط آنکه Ho درست باشد (فقط به این شرط که گروههای قضیه حد مرکزی به هم بپیوندند. به عبارت دیگر میانگین‌ها از یک گروه یا چندین گروه یکسان هستند). بنابراین اگر ما دو برآورد را قبول کنیم، از درستی Ho حمایت خواهیم کرد و اگر با آنها موافق نباشیم، از غلط بودن Ho حمایت خواهیم کرد. با توجه به بحث بالا می‌توانیم به دقت منطق آنالیز واریانس را بیان کنیم. برای ارزیابی Ho ما 2 برآورد از واریانس گروهی را محاسبه می‌کنیم؛ یکی از آنها مستقل از درستی یا غلط بودن Ho است و دیگری وابسته به Ho است. اگر دو برآورد را قبول کنیم، ما هیچ دلیلی برای رد Ho نداریم. اگر به قدر کافی فرضیۀ Ho را رد کنیم، ما نتیجه می‌گیریم که تفاوت‌های متغیر آزمایشی می‌تواند در کسب دومین برآوردمان مشارکت کند و باعث افزایش و متفاوت بودن برآورد دوّم از اول شود. بنابراین ما Ho را رد می‌کنیم.

برآورد واریانس

در اینجا ممکن است مفید باشد تا بدون دلیل، مقادیری که ما واقعاً در حال تخمین زدن هستند، بیان کنیم. ما در ابتدا اثر متغیّر آزمایشی را تعریف خواهیم کرد که دلالت بر jτ می‌کند. و عنوان . به تفاوت‌های بین میانگین متغیر آزمایشی (μj)j و میانگین اصلی (μ) اشاره می‌کند و ما را به عنوان تغییرپذیری میانگین گروهها تعریف خواهیم کرد. (μ12,…,μ5)

در صورتی که کمی بیشتر مطالب را بیان کنیم، به یاد آورید که ما مقدار مورد انتظار برای هر متغیّر آماری (می‌نویسیم E()) را به عنوان دامنۀ متوسطش- یعنی مقدار معمولی که آن متغیر اماری در نمونه‌ها تکرار می‌شود، تعریف کردیم و بنابراین بهترین حدس ما دربارۀ مقدارش در هر آزمون خاص است. با این دو مفهوم ما می‌توانیم مطالب زیر را بیان کنیم:

در اینجا نشان دهندۀ واریانس بین هر گروه و نشان دهندۀ تغییرپذیری میانگین‌های گروه است. (μj)
حالا اگر Ho درست باشد و بنابراین میانگین‌های گروه تفاوت نخواهد کرد و و و بنابراین E(MSerror)=E(MStreat) خواهد بود.
در ذهنتان نگهدارید که اینها مقادیر مورد انتظار هستند؛ و به ندرت در تمارین 2 میانگین بر پایه نمونه به لحاظ مقداری با هم مساوی می‌شوند.
اگر Ho اشتباه باشد، با این وجود صفر نخواهد بود؛ اما مقداری مثبت خواهد شد. در این مورد E(MSerror)<E(MStreat)
به این خاطر که MStreat شامل عددی غیرصفر خواهد بود، نشان دهندۀ تفاوت‌های درست بین μj است.

11.4 محاسبات در آنالیز واریانس

برای پرداختن به این مطلب ما از مثالی از آیزنک استفاده خواهیم کرد تا محاسبات استفاده شده در آنالیز واریانس را شرح دهیم. درست است که ممکن است شما فکر کنید همیشه از یک نرم‌افزار کامپیوتر برای انجام آنالیز واریانس استفاده می‌کنید؛ اما مهم است که بفهمید که محاسبات انجام شده توسط یک ماشین حساب چگونه انجام می‌شود. در ابتدا فهمیدن روش پایه‌ای به شما کمک می‌کند، به عنوان یک مطلب اضافه ابتدا آسان‌تر است تا آنالیزهای جایگزین و بحث‌انگیز را بفهمید. در نهایت برنامۀ کامپیوتر هر چیزی را که شما بخواهید تا انجام دهد، انجام نمی‌دهد و شما باید گاهی اوقات خودتان مستقیماً محاسبات را انجام دهید. بنابراین در انجام محاسبات با ما تحمل کنید، حتی اگر شما فکر می‌کنیم که ما در حال تلف کردن وقت هستیم.

مجموع مجذورات

در آنالیز واریانس بیشتر محاسبات ما به مجموع مجذورات می‌پردازد. همانطور که در فصل 9 دیدیم، یک مجموع مجذورات صرفاً جمع انحرافات مجذور شده حول و حوش میانگین می‌باشد یا اغلب چندین مضرب آن است. هنگامی که ما اولین بار واریانس نمونه را تعریف کردیم، دیدیم که در اینجا صورت کسر مجموع مجذورات X است و مخرج کسر درجۀ آزادی است.

اطلاعات

اطلاعاتی که دوباره در جدول 11.2 تولید شده‌اند در طول اطلاعات طرح شده در شکل 11.2 و محاسبات جدول 11.3 هستند. ما روی محاسبات بحث خواهیم کرد و به نتایج جزئی نیز خواهیم رسید.

جدول 2-11: اطلاعات برای مثال از آیزنک (1974)

جمع کل طراحی عمدی تصویرسازی صفت منظوم شمارش
10 12 11 7 9
15 17 13 9 8
14 16 8 6 6
5 11 6 6 8
10 9 14 6 10
11 23 11 11 4
14 12 13 6 6
15 10 13 3 5
11 19 10 8 7
11 11 11 7 7
06/10 00/12 40/13 00/11 90/6 00/7 میانگین
01/4 74/3 50/4 49/2 13/2 83/1 انحراف معیار
058/16 00/14 27/20 22/6 54/4 33/3 واریانس


























شکل 11.2: مجموعه‌ای از اطلاعات آیزنک در مورد یادآوری به عنوان یک عملکرد


جدول 11.3: محاسبۀ اطلاعات جدول 11.2




جدول خلاصه



به این خاطر که اطلاعات فعلی ساختگی هستند (اگر چه میانگین‌ها و واریانس‌ها ساختگی نیستند). احتمال آن کم است تا با بررسی توزیع مشاهدات روی گروههای خاص کسب شود- این اطلاعات به طور واقعی مربوط به گروهی با توزیع نرمال بودند. حتی با اطلاعات واقعی هم این مطلب مهم است تا بررسی کنیم که این توزیع‌ها ما را مطمئن سازند که آنها نادرست نبوده و مهمتر اینکه به روش‌های مختلفی دستکاری نشده‌اند. حتی در این مثال مفید است تا واریانس گروه خاصی را به عنوان تطابق با فرضیۀ همگنی واریانس‌ها مورد بررسی قرار دهیم. هر چند واریانس‌ها آن طور که ما دوست داریم ممکن است مشابه نباشند (واریانس گروه تصویرسازی به طور چشمگیری بیشتر از بقیه است). اما آنها به نظر نمی‌رسند که به طور چشمگیری متفاوت باشند که باعث ارتباط خاصی شوند. همان طور که ما بعداً خواهیم دید، آنالیز واریانس به طور جدی در مقابل تخلّف از فرضیات گفته شده قرار دارد؛ خصوصاً وقتی که ما تعداد یکسانی از مشاهدات را در هر گروه داریم.

جدول 11.3 محاسبات نیازمند به اجرای یک آنالیز واریانس یک راهه را نشان می‌دهد. این محاسبات نیازمند کمی بسط و تفسیر هستند.

SStotal (بخوانید مجموع مجذورات کلی) نشان دهندۀ مجموع مجذورات همۀ مشاهدات بدون توجه به این است که کدام یک از متغیرهای آزمایشی آنها را تولید کرده است. هم نشان دهندۀ میانگین اصلی است. فرمول تعریف شده به صورت روبه‌رو است:

این اصطلاحی است که ما در اوایل و کمی قبل، هنگامی که ما در حال محاسبۀ واریانس مجموعه‌ای از نمرات بودیم، دیده بودیم و صورت کسر برای واریانس است (مخرج کسر، درجۀ آزادی بود). این فرمول مثل فرمول‌هایی که در ادامه می‌آید، احتمالاٌ فرمولی نیست که ما آن را هنگام محاسبات دستی برای رفع مشکل استفاده کنیم. فرمول‌ها خیلی نسبت به اشتباهاتی که در حول و حوش آنها رخ می‌دهد، آسیب‌پذیر هستند. با این وجود آنها کاملاً فرمول‌های صحیحی هستند و نشان دهندۀ روشی هستند که ما به طور طبیعی در مورد آنالیز فکر می‌کنیم. برای افرادی که فرمول‌های دارای محاسبات دستی را ترجیح می‌دهند، آن را می‌توانند در ویرایش‌های قبلی این کتاب پیدا کنند.

فرمول تعریف شده برای SStreat بر اساس محتوای انحرافات میانگین‌های گروهی از میانگین‌های اصلی شکل گرفته است. در اینجا ما داریم:

شما می‌توانید ببینید که SStreat مجموع انحرافات مجذور شده میانگین‌های متغیّر آزمایشی از میانگین اصلی است و در n ضرب می‌شود که به ما برآوردی از واریانس گروه می‌دهد. در تمارین SSerror توسط تفریق کسب می‌شود. در اینجا آن می‌تواند به آسانی نشان داده شود که:

همچنین آن می‌تواند صحیح باشد که:

این روش ارائه شده در جدول 11.3 است و آن محاسباتمان را آسان‌تر می‌سازد. برای نشان دادن SSerror در اصطلاح انحرافات از میانگین‌ها ما می‌توانیم بنویسیم:

در اینجا شما می‌توانید ببینید که SSerror در گروهها به آسانی از مجموع مجذورات انحرافات نمره‌ها از میانگین گروهشان حاصل شده است. این رویکرد در ادامه به وضوح نشان داده شده است. در جایی که ما مجموع مجذورات همه گروهها را محاسبه کرده‌ایم. توجه داشته باشید که برای هر گروهی به طور قطعی هیچ تأثیری از اطلاعات گروههای دیگر وجود ندارد و بنابراین صحّت یا اشتباه بودن فرضیه نول با محاسبات غیرمرتبط است.

SSگروه شمارش= Ʃ((9-7.00)2+(8-7.00)2+…+(7-7.00)2)=30.00
SSگروه منظوم= Ʃ((7-6.90)2+(9-6.90)2+…+(7-6.90)2)=40.90
SSگروه صفت= Ʃ((11-11.00)2+(13-11.00)2+…+(11-11.00)2)=30.00
SSگروه تصویرسازی= Ʃ((12-13.4)2+(11-13.4)2+…+(11-13.4)2)=30.00
SSگروه طراحی عمدی= Ʃ((10-12.00)2+(19-12.00)2+…+(11-12.00)2)=30.00
SSerror 435.30

وقتی که ما این اصطلاحات خاص را با هم جمع کنیم، ما عدد 30/435 را کسب می‌کنیم که مطابق با جواب کسب شده در جدول 11.3 است.

جدول خلاصه

جدول 11.3 همچنین به ما جدول خلاصه را نشان می‌دهد که برای آنالیز واریانس است. آن به این دلیل جدول خلاصه نامیده می‌شود که آن مجموعه‌ای از محاسبات را خلاصه می‌کند و آن را ممکن می‌سازد تا با نگاه سریعی بگوییم چه اطلاعاتی باید ارائه شوند. در نشریات قدیمی‌تر شما اغلب جدول خلاصه و کاملی را می‌یابید که نشان داده شده است. اخیراً برای حفظ فضا، معمولاً FS و درجات آزادی ارائه می‌شوند.

منبع تغییرات

اولین ستون جدول خلاصه، شامل منبع تغییرات می‌باشد- کلمه تغییرات مترادف عبارت «مجموع مجذورات» است. همانطور که در جدول دیده می‌شود سه منبع تغییر وجود دارد:

تغییر به علت متغیر آزمایشی (تغییر بین میانگین‌های متغیر آزمایشی)
تغییر به علت اشتباه (تغییر در میان متغیرهای آزمایشی)
تغییر کلّی

این منابع این حقیقت را منعکس می‌کنند که ما مجموع کل مجذورات را به دو جزء تقسیم می‌کنیم، یک قسمت نشان دهندۀ تغییرپذیری بین گروههای خاص و دیگری نشان دهندۀ تغییرپذیری بین میانگین‌های چند گروه است.

درجات آزادی

ستون درجات آزادی در جدول 11.3 نشان دهندۀ بخش تعداد درجات آزادی کلّی بین دو منبع تغییر است. از بین این 49 درجه آزادی، 4 تا مربوط به تفاوت‌های بین میانگین‌های متغیر آزمایشی هستند و 45 درجۀ آزادی باقیمانده به تغییرپذیری بین گروههای متغیر آزمایشی اختصاص داده شده‌اند. محاسبۀ درجۀ آزادی احتمالاً آسان‌ترین قسمت وظیفۀ ماست. تعداد کل درجات ازادی (dFtotal) همیشه برابر با N-1 است که در اینجا N تعداد کل مطالعات و مشاهدات ماست. تعداد کل درجات آزادی بین متغیرهای آزمایشی (dFtreat) برابر با K-1 است که در اینجا K تعداد متغیرهای آزمایشی است. تعداد درجات آزادی برای اشتباه آسان‌ترین قسمت است که با تفریق dFtreat از dFtotal حاصل می‌شود. با این وجود dFerror می‌تواند به صورت مسقیم‌تر با محاسبه جمع درجات آزادی بین هر متغیر آزمایشی محاسبه شود. اگر بخواهیم مطالب گفته شده را به شکلی نسبتاً متفاوت بیان کنیم، باید بگوییم تغییرپذیری کلی بر پایۀ نمرات N است. بنابراین دارای درجه آزادی N-1 است. تغییرپذیری میانگین‌های متغیر آزمایشی بر پایۀ میانگین‌های K است. بنابراین درجه آزادی K-1 است. تغییرپذیری میان هر یک از متغیرهای آزمایشی بر پایۀ نمرات N است و بنابراین درجه آزادی n-1 را دارد؛ اما از آنجایی که ما K را حاصل جمع این متغیرهای آزمایشی محاسبه کردیم، ما درجه آزادی k(n-1) را خواهیم داشت.

مجذورات میانگین

ما حالا به ستون مجذورات میانگین (MS) در جدول 11.3 خواهیم رفت (دربارۀ ستون SS مطالب کمی گفته شد؛ آن به صورت خیلی ساده شامل مجموع مجذورات کسب شده در قسمت محاسبات است). ستون مجذورات میانگین شامل دو برآوردمان از است. این مقادیر با تقسیم کردن مجموع مجذورات به درجات آزادی همانندشان کسب شده‌اند. بنابراین 88.87=4÷52/351 و 67/9=45÷30/435 .

ما معمولاً مجذورات میانگین کلی (MStotal) را محاسبه نمی‌کنیم، چون نیازی به آن نداریم. اگر ما آن را محاسبه می‌کردیم، این اصطلاح برابر با 058/16=49÷82/786 می‌شد که شما می‌توانید آن را از جدول 11.3 ببینید که واریانس همه مشاهدات N بدون توجه به متغیر آزمایشی است. اگرچه آن درست است که مجذورات میانگین برآوردهای واریانس هستند، اما آن مهم است که به ذهن بسپارید که این اصطلاحات برآورد کنندۀ چه واریانس‌هایی هستند. بنابراین MSerror برآورد واریانس گروه است . بدون توجه به درست بودن یا اشتباه بودن Ho و در حقیقت میانگین واریانس‌های مربوط به هر گروه وقتی که اندازه‌های نمونه مساوی هستند، برابر با:
MSerror=(3.33+4.54+6.22+20.27+14.00)/5=9.67

با این وجود MStreat واریانس میانگین‌های متغیر آزمایشی نیست. اما نسبتاً واریانس آن میانگین‌های تصحیح شده با n است، تا برآورد دوّم واریانس گروهی را تولید کند.

شاخص آماری F

آخرین ستون جدول 11.3 با برچسب F مهمترین اصطلاح در ارزیابی فرضیۀ صفر است. F با تقسیم کردن MStreat بر MSerror کسب می‌شود. یک راه دقیق و یک راه غیردقیق و آبکی برای توضیح اینکه چرا این نسبت مقصود را به ما می‌دهد، وجود دارد. ما با دوّمی شروع خواهیم کرد. همان طور که قبلاً گفتیم، MSerror برآوردی از واریانس جمعیت است، در صورتی که Ho درست باشد، نه اینکه آن اشتباه باشد. اگر Ho درست باشد، MStreat و MSerror هر دو برآورد کنندۀ چیزهای یکسانی هستند و آنها همچنان باید تقریباً مساوی باشند. در این صورت نسبت یکی به بقیه تقریباً 1 می‌شود و مقداری مطمئن برای اشتباه نمونه‌گیری را به ما می‌دهد. بنابراین ما باید نسبت را محاسبه کنیم و تعیین کنیم آیا آن به اندازۀ کافی نزدیک به 1 هست تا بر حمایت از فرضیۀ اول دلالت کند.
به منظور تعیین روش رسمی یافتن F یک رویکرد دقیق با مجذورات میانگین مورد انتظار برای اشتباه و متغیرهای آزمایشی شروع می‌شود. با توجه به اطلاعات قبلی فصل ما می‌دانیم:

حال ما نسبت را شکل می‌دهیم:

تنها زمانی این نسبت برابر 1 خواهد شد که به عبارت دیگر وقتی که Ho درست است و . وقتی که ما انتظار داریم که این نسبت بزرگتر از 1 شود. سؤالی که باقی می‌ماند این است که اندازۀ این نسبت بدون رد کردن Ho وقتی که از مقادیر مورد انتظار استفاده نمی‌کنیم، اما از مجذورات میانگین کسب شده استفاده می‌کنیم که از اطلاعات محاسبه شده‌اند و بنابراین دچار اشتباه نمونه‌گیری هستند، چقدر خواهد شد؟

برای جواب دادن به این سؤال در حقیقت ما می‌توانیم نسبت را به این صورت نشان دهیم:
F=MStreat / MSerror


که در اینجا F روی K-1 و درجه آزادی K(n-1) توزیع شده است. این مشابه با توزیع F که قبلاً در ارتباط با ارزیابی نسبت 2 برآورد واریانس بحث شد، می‌باشد (در حقیقت این است که ما در حال انجام دادن چه چیزی اینجا هستیم). قابل توجه است که درجات آزادی که با dF نشان داده می‌شود با صورت و مخرج کسر ارتباط دارد.

در ارتباط با مثالمان، F=9.08 ما داریم عدد درجه آزادی 4 را برای صورت کسر و درجه آزادی 45 را برای مخرج کسر و می‌توانیم ضمیمه F را با این مقادیر وارد کنیم. ضمیمه F قسمتی در جدول 11.4 است که در آن نشان داده شده است و به ما مقادیری را برای و می‌دهد. در این مورد خاصمان ما درجات آزادی 4 و 45 و را داریم. بنابراین اگر ما α را برابر 05/0 انتخاب می‌کردیم تا روی آن کار کنیم ما Ho دارد می‌کنیم که نشان دهندۀ تفانوت‌های مهمی بین متغیرهای آزمایشی است.

نتایج

بر اساس مقادیر قابل توجه F ما رد کردیم فرضیۀ صفر را که نشان دهندۀ این بود که میانگین‌های متغیر آزمایشی در گروه مساوی بودند. به صورت جدی، این نتیجه‌گیری بر این مطلب دلالت می‌کند که حداقل یکی از میانگین‌های گروهی با حداقل یک میانگین دیگر متفاوت است. اما ما دقیقاً نمی‌دانیم که کدام میانگین‌ها از میانگین‌های دیگر متفاوت است. ما این عنوان را در فصل 12 دنبال خواهیم کرد. با بررسی تصویر 11.2 این مطلب مشهود است. با این وجود پردازش افزایش یافته مواد در ارتباط با سطوح افزایش یافته یادآوری می‌باشد. به عنوان مثال یک استراتژی که شامل ارتباط دادن تصاویر و آیتم‌ها برای یادآوری می‌باشد به 2 سطح یادآوری که صرفاً به شمارش حروف در آیتم‌ها می‌پردازد، منتهی می‌شود. نتایج اینچنین مطالبی به ما نکات مهمی در مورد اینکه چطور یادگیری هر مطلب اتفاق می‌افتد، می‌دهد و تأکید می‌کند که یادآوری ضعیف از مطالعه منفعل انتظار می‌رود. یادآوری خوب، چه لیستی از کلمات یا مفهوم‌های آماری پیچیده باشد، نیاز به پردازش فعّال و عمیق مطالب دارد که با ایجاد ارتباط بین مطالب در حال یادگیری و مطالبی که شما در حال حاضر می‌دانید، تسهیل می‌شود. شما احتمالاً توجه کرده‌اید که نشستن در کلاس و ثبت و ضبط کردن آنچه که آموزگار می‌گوید، منتج به نمرات بالایی که شما فکر می‌کنید شایستۀ تلاش است، نمی‌شود. حالا شما کمی می‌دانید که چرا!

جدول 11.4: مدل خلاصه شاخص F و مقادیر بحرانی توزیع F در جایی که آلفا=پنج صدم


11.5 نوشتن نتایج

نوشتن گزارشات برای آنالیز واریانس کمی پیچیده‌تر از گزارش کردن نتایج آزمون t است. این به خاطر این است که ما فقط نمی‌خواهیم که نشان دهیم که F کلی قابل توجه است، بلکه ما احتمالاً می‌خواهیم تا اظهاراتی در مورد تفاوت‌ها بین میانگین‌های خاص بگوییم. م در مورد آزمون‌ها روی میانگین‌های خاص بحث نمی‌کنیم و این مطلب را تا فصل بعدی به تعویق می‌اندازیم. بنابراین این مثال ناقص خواهد ماند. ما به آن در فصل 12 برخواهیم گشت. یک تعبیر خلاصه‌ای از اظهارات ما در مورد نتایج در ادامه می‌آید.

در یک آزمون فرضیه که در آن حافظه به سطح پردازش مطالب برای یادآوری وابسته است، شرکت کنندگان در 5 گروه 10 نفری تقسیم شده بودند. گروهها از نظر مقدار پردازش مطالب کلامی نیاز به آموزش با هم متفاوت بودند و از نظر تعداد حروف کلمات برای یادآوری که باعث شکل‌دهی تصویرهای ذهنی توسط هر کلمه می‌شدند، متفاوت بودند. بعد از اینکه لیست 27 کلمه‌ای 3 بار به مشارکت کنندگان داده شد، از آنها خواسته شد تا هر تعدادی از مطالب را که ممکن است به یاد آورند. انجام آنالیز واریانس یک راهه نشان داد که تفاوت‌های مهمی بین میانگین‌های پنج گروه وجود دارد (F(4,45)=9.08 , P<0.05). بررسی بینایی میانگین‌های گروهی نشان داد که سطح یادآوری به طور کلی بر اساس سطح پردازش مورد نیاز افزایش می‌یابد، همان طور که توسط این نظریه پیش‌بینی می‌شد (نکته: برای بحث بیشتر در مورد این تفاوت‌ها تا فصل 12 باید منتظر بمانید).

11.6 راه حل‌های کامپیوتری

بیشترین آنالیز واریانس‌ها که امروزه انجام می‌شوند با استفاده از نرم‌افزار کامپیوتری استفاندارد انجام می‌شوند و نمایش 11.1 شامل مثال‌های برونداد از SPSS هستند. دیگر نرم‌افزارهای آماری نیز نتایج مشابهی تولید خواهند کرد. در تولید پرینت SPSS که در ادامه خواهد آمد، من از گزینه one-way از منوی compare Means استفاده کردم.

تعداد میانگین انحراف معیار اشتباه استاندارد دامنه اطمینان 95% برای میانگین حداقل حداکثر
حد پایینی حد بالایی
شمارش 10 00/7 83/1 58/0 69/5 31/8 4 10
منظوم 10 90/6 13/2 67/0 38/5 42/8 3 11
صفت 10 00/11 49/2 79/0 22/9 78/12 6 14
تصویرسازی 10 40/13 50/4 42/1 18/10 62/16 9 23
طراحی عمدی 10 00/12 74/3 18/1 32/9 68/14 5 19
کلّی 50 06/10 01/4 57/0 92/8 20/11 3 23


یادآوری
مجموع مجذورات درجه آزادی مجذور میانگین F Sig
بین گروهی 520/351 4 880/87 085/9 0.0000
درون گروهی 300/435 45 673/9
کلّی 820/786 49

میانگین‌های تقریبی برآورد شدۀ یادآوری


برونداد موجود در اینجا شبیه به آنچه است که ما محاسبه کردیم. اگر شما گزینۀ
Analyze/ General linear Model/ Univariate

را انتخاب کرده بودید، به نتایج کلاً مشابهی می‌رسیدید؛ اگرچه جدول خلاصه شامل کمی مطالب اضافه نیز می‌باشد که تا انتهای این فصل در مورد آن بحث نخواهیم کرد.


اختصاصی همیاری