آزمون های آماری مقایسه ای در GIS

در این بخش مهمترین روشهای آماری مورد استفاده در علوم محیطی و جغرافیایی را مورد بحث قرار داده ایم. این مباحث در تمام رشته های مرتبط با علوم GIS یا دانش های اطلاعات جغرافیایی کاربرد دارند. این آزمون ها که در ادامه آمده است عمدتا در رشته های علمی زیرمجموعه دانش های اطلاعات جغرافیایی (Geographical Information Science GIS) می توانند کاربرد داشته باشند. مهمترین شاخه های علوم جغرافیایی شامل منابع طبیعی، آبخیزداری، محیط زیست، نقشه برداری، شهرسازی و برنامه ریزی شهری، مطالعات برنامه ریزی روستایی و شهری، تحلیل های آب و هوایی و هواشناسی، زمین شناسی و مطالعات معدنی هستند. تحلیل ها و پردازش های آماری که در ادامه آمده است در تمام رشته های زیر مجموعه علوم مکانی و جغرافیایی کاربرد دارند.

آزمونهای T

آزمون t وابسته:

آزمون t دو نمونه مستقل:

آزمون لون:

تحلیل واریانس

آزمون F:

پیشفرض‌های تحلیل واریانس

آزمون کلماگورف- اسمیرانف

آزمونهای T

آماره t در آزمون t برای تعیین اینکه آیا فرضیه صفر را تایید یا رد می کند استفاده می شود. بسیار شبیه به z-score است اما با این تفاوت که از آماره t زمانی استفاده می شود که حجم نمونه کوچک باشد یا انحراف معیار جامعه نامشخص باشد.

مقادیر بالاتر t-score نشان می دهد که تفاوت زیادی بین دو مجموعه نمونه وجود دارد. هر چه مقدار t کوچکتر باشد، شباهت بیشتری بین دو مجموعه نمونه وجود دارد. نمره t بزرگ یا t-value نشان می دهد که گروه ها متفاوت هستند در حالی که یک نمره t کوچک نشان می دهد که گروه ها مشابه هستند.

آزمون t تک نمونه: برای آزمون فرض پیرامون میانگین یک جامعه استفاده می شود. به عبارتی این آزمون برای بررسی تفاوت یک متغیر از جامعه با میانگین مفرض از آن جامعه مورد استفاده قرار می گیرد.

آزمون t وابسته:

برای آزمون فرض پیرامون دو میانگین از یک جامعه استفاده می شود. برای مثال اختلاف میانگین تغییرات کانال رودخانه قبل و بعد از احداث سد یا زمانی که نمرات یک کلاس با پیش آزمون و پس آزمون سنجش می شود.

آزمون t دو نمونه مستقل:

جهت مقایسه میانگین دو جامعه مستقل استفاده می شود. در آزمون t برای دو نمونه مستقل فرض می شود واریانس دو جامعه برابر است. برای مثال به منظور بررسی معنی دار بودن تفاوت میانگین دبی رسوب رودخانه ها براساس جنس سازندهای زمین شناسی متفاوت و یا تفاوت میانگین خصوصیات فیزیوگرافی حوضه ها براساس نوع اقلیم و پوشش در خصوص هر یک از فرضیه های پژوهش استفاده میشود.

آزمون لون:

آزمون لون[1] همگنی واریانس ها را در نمونه های متفاوت بررسی می نماید. به عبارتی فرض تساوی متغیر وابسته را برای گروه هائی که توسط عامل رسته ای تعیین شده اند، آزمون می کند و نسبت به اکثر آزمونها کمتر به فرض نرمال بودن وابسته بوده و در واقع به انحراف نرمال مقاوم است.

این آزمون در نظر می گیرد که واریانس جمعیت آماری در نمونه های مختلف برابر است. فرض صفر همگن بودن واریانس ها می باشد یعنی واریانس جمعیت ها با هم برابر است و اگر مقدار P-VALUE در آماره لون کمتر از ۰٫۰۵ باشد تفاوت بدست آمده در واریانس نمونه بعید است که بر اساس روش نمونه گیری تصادفی رخ داده باشد. بنابراین فرض صفر که برابری واریانس ها می باشد رد می شود و به این نتیجه می رسیم که که بین واریانس ها تفاوت وجود دارد. (آذر و مومنی، 1388)

تحلیل واریانس [2]

از این آزمون به منظور بررسی اختلاف میانگین چند جامعه آماری استفاده می شود. برای مثال جهت بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس سن یا تحصیلات در خصوص هر یک از فرضیه های پژوهش استفاده می شود. در تحلیل واریانس مجموع واریانس بین گروهی و درون گروهی واریانس کل را نشان می دهد. بنابراین، اگر واریانس بین گروه ها یا تغییرات بین گروه ها بیشتر باشد، انتظار می رود که واریانس درون گروه ها یا تغییرات درون گروه ها که ناشی از تفاوت های غیر واقعی یا تصادفی و ناشی از خطا است کمتر شود. هر چه تفاوت بین گروه ها زیادتر باشد، می توان گفت که تاثیر متغییر مستقل بیشتر بوده است.

آزمون F:

این آزمون تعمیم یافته آزمون t است و برای ارزیابی یکسان بودن یا یکسان نبودن دو جامعه و یا چند جامعه به کار برده می‌شود. در این آزمون واریانس کل جامعه به عوامل اولیه آن تجزیه می‌شود. مشخصه آماری F نسبت واریانس بین گروه ها به واریانس درون گروه ها را نشان می دهد. هر چقدر این نسبت بیشتر باشد، واریانس بین گروهی در مقایسه با واریانس درون گروهی بیشتر خواهد بود و در نتیجه میانگین بین گروه ها تفاوت بیشتری خواهد داشت. به همین دلیل به آن آزمون آنالیز واریانس نیز می‌گویند.وقتی بخواهیم بجای دو جامعه، تفاوت چند جامعه را تواما با هم مقایسه نماییم از این آزمون استفاده می‌شود. مقایسه میانگین های چند جامعه بوسیله این آزمون راحت تر از آزمون t امکان پذیر است.

پیشفرض‌های تحلیل واریانس

پیشفرض‌های تحلیل واریانس یک راهه عبارتند از الف) متغیر وابسته باید در سطح فاصله‌ای یا نسبی باشد، ب) متغیر مستقل باید اسمی یا رتبه‌ای باشد، ج) توزیع داده‌های متغیر وابسته باید به صورت نرمال باشد که برای بررسی نرمال بودن می توان از آزمون کالماگورف- اسمیرانف استفاده کرد، د) نمونه ها به صورت تصادفی و مستقل از یکدیگر باشند که برای بررسی تصادفی بودن می توان از آزمون گردش[3] استفاده کرد. (آذر و مومنی، 1388)

آزمون کلماگورف- اسمیرانف [4]

این آزمون از نوع ناپارامتری است و برای ارزیابی همقوارگی متغیرهای رتبه ای در دو نمونه (مستقل و یا غیر مستقل) و یا همقوارگی توزیع یک نمونه با توزیعی (توزیع نرمال) که برای جامعه فرض شده است، به کار می‌رود (اسمیرانف یک نمونه ای). این آزمون در مواردی به کار می‌رود که متغیرها رتبه ای باشند و توزیع متغیر رتبه ای را در جامعه بتوان مشخص نمود. این آزمون از طریق مقایسه توزیع فراوانی های نسبی مشاهده شده در نمونه با توزیع فراوانی های نسبی جامعه انجام می‌گیرد. این آزمون بدون توزیع است اما باید توزیع متغیر در جامعه برای هر یک از رتبه های مقیاس رتبه ای در جامعه بطور نسبی در نظر گرفته شود که آنرا نسبت مورد انتظار می نامند. اگر سطح معنی داری[5] (p-value) کمتر از 0.05 باشد به این معنی است که نمونه از توزیع نرمال پیروی نمی کند. (آذر و مومنی، 1388)

آزمون گردش

آزمون گردش یا رانز برای بررسی تصادفی بودن نمونه های جمع آوری شده بکار می رود. اگر معنی داری بیشتر از 0.05 باشد به این مفهوم است که داده ها بطور تصادفی جمع آوری شده اند.

آزمون یو مان وایتنی

هر گاه دو نمونه مستقل از جامعه ای مفروض باشد و متغیرهای آنها به صورت ترتیبی باشند، از این آزمون استفاده می‌شود. این آزمون مشابه t استیودنت با دو نمونه مستقل است و آزمون ناپارامتری آن محسوب می‌شود. هرگاه شرایط استفاده از آزمونهای پارامتری در متغیرها موجود نباشد، یعنی متغیرها پیوسته و نرمال نباشند از این آزمون استفاده می‌شود. دو نمونه باید مستقل بوده و هر دو کوچکتر از ۱۰ مورد باشند. در صورت بزرگتر بودن از ۱۰ مورد باید از آماره های ‌‌Z استفاده کرد که در محاسبات کامپیوتری، تبدیل به Z به طور خودکار انجام می‌شود. در این آزمون شکل توزیع، پیش فرضی ندارد یعنی می‌تواند نرمال و یا غیر نرمال باشد. سطح معنی داری در این آزمون معنی داری باید کمتر از 0.05 باشد که نشان دهده تفاوت معنی دار دو نمونه است. به عنوان مثال، اگر تفاوت احتمال رخداد سیل بین دو گروه سکونتگاه های کوهستانی و جلگه ای معنی دار باشد به این معنی است که عامل مستقل یعنی واحد ژئومورفولوژی کوهستان یا جلگه می تواند در وقوع این مخاطرات موثر باشد. (کلانتری،۱۳۸۷)

آزمون کروسکال- والیس

این آزمون متناظر غیر پارامتری آزمون F است و همچون آزمون F ، موقعی به کار برده می‌شود که تعداد گروه ها بیش از ۲ باشد. مقیاس اندازه گیری در کروسکال والیس حداقل باید ترتیبی باشد. این آزمون برای مقایسه میانگین های بیش از ۲ نمونه رتبه ای و یا فاصله ای بکار می‌رود. در صورت عدم برقراری فرض نرمال بودن که یکی از پیش فرض های استفاده از آنالیز واریانس به حساب می آید به سراغ آزمون ناپارامتری کروسکال والیس می رویم. در این آزمون سطح معنی داری باید کمتر از 0.05 باشد تا بتوان نتیجه گرفت که میانگین نمونه ها تفاوت معنی داری دارند. برای مثال، اگر میانگین احتمال وقوع مخاطره ای در چند زیرحوضه تفاوت معنی دار داشته باشد می توان نتیجه گرفت که عامل گروه بندی یعنی زیرحوضه در احتمال رخداد آن مخاطره موثر است. در مثال تاثیر زیرحوضه ها بر احتمال مخاطره، درصورتی که فرض صفر رد شود به این مفهوم است که زیرحوضه ها می تواند عاملی موثر در احتمال وقوع و یا شدت مخاطرات باشد. (کلانتری، ۱۳۸۷)

نتیجه گیری

آزمون های آماری در مطالعات جغرافیایی می توانند برای مقایسه پدیده ها کاربرد دارند. معنی داری تفاوت ها در این پدیده های GIS می تواند نشان دهنده تاثیرگذاری و تاثیرپذیری پدیده ها از علل مکانی باشد.

[1] Levene

[2] ANOVA

[3] RUNS

[4] Kalmogorov- Smiranov Test

[5] Sig.

آزمون های آماری مقایسه ای در GIS

آزمون های آماری مقایسه ای در GIS