آزمون های آماری در GIS: تحلیل روابط
در این مقاله مهمترین آزمون های آماری پرکاربرد در تحلیل روابط پدیده های سطح سیاره زمین را مورد بررسی قرار داده ایم. این آزمون ها در رشته های علوم اطلاعات جغرافیایی (Geographical Information Science GIS) به منظور تحلیل روابط علت و معلومی مکانی کاربرد دارند. این آزمون ها که در ادامه آمده است عمدتا در رشته های علمی زیرمجموعه دانش های اطلاعات جغرافیایی می توانند کاربرد داشته باشند. مهمترین شاخه های علوم جغرافیایی شامل منابع طبیعی، آبخیزداری، محیط زیست، نقشه برداری، شهرسازی و برنامه ریزی شهری، مطالعات برنامه ریزی روستایی و شهری، تحلیل های آب و هوایی و هواشناسی، زمین شناسی و مطالعات معدنی هستند. در تمام ای شاخه های علمی می توان از آزمون های زیر در GIS برای تحلیل روابط عوامل مورد بررسی آنها استفاده کرد.
یکی از روشهای انتخاب متغیرهای مناسب برای تحلیل عاملی استفاده از ماتریس همبستگی است که اساس روش تحلیل عاملی برای انتخاب متغیرها به عاملهای متفاوت است. این امر براساس استفاده از همبستگی بین متغیرها است اما از نوع غیر عاملی.
البته آمارهای دیگری وجود دارد که محقق از طریق آنها نیز قادر به تعیین و تشخیص مناسب بودن داده ها برای تحلیل عاملی می باشد. از جمله این روشها آزمون KMO می باشد که مقدار آن همواره بین ۰و۱ می باشد و در صورتی که این مقدار کمتر از0.5 باشد داده ها برای تحلیل عاملی مناسب نخواهد بود.
از سوی دیگر برای اطمینان از داده ها برای تحلیل عاملی مبنی بر اینکه آیا ماتریس همبستگی که پایه تحلیل عامل قرار می گیرد در جامعه برابر صفر است یا خیر باید از آزمون بارتلت استفاده کنیم. این آزمون معناداری تحلیل عاملی داده ها را می سنجد و اگر این مقدار کمتر از0.05 باشد داده ها با جامعه مورد معنی دار است. ماتریس همبستگی همچنین می تواند برای بررسی ارتباط بین چند متغیر با یکدیگر بکار رود. (دواس، 1376)
یکی از هدفهای اصلی بسیاری از پژوهشهای آماری ایجاد وابستگی هایی است تا پیش بینی یک یا چند متغیر را بر حسب سایر متغیرها ممکن سازد. در این موارد از آزمون رگرسیون خطی برای درونیابی یا سنجش روابط استفاده می شود. مثلا مطالعاتی انجام می شود تا فروشهای بالقوه یک محصول جدید را بر حسب تغییرات متغییر قیمت آن و یا احتمال رخداد سیل را خصوصیات مورفومتری حوضه آبخیز، پیش بینی کند.
در عمل مسایل متعددی وجود دارند که در آن ها مجموعه ای از داده ها زوج شده بر آن دلالت می کند که رگرسیون خطی[1] است و در آن توزیع توأم متغیرهای تصادفی تحت بررسی را نمی دانیم اما با این حال می خواهیم که ضرایب رگرسیون را برآورد کنیم. روش رگرسیون خطی یک تکنیک یادگیری نظارتی است که به وسیله آن می خواهیم تغییرات یک متغیر وابسته بوسیله ترکیب خطی از یک یا چند متغیر مستقل را مدل کنیم.
مزیت رگرسیون خطی این است که فهمیدن و کار با آن ساده است و در حالت کلی برای استراتژی و پیش بینی مناسب است. با بکار بردن این روش از نتایج خروجی می توان دریافت که این روش مناسب بوده یا خیر. بنابراین معیارهایی داریم که با استفاده از آنها می توان دریافت که آیا می توان به نتایج خروجی اطمینان کرد یا خیر.
آنچه در انجام رگرسیون مهم به نظر می رسد، تعیین میزان همبسته بودن داده ها به یکدیگر است. با مشخص کردن میزان همبسته بودن داده های متغیرهای ورودی و خروجی می توان دریافت که رگرسیون خطی برای انجام داده کاوی مناسب است یا خیر.
بنابراین، ضریب همبستگی و برآوردهای آن در بسیاری از پژوهشهای آماری اهمیت دارند. شرایطی که وقتی چند متغیر پیشگو با یکدیگر هم پوشانی دارند، این هم پوشانی منجر به نااستواری و تزلزل در فضای جواب می شود، همچنین منجر به نتایج بی ارتباط (بی ربط) می شود. حتی اگر از این تزلزل اجتناب شود همپوشانی بین متغیرهایی که میزان بین متغیرهایی همبستگی آنها زیاد است، منجر به تاکید کردن روی بخش خاصی از مدل می شود. بنابراین از بین متغیر های ورودی مواردی که با هم بستگی زیادی دارند، نباید با هم در تعیین ارزش متغیر خروجی بکار برده شوند.(کلانتری،۱۳۸۷)
تحلیل عاملی نامی است عمومی برای برخی از روشهای چند متغیره که هدف اصلی آن خلاصه کردن داده هاست. این روش به بررسی همبستگی درونی تعداد زیادی از متغیرها می پردازد و در نهایت آنها را در قالب عاملهای عمومی محدودی دسته بندی کرده و تبیین می کند. در این تکنیک تمام متغیرها به عنوان متغیر وابسته قرار می گیرد.
تحلیل عاملی روشی وابسته بوده که در آن کلیه متغیرها بطور همزمان مد نظر قرار می گیرد. در این تکنیک، هریک از متغیرها به عنوان یک متغیر وابسته لحاظ می گردد. (کلانتری، ۱۳۸۷)
هدف اصلی تحلیل عاملی تلخیص تعداد زیادی از متغیرها در تعداد محدودی از عاملها می باشد، بطوریکه در این فرایند کمترین میزان گم شدن اطلاعات وجود داشته باشد. با توجه به هدف تحلیل عاملی هر متغیری مرتبط با مسئله تحقیق را می توان در این تحلیل به کار گرفت.
در این نوشته به روابط آماری و همچنین آزمون های همبستگی بین آنها پرداختیم. کاربرد این آزمون ها در علوم GIS به منظور تحلیل روابط بین پدیده های مکانی است. برای مشاهده انواع آزمون های آماری در GIS می توانید به این لینک مراجعه کنید.
[1] Linear regression