Çoklu doğrusal regresyon (Multiple regression analysis)


Bu bölümde neler var?
1. Bölüm: Çoklu doğrusal regresyon nedir?
2. Bölüm: Varsayımlar
3. Bölüm: Çoklu doğrusal regresyon denklemi
4. Bölüm: Hipotez testi
5. Bölüm: Çoklu Korelasyon Katsayısı
6. Bölüm: Determinasyon katsayısı
7. Bölüm: Kısmi-yarı korelasyon katsayısı
8. Bölüm: Standart /eş zamanlı (simetenous) çoklu regresyon analizi
9. Bölüm: Aşamalı / adım adım (stepwise) çoklu regresyon analizi
10. Bölüm: Hiyerarşik/ardışık (hierarcical) çoklu regresyon analizi
11. Bölüm: Etki büyüklüğü
12. Bölüm: Örnek
13. Bölüm: SPSS Uygulaması
14. Bölüm: Sonuçların Yorumlanması
15. Bölüm: Sonuçların Raporlanması
16. Bölüm: Özet
17. Bölüm: Kaynakça
18. Bölüm: Ek kaynaklar


Basit regresyon analizine benzer şekilde, bir bağımlı değişkenin birden fazla bağımsız değişken tarafından yordanmasına yönelik analiz türüne çoklu doğrusal regresyon adı verilir (Büyüköztürk, 2015, s. 98; Can, 2018, s. 273; Güriş ve Astar, 2015, s. 325; Özdamar, 2013, s. 175). Çoklu regresyon analizine dâhil edilmesi düşünülen bağımsız değişkenlerin bağımlı değişken ile ilişkileri olması beklenir. Aksi takdirde analize dâhil etmenin manası olmaz. Bu sebepten sağlam bir literatür taraması yardımıyla modele girecek bağımsız değişkenler belirlenmelidir (Akbulut, 2010, s. 66). Peki, bağımsız değişken sayısına nasıl karar verilmelidir. Araştırmacılara maliyeti ve zamanı göz önüne alınarak toplam varyansı en çok açıklayan sayıda değişken seçilmelidir (Kalaycı, 2010, s. 260; Salkind, 2015, s. 281).
Çoklu regresyon analizinin amaçları:
   ·         Birden fazla bağımsız değişkenin yordadığı bağımlı değişken ile birlikte bir model oluşturmak (Can, 2018, s. 273),
   ·         Bağımlı değişken üzerinde etkisi olduğu düşünülen bağımsız değişkenlerin etkileme gücü ve derecelerini tespit etmek (Alpar, 2016, s. 477; Can, 2018, s. 273),
   ·         Bağımlı değişken ile bağımsız değişkenler arasındaki açıklayıcılık-determinasyon katsayısını hesaplamak (Alpar, 2016, s. 477),
   ·         Bağımsız değişkenler yardımıyla bilinmeyen bağımlı değişken değerleri hakkında kestirim yapmak (Alpar, 2016, s. 477),
   ·   Toplanan verinin özetlenmesini sağlamaktır (Alpar, 2016, s. 477).

Uyarı: Çoklu regresyon analizinin parametre hesaplamalarında farklı teknikler kullanılabilir. Ancak en çok tercih edileni En küçük Kareler (Least Squares ) yöntemidir. Aşağıdaki varsayımlar en küçük kareler yönteminin uygulanması için gereklidir. Başka tahminleme yöntemleri farklı varsayımları gerektirebilir. 

Varsayımlar
      ·         Bağımlı Değişken sayısal olmalı (Alpar, 2016, s. 477; Büyüköztürk, 2015, s. 98; Can, 2018, s. 275; Field, 2009, s. 220), bağımsız değişkenler sürekli, kesikli ya da niteliksel olabilir (Alpar, 2016, s. 477).
      ·         Bağımsız değişkenler ile bağımlı değişken arasında doğrusal bir ilişki olmalı (Akbulut, 2010, s. 66; Alpar, 2016, s. 480;  Büyüköztürk, 2015, s. 98; Can, 2018, s. 275; Field, 2009, s. 221; Salkind, 2015, s. 280). Bağımsız değişkenler ile bağımlı değişkenler arasındaki ilişki katsayısı en az 0,30 olmalıdır (Pallant, 2001, s. 143). Bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki bulunamadığı takdirde hesaplanan çoklu doğrusal regresyon değerleri yanlı olacaktır veya hesaplanamayacaktır. Bu sorundan kurtulmak için eğrisel regresyon modelleri tercih edilebilir. 
     ·       Örneklem büyüklüğü tahmin edilen parametrelerden yeterli düzeyde yüksek olmalıdır (Güriş ve Astar, 2015, s. 327). Bu ölçütü belirlemek için farklı kaynaklar farklı durumları gösterse de N > 50+ 8X (X bağımsız değişken sayısı) kriteri kabul edilebilir (Tabachnick ve Fidell, 2015, s. 123). Cohen ve Cohen (1983)’e göre bağımsız değişken sayısının 5 katı kadar örneklem büyüklüğü alınmalıdır. İdeal olarak bağımsız değişken sayısının 20 katı kadar örneklem büyüklüğü söylense de en az 5 katı kadar gözleme ulaşılması beklenir (Alpar, 2016, s. 480). Green (1991) e göre yalnızca modelin veri ile uyumuna bakılmak isteniyorsa 50+8X (x bağımsız değişken sayısı), regresyon katsayılarının anlamlılığı kontrol edilmek isteniyorsa 104+ X (x bağımsız değişken sayısı) formülleri kullanarak örneklem büyüklüğü hesaplanır (Aktaran; Field, 2009, s. 222; Tabachnick ve Fidell, 2015, s. 123). Özellikle adımsal regresyon analizinin tercih edileceği araştırmalarda bağımsız değişken sayısının en az 40 katı gözleme sahip olunması tavsiye edilir (Tabachnick ve Fidell, 2015, s. 124). Örneklem büyüklüğünü hesaplayan programlar olan GPOWER, SPSS Sample Power ve PASS kullanılabilir. Çoklu regresyon analizi için yeterli örneklem büyüklüğüne ulaşılmadığı takdirde regresyon katsayılarının anlamlılığı testleri doğru işlemeyebilir ve sonucunda Tip I ve Tip II hataların arttığı gözlemlenebilir.
      ·         Bağımsız değişkenler kendi aralarında çoklu bağlantılılık (çoklu bağıntı, multicolinearity) olmamalı (Akbulut, 2010, s. 66; Alpar, 2016, s. 480; Büyüköztürk, 2015, s. 100; Can, 2018, s. 275; Field, 2009, s. 220; Güriş ve Astar, 2015, s. 327; Özdamar, 2013, s. 175; Salkind, 2015, s. 280). Çoklu bağlantılılık bağımsız değişkenler arasında yüksek miktarda ilişkinin olduğu durumlarda ortaya çıkmaktadır.
o   Çoklu bağlantılık durumunu tespit etmek için farklı yöntemler geliştirilmiştir.
§  Bağımsız değişkenler arasındaki korelasyon katsayısı 0,90 ve üzeri olmamalıdır (Büyüköztürk, 2015, s. 100; Pallant, 2007, s. 156). Bu değeri 0,80 olarak alan bazı araştırmacılar da mevcuttur (Alpar, 2016, s. 481; Field, 2009, s. 224; Kalaycı, 2010, s. 267). Bu sebepten bağımsız değişkenler arasındaki korelasyon matrisinin incelenmesi ve 0,80 ve üstü olan değerlerin gözden geçirilmesi çoklu bağlantılılık ihtimalini azaltmak için gerekmektedir.
§  Varyans büyütme faktörü (VIF: variance inflation factor)değeri 10’dan düşük olmalı (Alpar, 2016, s. 481; Büyüköztürk, 2015, s. 100; Field, 2009, s. 224). VIF değeri 5’ten küçük çıktığı durumlarda çoklu bağlantılılık önemli değildir (Güriş ve Astar, 2015, s. 365). Çoklu bağımlılık tespit edildiği takdirde bağlılık olan değişkenlerden biri veya bir kaçı modelden çıkartılır.



§  VIF değerine yakın olan tolerans değeri de çoklu bağlantılılığı tespit etmek için kullanılabilir. Tolerans değerlerinin  (1/VIF) 0,1’in altında olması çoklu bağlantılılık durumunun varlığı için bir işarettir (Field, 2009, s. 224).
§  Durum indeksleri (Condition indicies) değerinin 30’dan küçük olmalı (Büyüköztürk, 2015, s. 100).
o   Çoklu bağlantılılık regresyon katsayısının tahmininde sapmalara, determinasyon katsayısının küçülmesine sebep olabilmektedir (Field, 2009, s. 224). Özellikle korelasyon katsayısı 0,90’ın üzerinde olan durumlarda regresyon katsayılarının standart hataları ikiye katlanabilir ve dolayısıyla katsayıların anlamlılığı testleri manidar çıkmayabilir (Berry, 1993; Aktaran Tabachnick ve Fidell, 2015, s. 125).
o   Çoklu bağlantılılıktan şüpheleniyorsa bu durumda değişkenlerden biri ya da birkaçı silinebilir. Hangi değişkenlerin modelden çıkartılacağına kuramsal temeller karar verir (Tabachnick ve Fidell, 2015, s. 125). Eğer hiçbir değişkenin silinmesini uygun görmüyorsanız ridge (sırt) regresyon analizine yönelebilirsiniz. Ridge regresyon hakkında daha fazla bilgi için tıklayınız. Çoklu bağlantılılık tespit edildiği durumlarda yapılması gerekenler için Alpar (2013, s. 544-545) kitabına başvurabilirsiniz.
     ·         Hata terimleri (residuals, artık değerler = gerçek bağımlı değişken değerleri ile modelin tahminlediği değerler arasındaki fark) normal dağılım göstermeli (Alpar, 2016, s. 482; Can, 2018, s. 275; Field, 2009, s. 221; Tabachnick ve Fidell, 2015, s. 125). Artıklar standartlaştırılmış, standartlaştırılmamış ve studentleştirilmiş olmak üzere üç gruba ayrılır. Bağımlı değişken ile artıkların (hataların) beraber saçılım grafiğinin çizildiğinde hata terimleri bağımlı değişken ile yatay çizgi ilişkisi göstermeli ve dikdörtgen biçiminde olmalıdır (Tabachnick ve Fidell, 2015, s. 125).  Diğer bir ifade ile artıklar merkezden simetrik bir biçimde ayrılmalılardır ve simetriden ayrılmalar artıkların normal dağılım sağlamadığını gösterir (Tabachnick ve Fidell, 2015, s. 127). Grafik ile gösterimi aşağıdaki gibidir.


o   Standartlaştırılmış  bağımlı değişken değerler (ZPRED) ile standartlaştırılmış artık değerlerin(ZRESİD) saçılım grafiği çizilir (Can, 2018, s. 275).
     ·         Değişkenlerin kendi içlerinde uç değerleri olmamalıdır (Akbulut, 2010, s. 69; Alpar, 2016, s. 480;  Büyüköztürk, 2015, s. 98). Tek değişkenli ve çok değişkenli aykırı gözlemlerin varlığı tespit edilmelidir (Alpar, 2016, s. 482). Aşırı değerlerin tespit edilmesinde farklı yöntemler kullanılmaktadır.
o   Tek değişkenli sapkın değerleri bulmak için frekans değerlerine bakılabilir.
§  Bunu tespit etmek için standartlaştırılmış artık değerlerinden yararlanılır. Standartlaştırılmış Artık değerlerin (residuals) genellikle  -3 ile +3 arasında değer almaları beklenir (Field, 2009, s. 216; Tabacknick ve Fidel, 1996).
o   Çok değişkenli uç değerlerin varlığını tespit etmek için Cook uzaklığı, Centered Leverage değerleri ve her bir katılımcı için hesaplanan Mahalanobis uzaklığı değerleri kontrol edilmelidir (Akbulut, 2010, s. 69).

§  Cook’s D ölçüsü gözlemlerden birinin silinmesi durumunda tahminlenen modeldeki katsayılara etkisini gösterir (Güriş ve Astar, 2015, s. 348).  Cook’s D uzaklığı 1 den fazla olmamalıdır (Akbulut, 2010, s. 69; Cook ve Weisberg, 1982; Aktaran Field, 2009, s. 217) diyen kaynakların yanı sıra hesaplanan değerin Fα,m,n-m        kritik değerini aşmaması beklenir (Güriş ve Astar, 2015, s. 349).  Genelde Cook değerleri hesaplanan gözlemler karşılaştırılarak aynı olmayan gözlemler incelenmelidir (Alpar, 2013, s. 513).
§  Leverage değerleri 0 ile 1 arasında değerler alabilmektedir (Field, 2009, s. 217). Centered leverage değerleri 0,02 den az olmalıdır (Akbulut, 2010, s. 69).
§  Bir gözlemin Mahalanobis uzaklığının büyük olması o gözlemin uç değer olduğuna işarettir (Field, 2009, s. 217). Bu ölçü için kritik değer belirlemek zor olsa da Barnett ve Lewis (1978) bir tablo yayınlayarak literatüre ışık tutmuştur (Aktaran, Field, 2009, s. 218). Farklı bir yöntem ise modele giren bağımsız değişken sayısının serbestlik derecesi ve anlamlılık düzeylerine göre hesaplanmış ki-kare ölçülerini kullanmaktır (Can, 2018, s. 283). Tablo değerine bakılarak Mahalanobis uzaklığının kritik değeri aşıp aşmadığı tespit edilebilir. Tabloya ulaşmak için tıklayınız. İkincil olarak, SPSS'de çoklu regresyon analizi sekmesinde modelinize dâhil ettiğiniz tüm bağımlı ve bağımsız değişkenler uygun bölümlere aktarılır ve ortaya çıkan save sekmesi mahalanobis değerlerini veri kısmına aktarmanıza yardımcı olur. Veri setinizde bulunan MAH_1 isimli yeni değişkeninizin anlamlılık düzeylerini yani bu uzaklıkların uç değer olup olmadığını tespit etmeniz gerekmektir. Bunun için SPSS'de Transform – compute variable kısmından yeni bir değişken oluşturarak  mahalanobis uzaklıklarının ki-kare dağılımında sapmalarını gösteren p değeri oluşturulur. Bu aşamada CDF.CHISQ(X1, X2) kodu kullanılır. X1 yerine mahalanobis uzaklık değişkeninin ismi yazılır (genellikle MAH_1). X2 kısmına kullanılan maddeler veya değişkenlerin (analize dâhil ettiğiniz değişkenler) sayısından bir eksiği yazılır (örneğin, 30 değişken analize dahil edilecek ise 30-1=29 X2 kısmına yazılmalıdır). Yeni eklenen değişken ki-kare dağılımının anlamlılık düzeylerini gösterir ve bu değerlerden ,001’in altında bulunan kişilerin/bireylerin verileri uç değer olarak tabir edilir. Veri setinden çıkartılması önerilir. Diğer bir yaklaşımda yine çoklu regresyon sekmesinden tüm değişkenleri ilgili yerlere aktarıp save sekmesinden mahalanobis uzaklık ölçülerini işaretleyerek MAH_1 değişkenini oluşturulur. Sonrasında SPSS'deki descriptive statistics-> Explore menusune girilir. Ekranda beliren dependent list kısmına MAH_1 değişkeni, factor list  kısmına ise modelimizdeki bağımlı değişken (Y) aktarılır. Buradan Plots sekmesi tıklanarak outliers kutusu işaretlenir ve analizin yapılması sağlanır. SPSS çıktısındaki extreme values tablosunda uç değerlere sahip gözlemler ortaya çıkar (Çokluk, Şekercioğlu ve Büyüköztürk, 2014, s. 28-29).
§  Mahalanobis , Leverange, Cook ölçüsü DFBeta, DFFit ve Covairance Ratio (CVR) etkili noktaların tespiti için kullanılır (influencial).
o   Uç değerler, model parametre tahmin sonuçlarının sapmasına, yalnız model kurmaya ve analiz sonuçlarının hatalı olarak yorumlanmasına sebep olabilmektedir (Field, 2009, s. 215; Güriş ve Astar, 2015, s. 344; Tabachnick ve Fidell, 2015, s. 124).
o   Saçılım grafiği ile tespit edilen uç değerler veri setinden silinebilir.

      ·         Hata terimlerinde otokorelasyon olmamalıdır (Field, 2009, s. 220; Güriş ve Astar, 2015, s. 353; Kalaycı, 2010, s. 259). Yani, herhangi iki veri noktasının hataları birbiriyle ilişkili çıkmamalıdır. Modele dâhil edilemeyen önemli değişkenlerin varlığı, ölçme hatalarının olması, eğrisel model yerine doğrusal modelin seçilmesi Hata terimlerinde otokorelasyona sebep olabilir (Güriş ve Astar, 2015, s. 354). Hataların arasında otokorelasyon olup olmadığını tespit etmek için yöntemler geliştirilmiştir ancak en çok bilineni Durbin Watson testidir.
o   Otokorelasyonun olmaması için Durbin Watson değeri 1,5 ile 2,5 arasında olması istenir (Kalaycı, 2010, s. 264). Field’e (2009, s. 221) göre 1’den küçük ve 3’ten büyük Durbin Watson değerleri problematik bir durumun göstergesidir.
o   SPSS ile hesaplanan Durbin Watson değeri otokorelasyonu hesaplamada her zaman güvenilir sonuçlar vermemektedir (Güriş ve Astar, 2015, s. 357).
o   Otokorelasyon tespit edildiği durumlarda uygulanacak yöntemlere ulaşmak için (Güriş ve Astar, 2015, s. 357) başvurunuz.
     ·         Hata terimlerinin varyansı sabit olmalıdır yani homoscedasticity sağlanmalıdır (Alpar, 2013, s. 529; Field, 2009, s. 220). Diğer bir ifade ile bağımlı değişkendeki hataların standart sapmaları birbirine benzer olmalıdır (Tabachnick ve Fidell, 2015, s. 127). Fox’a (1991) göre bağımlı değişken puanları etrafındaki hataların standart sapmaları 3 kat farklılık gösteremez (Aktaran, Tabachnick ve Fidell, 2015, s. 127). Grafik ile gösterimi aşağıdaki gibidir.

      ·         Hata terimlerinin ortalaması sıfırdır (Kalaycı, 2010, s. 259).
    ·     Hata terimleri ile bağımlı değişken arasındaki ilişki doğrusal olmalıdır (Tabachnick ve Fidell, 2015, s. 127).
o   Hata terimleri ve bağımlı değişken ile birlikte saçılım grafiği çizilir. Grafikteki noktalar dikdörtgen yerine eğri bir hal alıyorsa doğrusal ilişki söz konusu değildir (Tabachnick ve Fidell, 2015, s. 127). Bu durumda ya dönüşüm yapılarak doğrusal bir ilişki oluşturulur veya eğrisel regresyon modelleri kullanılır. Grafik ile gösterimi aşağıdaki gibidir.
                                 


     ·        Bağımsız değişkenlere ilişkin değerler sabittir (X’ler rassal değişken değildir) (Alpar, 2013, s. 474).

Çoklu doğrusal regresyon denklemi

Çoklu doğrusal regresyon modeline ilişkin denklem aşağıdaki gibidir.






Xi: bağımsız (yordayıcı, açıklayıcı, etkileyen) değişkenler
Y: bağımlı (yordanan, açıklanan, etkilenen)değişken
: bağımsız değişkenlere bağlı olarak hesaplanan bağımlı değişken değerleri
a: sabit terim (constant);
bi: regresyon katsayıları (regression coefficient);  i. Değişken dışındakiler sabit tutulduğu durumlarda i. Değişkende meydana gelen bir birimlik değişimin bağımlı değişkendeki yansıması, kısmi regresyon katsayısı
e: şansa bağlı hata terimi (bağımlı değişkendeki değişimin regresyon modeli ile açıklanamayan kısmı)

Çoklu regresyon analizine ait parametreler momentler, maksimum benzerlik ve en küçük kareler yöntemleri ile tahminlenebilir (Güriş ve Astar, 2015, s. 327).
Çoklu regresyon analizine dâhil edilen bağımsız değişkenlerin hepsinin aynı ölçme birimine sahip olmaması durumlarında regresyon denklemi standartlaştırılmış katsayılar ile oluşturulabilir. B regresyon katsayılarının standardize edilmiş hali beta olarak ifade edilir. Bu sayede en yüksek beta değerine sahip bağımsız değişkenin diğerlerinden daha önemli bir yordayıcı sonucu çıkartılabilir (Büyüköztürk, 2015, s. 99). Değişkenin modele katkısı ne kadar büyük ise beta katsayısı da o oranda büyük çıkacaktır (Alpar, 2016, s. 483).

Hipotez testi:
H0: β1= β2=…= βp=0     
Ha: en az bir β değeri sıfırdan farklıdır.
Anlamlılık düzeyi olarak 0,05 kabul edilir.
İstatistiksel analiz
Parametrelerinin anlamlılığı testi t-testi ile yapılır. Modelin tamamımın anlamlı olup olmadığını ise F testi ile test edilir.

Çoklu Korelasyon Katsayısı: Regresyon modelindeki bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin kuvvetini gösteren katsayıdır (Alpar, 2016, s. 480). R ile gösterilen bu değer 0 ile +1 arasında olabilir.

Determinasyon katsayısı (belirlilik katsayısı) : Bağımlı değişkendeki varyansın yüzde kaçının bağımsız değişkenler tarafından açıklandığını ortaya koymak için regresyon modeli ortaya konulabilir.  Diğer bir ifade ile Hipotetik modelin bağımlı değişkendeki değişimin ne kadarını açıkladığını tespit etmek için determinasyon katsayısına başvurulur. Eldeki verilerin regresyon doğrusuna uyumunu gösteren özet bir ölçü olarak da kullanılır (Akın, 2013, s. 237; Huck, 2012, s. 377). Çoklu doğrusal regresyon için “R2 “ olarak gösterilir ve 0 ile 1 arasında değerler alır (Alpar, 2016, s. 481).  R2 değeri 0 olduğunda veriler ile regresyon doğrusunun uyumunun olmadığını gösterir. Diğer taraftan, determinasyon katsayının 1 olduğu durumlarda mükemmel uyum vardır.  Bu sebepten, analizlerde toplam değişmenin açıklama oranının büyük olması beklenir (Alpar, 2016, s. 481; Güriş ve Astar, 2015, s. 300). Genellikle yüzde olarak ifade edildiğinden araştırmalarda sıkça bahsedilir ve bazı dergiler tarafından rapor edilmesi önerilir (Akbulut, 2010, s. 62).  Regresyon modelinin başarısının bir ölçüsü olarak determinasyon katsayısı kullanılabilir (Huck, 2012, s. 384). Ancak çoklu regresyon analizinde modele giren değişken sayısı arttıkça determinasyon katsayısı da artar. Bu sebepten çoklu doğrusal regresyon analizleri için düzeltilmiş R2 değerlerinin de rapor edilmesi beklenir (Kalaycı, 2010, s. 259). Düzeltilmiş R2 değeri evrene genellemeler yapılmak istendiği durumlarda ve farklı sayıdaki bağımsız değişkenlere ait modellerin karşılaştırılmasında ön plana çıkmaktadır (Alpar, 2013, s. 485; Can, 2018, s. 288). Özellikle R2 ile düzeltilmiş R2 değerlerinin birbirlerine yakın olması o regresyon modelinin genellenebilirliğinin yüksek olduğu sonucunu doğurur.

Kısmi-yarı korelasyon: Standardize değerler olan beta katsayıları değişkenlerin önemi hakkında bilgi verse de her bir bağımsız değişkenin tek başına bağımlı değişkendeki değişimin yüzde kaçını açıkladığını göstermez (Huck, 2012, s. 386). Her bir bağımsız değişkenin tek başına oluşturduğu etki için kısmi-yarı korelasyonlar hesaplanır ve “sr2” ile gösterilir.


Çoklu regresyon analizi türleri
Çoklu regresyonda modele dâhil edilecek bağımsız değişkenlerin hangileri olacağı ve hangi sıra ile modele girecekleri önemli bir noktadır. Bu sebepten farklı yöntemler ortaya atılmıştır.
    1.      Standart /eş zamanlı (simetenous) çoklu regresyon analizi: regresyon modeline bağımsız değişkenlerin hepsinin anlamlı katkıları göz edilmeksizin dâhil edildiği analiz türüdür (Büyüköztürk, 2015, s. 99; Huck, 2012, s. 382). Modele dâhil edilen bağımsız değişkenlerin birbirinden üstünlüğü veya önceliği düşünülmüyorsa eş zamanlı yöntemi tercih edilebilir (Kalaycı, 2010, s. 260). Bu analiz türünde yordayıcı değişkenlerin hepsinin blok halinde yordanan değişkeni açıklamadaki ortak etkileri aynı anda görülebilir (Akbulut, 2010, s. 67; Can, 2018, s. 274). Eş zamanlı regresyon analizi teorilerin test edilmesinde etkili bir yöntem olarak bilinir (Studenmund ve Cassidy, 1987, aktaran Field, 2009, s. 212). Standart regresyon analizinde yalnızca bir adet R2 değeri hesaplanır.
     2.      Aşamalı / adım adım (stepwise) çoklu regresyon analizi: Bu analiz türünde bağımsız değişkenlerden yalnızca bağımlı değişkeni anlamlı düzeyde yordayan değişkenler modele adım adım alınır (Alpar, 2016, s. 480). Burada amaç değişkenleri tek tek ekleyerek veya çıkartarak bağımlı değişkeni en iyi açıklayan modeli oluşturmaktır (Güriş ve Astar, 2015, s. 341). Aşamalı çoklu regresyon analizinde hangi değişkenlerin modele gireceği bilgisayar tarafından belirlenir (Huck, 2012, s. 382). İleri doğru (değişken ekleme; forward) ve Geriye doğru (değişken eleme; Backward) olmak üzere iki alt türe ayrılır. Forward yönteminde ilk model sabit değişken ile kurulur (Model 0) ve sonrasında modele dâhil edilen ilk bağımsız değişken bağımlı değişken ile en yüksek derecede bağıntıya sahip olandır (Akbulut, 2010, s. 67; Field, 2009, s. 212). Geriye kalan değişkenlerden yine bağımsız değişken ile en yüksek ilişkiye sahip olan ikinci olarak modele sokulur. Bu şekilde hiçbir değişken kalmayana kadar devam edilir. Backward yönteminde ise tam tersi işlem yapılır. Öncelikle tüm bağımsız değişkenler modele atılır ve sonrasında bağımlı değişken ile bağıntısı en az olan değişkenden başlayarak tüm önemsiz değişkenler teker teker modelden çıkartılır (Akbulut, 2010, s. 67; Kalaycı, 2010, s. 260). Araştırmanızda aşamalı çoklu regresyon analizine karar verdiyseniz geriye doğru yöntemini tercih etmeniz Tip 2 II hata yapma ihtimalini azaltır ve bastırıcı etki (suppressor effects) oluşmasını engeller (Field, 2009, s. 213). Aşamalı regresyon analizlerinde birden çok determinasyon katsayısı (R2) hesaplanır.

    3.      Hiyerarşik/ardışık  (hierarcical) çoklu regresyon analizi: Regresyon modeline girecek bağımsız değişkenlerin sırasına araştırmacının kendisinin karar verdiği araştırma türüdür (Field, 2009, s. 212). Araştırmacının dayandığı kuram veya kuramlar yardımıyla değişkenlerin hiyerarşik regresyona sokulma sıraları belirlenir (Akbulut, 2010, s. 67). Aynı zamanda bu yöntem ile araştırmacı istediği değişkenin etkisini kontrol altına alarak diğer değişkenlerin bağımlı değişken üzerindeki etkisini tespit etmek isteyebilir (Can, 2018, s. 274).

Etki büyüklüğü
Çoklu regresyon analizinde etki büyüklüğü veya f2 değerleri ile tespit edilir. f2 katsayısı aşağıdaki gibi hesaplanır.





R2 değerinin yorumlanması (Alpar, 2016, s. 494)
R2
Etki
0,02
Küçük
0,13
Orta
0,26
Büyük

f2 değerinin yorumlanması (Alpar, 2016, s. 494)
f2
Etki
0,02
Küçük
0,15
Orta
0,35
Büyük


Örnek: Lisansüstü eğitim programı olan yüksek lisans öğrencisi seçmek isteyen yönetim, öğrencilerin lisans diploma notu, ALES puanı ve yabancı dil sınavı puanı yardımıyla başarılı öğrencilerin seçimini yapmak istiyor. Bağımlı değişkenin yüksek lisans genel not ortalaması ve bağımsız değişkenlerin lisans diploma notu, ALES puanı ve YDS puanı olduğu bir çoklu regresyon modeli kurulmalıdır.

Örnek: Bir araştırmacı çalıştığı lise öğretmenlerinin iş memnuniyet düzeylerinin örgütsel iklim ve algılanan örgütsel destek tarafından yordanıp yordanmadığını merak etmektedir. Bu doğrultuda iş memnuniyet düzeylerinin bağımlı değişken, örgütsel iklim, algılanan örgütsel destek düzeylerinin bağımsız değişkenler olduğu bir çoklu regresyon modeli kuruyor.
Veri setine ulaşmak için tıklayınız.

SPSS Uygulaması

SPSS de varsayım kontrolü: Analyze sekmesindeki Regression kısmından linear regression e tıklanır. Açılan Linear regression penceresinde plots butonu tıklanır. Bu pencerede ise X eksenine ZPRED, Y eksenine ZRESID atanır. Bu grafik ile homoscedasticity ve hataların varsayımları kontrol edilebilir (Field, 2009, s. 229). Y eksenine SRESID ve X eksenine ZPRED atılarak oluşturulan grafiği ise eş varyanslılık tespit edilebilir. Standardized residual plots kısmındaki histogram ve normal probability plot sekmeleri tıklanır. Continue ve OK tuşuna basılarak analiz yapılır.



SPSS’de Standart Regresyon Analizi: Linear regression penceresinde dependent kısmına bağımlı değişkeni, independents kısmına bağımlı değişkenleri atılır. Method sekmesi açılarak enter seçilir. Statistics butonunu tıklandığında model fit, R squared change, desciptives, part and partial correlations, collinearity diagnostics ve estimates kısımları tıklanıp continue butonuna basılır.



SPSS çıktı sonuçlarına aşağıdaki sunulardan ulaşabilirsiniz. 




Sonuçların Yorumlanması

Sonuçların yorumlanabilmesi için öncelikle çıktı ekranındaki ANOVA tablosuna bakılmalıdır. Bu tablodaki F değerinin anlamlı olması demek (p < ,05) kurulan modelin anlamlı olması demektir. Modelin anlamlılığı test edildikten sonra bakılması gereken tablo coefficients tablosudur. Bu tabloda bağımsız değişkenlerin modele katkısının anlamlılığına bakılmaktadır. Değişkenlere ait t-testi sonuçlarının istatistiksel olarak anlamlı olması (p < ,05) o değişkenin bağımlı değişken için anlamlı bir yordayıcı olduğunu desteklemektedir.  Coefficients tablosundaki beta değerleri kullanılarak yordayıcı değişkenlerin yordanan (bağımlı) değişken üzerindeki göreli önem sırasını tespit edilebilir. SPSS çıktısındaki tablolar yorumlandıktan sonra bulunan sonuçlar aşağıdaki biçimde raporlanabilir. 

Örgütsel iklim ve örgütsel destek değişkenlerine göre iş memnuniyetinin yordanmasına ilişkin çoklu regresyon analizi sonuçları Tablo da verilmiştir. Bu tablodaki çoklu regresyon analizi sonuçlarına göre örgütsel iklim ve örgütsel destek değişkenleri iş memnuniyetini yordadığı model istatistiksel olarak anlamlı bulunmuştur (F(236,3)= 222,06 , p < ,05). Ayrıca lise öğretmenlerinin örgütsel iklim ve örgütsel destek düzeylerinin iş memnuniyetlerini anlamlı olarak yordadığı tespit edilmiştir. Standardize edilmiş regresyon katsayıları (β) incelendiğinde örgütsel iklim örgütsel destek değişkenine göre daha önemli bir değişkendir. Son olarak, bu iki bağımsız değişken birlikte iş memnuniyetindeki toplam varyansın yaklaşık %74’ünü açıklamaktadır.
Çoklu regresyon analizi sonuçlarına göre iş memnuniyetinin yordanmasına ilişkin regresyon denklemi aşağıda verilmiştir.

İŞ MEMNUNİYET’ = 5,77 + 2,05 ÖRGÜTSEL_İKLİM + 1,72 ÖRGÜTSEL_DESTEK 


Aşamalı Regresyon Analizinin SPSS uygulaması

Linear regression penceresinde dependent kısmına bağımlı değişkeni, independents kısmına bağımlı değişkenleri atılır. Method sekmesi açılarak stepwise seçilir. Statistics butonunu tıklandığında model fit, desciptives, part and partial correlations, collinearity diagnostics ve estimates kısımları tıklanıp continue butonuna basılır.



Sonuçların Raporlanması

Tablo

Örgütsel iklim ve örgütsel desteğin iş memnuniyetinin yordandığı çoklu regresyon analizi sonuçları

Değişkenler
B
SE B
β
t
p
Sabit
5,77
2,45

2,35
,02
Örgütsel iklim
2,05
,14
,50
15,03
,00
Örgütsel destek
1,72
,16
,38
10,52
,00
Not. R= ,86 , R2= ,74     , F(236,3)=222,06  , p < ,05

Not: Yukarıdaki tablo APA 6 stiline göre hazırlanmıştır. Bu tabloya ulaşmak için tıklayınız.

UYARI: Regresyon modelinin anlamlı olduğu ancak katsayıların her birinin anlamsız çıktığı durumlarda nasıl yorum yapılır! Genellikle çoklubağlantılık durumlarında F testi anlamlı iken t testinin biri veya birkaçı anlamsız çıkabilmektedir (Alpar, 2016, s. 482; Güriş ve Astar, 2015, s. 364). Bu sebepten varsayımların kontrol edilmesi önemlidir.

Kukla değişkenli regresyon modelleri hakkında bilgiye ulaşmak için Güriş ve Astar (2015, s. 385) kaynağına başvurabilirsiniz.

UYARI: Çoklu doğrusal regresyon analizi sonucunda istatistiksel olarak anlamlı bulunan modelleri neden-sonuç ilişkisi biçiminde yorumlayamayız.  Bağımlı ve bağımsız değişkenler arasında kuvvetli ilişkiler bulunsa da bu ilişki bağımsız değişkenlerin bağımlı değişkene sebep olduğu sonucuna karşılık gelmez (Alpar, 2013, s. 420).

Özet
        1.      Kavramsal ve kuramsal temellere dayanarak bağımlı değişken ve bağımsız değişkenler tespit edilir.
        2.      Bağımlı ve bağımsız değişkenler ölçme hatalarından arındırılır.
        3.      Gerekli örneklem sayısı belirlenir (bağımsız değişken sayısı (p)X 10 ya da 50 + 8p).
        4.      Kayıp veri kontrolü yapılır.
        5.      Artıkların bağımsızlığı, normalliği, doğrusallığı ve eşvaryansılığı test edilir.
        6.      Tek değişkenli ve çok değişkenli uç değerlerin varlığı kontrol edilir.
        7.      Çoklu birliktelik (bağlantılılık) ve tekillik olmadığı ispatlanır.
        8.      Ana analizler yapılır.
a.      Çoklu R2 ve düzeltilmiş R2 raporlanır
b.      Modelin manidarlığı gösterilir. 
c.      Regresyon katsayılarının  manidarlığı tablo haline getirilir.
d.      Yarı kısmi korelasyonların karesinden bahsedilir. 
        9.      Standartlaştırılmış beta katsayıları ve güven aralıkları hesaplanır.
      10.  Yordama denklemi oluşturulur.


Kaynakça

Akbulut, Y. (2010). Sosyal bilimlerde SPSS uygulamaları: Sık kullanılan istatistiksel analizler ve açıklamalı SPSS çözümleri. İstanbul: İdeal Kültür Yayıncılık.

Alpar, R. (2016). Uygulamalı çok değişkenli istatistiksel yöntemler. Ankara: Detay Yayıncılık.

Büyüköztürk, Ş. (2015). Sosyal bilimler için veri analizi el kitabı: İstatistik, araştırma deseni. Ankara: Pegem Yayıncılık.

Can, A. (2018). SPSS ile bilimsel araştırma sürecinde nicel veri analizi. Ankara: Pegem Yayıncılık.

Çokluk, Ö., Şekercioğlu, G., & Büyüköztürk, Ş. (2014). Sosyal bilimler için çok değişkenli istatistik: SPSS ve LISREL uygulamaları. Ankara: Pegem Akademi.

Field, A. (2009). Discovering statistics using SPSS. Thousand Oaks, CA: Sage.

Güriş, S., & Astar, M. (2015). Bilimsel araştırmalarda SPSS ile istatistik. İstanbul: Der Yayınları.

Huck, S. W. (2012). Reading statistics and research. New York, NY: Pearson.

Kalaycı, Ş. (2010). SPSS uygulamalı çok değişkenli istatistik teknikleri. Ankara: Asil Yayın Dağıtım.

Özdamar, K. (2013). Paket programlar ile istatistiksel veri analizi-1: SPSS-MINITAB. Eskişehir: Nisan Kitapevi.

Pallant, J. (2001). SPSS Survival Guide: A step by step guide to data analysis using SPSS. Australia: Allen & Unwin.

Salkind, N. (2015). İstatistikten nefret edenler için istatistik. Ankara: Pegem Akademi.

Tabachnick, B. G., & Fidell, L. S. (2015). Çok değişkenli istatistiklerin kullanımı (Çev. Ed. M. Baloğlu). Ankara: Nobel Akademik.





Çoklu regresyon konusundaki internetteki kaynaklar:
https://acikders.ankara.edu.tr/pluginfile.php/233/mod_resource/content/4/11-Coklu%20Regresyon.pdf

Bu metine atıfta bulunmak için: Karakaya Özyer, K. (2019). Çoklu Doğrusal Regresyon [Blog]. Retrieved 24 June 2022, from https://nicelanalizlericindesteksistemi.blogspot.com/.