Çoklu doğrusal regresyon (Multiple
regression analysis)
Bu bölümde neler var?
1. Bölüm: Çoklu doğrusal regresyon nedir?2. Bölüm: Varsayımlar
3. Bölüm: Çoklu doğrusal regresyon denklemi
4. Bölüm: Hipotez testi
5. Bölüm: Çoklu Korelasyon Katsayısı
6. Bölüm: Determinasyon katsayısı
7. Bölüm: Kısmi-yarı korelasyon katsayısı
8. Bölüm: Standart /eş zamanlı (simetenous) çoklu regresyon analizi
9. Bölüm: Aşamalı / adım adım (stepwise) çoklu regresyon analizi
10. Bölüm: Hiyerarşik/ardışık (hierarcical) çoklu regresyon analizi
11. Bölüm: Etki büyüklüğü
12. Bölüm: Örnek
13. Bölüm: SPSS Uygulaması
14. Bölüm: Sonuçların Yorumlanması
15. Bölüm: Sonuçların Raporlanması
16. Bölüm: Özet
17. Bölüm: Kaynakça
18. Bölüm: Ek kaynaklar
Çoklu
regresyon analizinin amaçları:
·
Birden fazla
bağımsız değişkenin yordadığı bağımlı değişken ile birlikte bir model
oluşturmak (Can, 2018, s. 273),
·
Bağımlı
değişken üzerinde etkisi olduğu düşünülen bağımsız değişkenlerin etkileme gücü
ve derecelerini tespit etmek (Alpar, 2016, s. 477; Can, 2018, s. 273),
·
Bağımlı
değişken ile bağımsız değişkenler arasındaki açıklayıcılık-determinasyon
katsayısını hesaplamak (Alpar, 2016, s. 477),
·
Bağımsız
değişkenler yardımıyla bilinmeyen bağımlı değişken değerleri hakkında kestirim
yapmak (Alpar, 2016, s. 477),
· Toplanan
verinin özetlenmesini sağlamaktır (Alpar, 2016, s. 477).
Uyarı: Çoklu regresyon analizinin parametre
hesaplamalarında farklı teknikler kullanılabilir. Ancak en çok tercih edileni
En küçük Kareler (Least Squares ) yöntemidir. Aşağıdaki varsayımlar en küçük kareler yönteminin uygulanması için
gereklidir. Başka tahminleme yöntemleri farklı varsayımları gerektirebilir.
·
Bağımlı
Değişken sayısal olmalı (Alpar,
2016, s. 477; Büyüköztürk, 2015, s. 98; Can, 2018, s. 275; Field, 2009, s.
220), bağımsız değişkenler sürekli, kesikli ya da niteliksel olabilir (Alpar,
2016, s. 477).
·
Bağımsız
değişkenler ile bağımlı değişken arasında doğrusal
bir ilişki olmalı (Akbulut, 2010, s. 66; Alpar, 2016, s. 480; Büyüköztürk, 2015, s. 98; Can, 2018, s. 275;
Field, 2009, s. 221; Salkind, 2015, s. 280). Bağımsız değişkenler ile bağımlı
değişkenler arasındaki ilişki katsayısı en az 0,30 olmalıdır (Pallant, 2001, s.
143). Bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki bulunamadığı
takdirde hesaplanan çoklu doğrusal regresyon değerleri yanlı olacaktır veya
hesaplanamayacaktır. Bu sorundan kurtulmak için eğrisel regresyon modelleri
tercih edilebilir.
· Örneklem
büyüklüğü tahmin edilen parametrelerden yeterli düzeyde yüksek olmalıdır (Güriş
ve Astar, 2015, s. 327). Bu ölçütü belirlemek için farklı kaynaklar farklı
durumları gösterse de N > 50+ 8X (X bağımsız değişken sayısı) kriteri kabul
edilebilir (Tabachnick ve Fidell, 2015, s. 123). Cohen ve Cohen (1983)’e göre
bağımsız değişken sayısının 5 katı kadar örneklem büyüklüğü alınmalıdır. İdeal
olarak bağımsız değişken sayısının 20 katı kadar örneklem büyüklüğü söylense de
en az 5 katı kadar gözleme ulaşılması beklenir (Alpar, 2016, s. 480). Green
(1991) e göre yalnızca modelin veri ile uyumuna bakılmak isteniyorsa 50+8X (x
bağımsız değişken sayısı), regresyon katsayılarının anlamlılığı kontrol edilmek
isteniyorsa 104+ X (x bağımsız değişken sayısı) formülleri kullanarak örneklem
büyüklüğü hesaplanır (Aktaran; Field, 2009, s. 222; Tabachnick ve Fidell, 2015,
s. 123). Özellikle adımsal regresyon analizinin tercih edileceği araştırmalarda
bağımsız değişken sayısının en az 40 katı gözleme sahip olunması tavsiye edilir
(Tabachnick ve Fidell, 2015, s. 124). Örneklem büyüklüğünü hesaplayan
programlar olan GPOWER, SPSS Sample Power ve PASS kullanılabilir. Çoklu
regresyon analizi için yeterli örneklem büyüklüğüne ulaşılmadığı takdirde
regresyon katsayılarının anlamlılığı testleri doğru işlemeyebilir ve sonucunda
Tip I ve Tip II hataların arttığı gözlemlenebilir.
·
Bağımsız
değişkenler kendi aralarında çoklu bağlantılılık (çoklu bağıntı, multicolinearity) olmamalı (Akbulut,
2010, s. 66; Alpar, 2016, s. 480; Büyüköztürk, 2015, s. 100; Can, 2018, s. 275;
Field, 2009, s. 220; Güriş ve Astar, 2015, s. 327; Özdamar, 2013, s. 175;
Salkind, 2015, s. 280). Çoklu bağlantılılık bağımsız değişkenler arasında
yüksek miktarda ilişkinin olduğu durumlarda ortaya çıkmaktadır.
o
Çoklu
bağlantılık durumunu tespit etmek için farklı yöntemler geliştirilmiştir.
§
Bağımsız
değişkenler arasındaki korelasyon katsayısı 0,90 ve üzeri olmamalıdır
(Büyüköztürk, 2015, s. 100; Pallant, 2007, s. 156). Bu değeri 0,80 olarak alan
bazı araştırmacılar da mevcuttur (Alpar, 2016, s. 481; Field, 2009, s. 224;
Kalaycı, 2010, s. 267). Bu sebepten bağımsız değişkenler arasındaki korelasyon
matrisinin incelenmesi ve 0,80 ve üstü olan değerlerin gözden geçirilmesi çoklu
bağlantılılık ihtimalini azaltmak için gerekmektedir.
§
Varyans büyütme
faktörü (VIF: variance inflation factor)değeri 10’dan düşük olmalı (Alpar,
2016, s. 481; Büyüköztürk, 2015, s. 100; Field, 2009, s. 224). VIF değeri 5’ten
küçük çıktığı durumlarda çoklu bağlantılılık önemli değildir (Güriş ve Astar,
2015, s. 365). Çoklu bağımlılık tespit edildiği takdirde bağlılık olan
değişkenlerden biri veya bir kaçı modelden çıkartılır.
§ VIF değerine yakın olan tolerans değeri de çoklu bağlantılılığı tespit etmek için kullanılabilir. Tolerans değerlerinin (1/VIF) 0,1’in altında olması çoklu bağlantılılık durumunun varlığı için bir işarettir (Field, 2009, s. 224).
§
Durum
indeksleri (Condition indicies) değerinin 30’dan küçük olmalı (Büyüköztürk, 2015,
s. 100).
o
Çoklu
bağlantılılık regresyon katsayısının tahmininde sapmalara, determinasyon
katsayısının küçülmesine sebep olabilmektedir (Field, 2009, s. 224). Özellikle
korelasyon katsayısı 0,90’ın üzerinde olan durumlarda regresyon katsayılarının
standart hataları ikiye katlanabilir ve dolayısıyla katsayıların anlamlılığı
testleri manidar çıkmayabilir (Berry, 1993; Aktaran Tabachnick ve Fidell, 2015,
s. 125).
o
Çoklu
bağlantılılıktan şüpheleniyorsa bu durumda değişkenlerden biri ya da birkaçı
silinebilir. Hangi değişkenlerin modelden çıkartılacağına kuramsal temeller
karar verir (Tabachnick ve Fidell, 2015, s. 125). Eğer hiçbir değişkenin
silinmesini uygun görmüyorsanız ridge (sırt) regresyon analizine
yönelebilirsiniz. Ridge regresyon hakkında daha fazla bilgi için tıklayınız.
Çoklu bağlantılılık tespit edildiği durumlarda yapılması gerekenler için Alpar
(2013, s. 544-545) kitabına başvurabilirsiniz.
·
Hata terimleri
(residuals, artık değerler = gerçek bağımlı değişken değerleri ile modelin
tahminlediği değerler arasındaki fark) normal dağılım göstermeli (Alpar, 2016,
s. 482; Can, 2018, s. 275; Field, 2009, s. 221; Tabachnick ve Fidell, 2015, s. 125).
Artıklar standartlaştırılmış, standartlaştırılmamış ve studentleştirilmiş olmak
üzere üç gruba ayrılır. Bağımlı değişken ile artıkların (hataların) beraber
saçılım grafiğinin çizildiğinde hata terimleri bağımlı değişken ile yatay çizgi
ilişkisi göstermeli ve dikdörtgen biçiminde olmalıdır (Tabachnick ve Fidell,
2015, s. 125). Diğer bir ifade ile
artıklar merkezden simetrik bir biçimde ayrılmalılardır ve simetriden
ayrılmalar artıkların normal dağılım sağlamadığını gösterir (Tabachnick ve
Fidell, 2015, s. 127). Grafik ile gösterimi aşağıdaki gibidir.
o
Standartlaştırılmış bağımlı değişken değerler (ZPRED) ile
standartlaştırılmış artık değerlerin(ZRESİD) saçılım grafiği çizilir (Can,
2018, s. 275).
·
Değişkenlerin
kendi içlerinde uç değerleri olmamalıdır (Akbulut, 2010, s. 69; Alpar, 2016, s.
480; Büyüköztürk, 2015, s. 98). Tek
değişkenli ve çok değişkenli aykırı gözlemlerin varlığı tespit edilmelidir
(Alpar, 2016, s. 482). Aşırı değerlerin tespit edilmesinde farklı yöntemler
kullanılmaktadır.
o
Tek değişkenli
sapkın değerleri bulmak için frekans değerlerine bakılabilir.
§
Bunu tespit
etmek için standartlaştırılmış artık değerlerinden yararlanılır.
Standartlaştırılmış Artık değerlerin (residuals) genellikle -3 ile +3 arasında değer almaları beklenir
(Field, 2009, s. 216; Tabacknick ve Fidel, 1996).
o
Çok değişkenli
uç değerlerin varlığını tespit etmek için Cook uzaklığı, Centered Leverage
değerleri ve her bir katılımcı için hesaplanan Mahalanobis uzaklığı değerleri
kontrol edilmelidir (Akbulut, 2010, s. 69).
§
Cook’s D ölçüsü
gözlemlerden birinin silinmesi durumunda tahminlenen modeldeki katsayılara
etkisini gösterir (Güriş ve Astar, 2015, s. 348). Cook’s D uzaklığı 1 den fazla olmamalıdır
(Akbulut, 2010, s. 69; Cook ve Weisberg, 1982; Aktaran Field, 2009, s. 217)
diyen kaynakların yanı sıra hesaplanan değerin Fα,m,n-m kritik değerini aşmaması beklenir (Güriş ve Astar, 2015, s. 349). Genelde Cook değerleri hesaplanan gözlemler
karşılaştırılarak aynı olmayan gözlemler incelenmelidir (Alpar, 2013, s. 513).
§
Leverage
değerleri 0 ile 1 arasında değerler alabilmektedir (Field, 2009, s. 217).
Centered leverage değerleri 0,02 den az olmalıdır (Akbulut, 2010, s. 69).
§
Bir gözlemin
Mahalanobis uzaklığının büyük olması o gözlemin uç değer olduğuna işarettir
(Field, 2009, s. 217). Bu ölçü için kritik değer belirlemek zor olsa da Barnett
ve Lewis (1978) bir tablo yayınlayarak literatüre ışık tutmuştur (Aktaran, Field,
2009, s. 218). Farklı bir yöntem ise modele giren bağımsız değişken sayısının
serbestlik derecesi ve anlamlılık düzeylerine göre hesaplanmış ki-kare
ölçülerini kullanmaktır (Can, 2018, s. 283). Tablo değerine bakılarak
Mahalanobis uzaklığının kritik değeri aşıp aşmadığı tespit edilebilir. Tabloya
ulaşmak için tıklayınız. İkincil olarak, SPSS'de çoklu regresyon analizi
sekmesinde modelinize dâhil ettiğiniz tüm bağımlı ve bağımsız değişkenler uygun
bölümlere aktarılır ve ortaya çıkan save sekmesi mahalanobis değerlerini veri kısmına aktarmanıza yardımcı olur.
Veri setinizde bulunan MAH_1 isimli yeni değişkeninizin anlamlılık düzeylerini
yani bu uzaklıkların uç değer olup olmadığını tespit etmeniz gerekmektir. Bunun
için SPSS'de Transform – compute variable kısmından
yeni bir değişken oluşturarak mahalanobis uzaklıklarının ki-kare
dağılımında sapmalarını gösteren p değeri oluşturulur. Bu aşamada CDF.CHISQ(X1, X2) kodu kullanılır. X1
yerine mahalanobis uzaklık değişkeninin ismi yazılır (genellikle MAH_1). X2
kısmına kullanılan maddeler veya değişkenlerin (analize dâhil ettiğiniz
değişkenler) sayısından bir eksiği yazılır (örneğin, 30 değişken analize dahil
edilecek ise 30-1=29 X2 kısmına yazılmalıdır). Yeni
eklenen değişken ki-kare dağılımının anlamlılık düzeylerini gösterir ve bu
değerlerden ,001’in altında bulunan kişilerin/bireylerin verileri uç değer
olarak tabir edilir. Veri setinden çıkartılması önerilir. Diğer bir yaklaşımda
yine çoklu regresyon sekmesinden tüm değişkenleri ilgili yerlere aktarıp save sekmesinden mahalanobis uzaklık
ölçülerini işaretleyerek MAH_1 değişkenini oluşturulur. Sonrasında SPSS'deki descriptive statistics-> Explore
menusune girilir. Ekranda beliren dependent
list kısmına MAH_1 değişkeni, factor
list kısmına ise modelimizdeki bağımlı değişken (Y) aktarılır.
Buradan Plots sekmesi tıklanarak outliers kutusu işaretlenir ve analizin
yapılması sağlanır. SPSS çıktısındaki extreme
values tablosunda uç değerlere sahip gözlemler ortaya çıkar (Çokluk,
Şekercioğlu ve Büyüköztürk, 2014, s. 28-29).
§
Mahalanobis ,
Leverange, Cook ölçüsü DFBeta, DFFit ve Covairance Ratio (CVR) etkili
noktaların tespiti için kullanılır (influencial).
o
Uç değerler,
model parametre tahmin sonuçlarının sapmasına, yalnız model kurmaya ve analiz
sonuçlarının hatalı olarak yorumlanmasına sebep olabilmektedir (Field, 2009, s.
215; Güriş ve Astar, 2015, s. 344; Tabachnick ve Fidell, 2015, s. 124).
o
Saçılım grafiği
ile tespit edilen uç değerler veri setinden silinebilir.
·
Hata terimlerinde
otokorelasyon olmamalıdır (Field, 2009, s. 220; Güriş ve Astar, 2015, s. 353;
Kalaycı, 2010, s. 259). Yani, herhangi iki veri noktasının hataları birbiriyle
ilişkili çıkmamalıdır. Modele dâhil edilemeyen önemli değişkenlerin varlığı,
ölçme hatalarının olması, eğrisel model yerine doğrusal modelin seçilmesi Hata
terimlerinde otokorelasyona sebep olabilir (Güriş ve Astar, 2015, s. 354).
Hataların arasında otokorelasyon olup olmadığını tespit etmek için yöntemler
geliştirilmiştir ancak en çok bilineni Durbin Watson testidir.
o
Otokorelasyonun
olmaması için Durbin Watson değeri 1,5 ile 2,5 arasında olması istenir
(Kalaycı, 2010, s. 264). Field’e (2009, s. 221) göre 1’den küçük ve 3’ten büyük
Durbin Watson değerleri problematik bir durumun göstergesidir.
o
SPSS ile
hesaplanan Durbin Watson değeri otokorelasyonu hesaplamada her zaman güvenilir
sonuçlar vermemektedir (Güriş ve Astar, 2015, s. 357).
o
Otokorelasyon
tespit edildiği durumlarda uygulanacak yöntemlere ulaşmak için (Güriş ve Astar,
2015, s. 357) başvurunuz.
·
Hata
terimlerinin varyansı sabit olmalıdır yani homoscedasticity sağlanmalıdır
(Alpar, 2013, s. 529; Field, 2009, s. 220). Diğer bir ifade ile bağımlı
değişkendeki hataların standart sapmaları birbirine benzer olmalıdır (Tabachnick
ve Fidell, 2015, s. 127). Fox’a (1991) göre bağımlı değişken puanları
etrafındaki hataların standart sapmaları 3 kat farklılık gösteremez (Aktaran, Tabachnick
ve Fidell, 2015, s. 127). Grafik ile gösterimi aşağıdaki gibidir.
·
Hata
terimlerinin ortalaması sıfırdır (Kalaycı, 2010, s. 259).
· Hata terimleri
ile bağımlı değişken arasındaki ilişki doğrusal olmalıdır (Tabachnick ve
Fidell, 2015, s. 127).
o
Hata terimleri
ve bağımlı değişken ile birlikte saçılım grafiği çizilir. Grafikteki noktalar
dikdörtgen yerine eğri bir hal alıyorsa doğrusal ilişki söz konusu değildir (Tabachnick
ve Fidell, 2015, s. 127). Bu durumda ya dönüşüm yapılarak doğrusal bir ilişki
oluşturulur veya eğrisel regresyon modelleri kullanılır. Grafik ile gösterimi aşağıdaki gibidir.


· Bağımsız
değişkenlere ilişkin değerler sabittir (X’ler rassal değişken değildir) (Alpar,
2013, s. 474).
Xi: bağımsız
(yordayıcı, açıklayıcı, etkileyen) değişkenler
Y: bağımlı (yordanan,
açıklanan, etkilenen)değişken
a: sabit terim
(constant);
bi:
regresyon katsayıları (regression coefficient);
i. Değişken dışındakiler sabit tutulduğu durumlarda i. Değişkende
meydana gelen bir birimlik değişimin bağımlı değişkendeki yansıması, kısmi
regresyon katsayısı
e: şansa bağlı hata
terimi (bağımlı değişkendeki değişimin regresyon modeli ile açıklanamayan
kısmı)
Çoklu regresyon analizine ait parametreler
momentler, maksimum benzerlik ve en küçük kareler yöntemleri ile
tahminlenebilir (Güriş ve Astar, 2015, s. 327).
Çoklu regresyon analizine dâhil edilen bağımsız
değişkenlerin hepsinin aynı ölçme birimine sahip olmaması durumlarında
regresyon denklemi standartlaştırılmış katsayılar ile oluşturulabilir. B
regresyon katsayılarının standardize edilmiş hali beta olarak ifade edilir. Bu
sayede en yüksek beta değerine sahip bağımsız değişkenin diğerlerinden daha
önemli bir yordayıcı sonucu çıkartılabilir (Büyüköztürk, 2015, s. 99).
Değişkenin modele katkısı ne kadar büyük ise beta katsayısı da o oranda büyük
çıkacaktır (Alpar, 2016, s. 483).
H0: β1= β2=…= βp=0
Ha: en az bir β değeri sıfırdan farklıdır.
Anlamlılık düzeyi olarak
0,05 kabul edilir.
İstatistiksel analiz
Parametrelerinin
anlamlılığı testi t-testi ile yapılır. Modelin tamamımın anlamlı olup olmadığını
ise F testi ile test edilir.
Çoklu Korelasyon Katsayısı: Regresyon modelindeki bağımlı değişken ile bağımsız
değişkenler arasındaki ilişkinin kuvvetini gösteren katsayıdır (Alpar, 2016, s.
480). R ile gösterilen bu değer 0 ile +1 arasında olabilir.
Determinasyon katsayısı (belirlilik
katsayısı) : Bağımlı değişkendeki
varyansın yüzde kaçının bağımsız değişkenler tarafından açıklandığını ortaya
koymak için regresyon modeli ortaya konulabilir. Diğer bir ifade ile Hipotetik modelin bağımlı
değişkendeki değişimin ne kadarını açıkladığını tespit etmek için determinasyon
katsayısına başvurulur. Eldeki verilerin regresyon doğrusuna uyumunu gösteren
özet bir ölçü olarak da kullanılır (Akın, 2013, s. 237; Huck, 2012, s. 377).
Çoklu doğrusal regresyon için “R2 “ olarak gösterilir ve 0 ile 1
arasında değerler alır (Alpar, 2016, s. 481).
R2 değeri 0 olduğunda veriler ile regresyon doğrusunun
uyumunun olmadığını gösterir. Diğer taraftan, determinasyon katsayının 1 olduğu
durumlarda mükemmel uyum vardır. Bu
sebepten, analizlerde toplam değişmenin açıklama oranının büyük olması beklenir
(Alpar, 2016, s. 481; Güriş ve Astar, 2015, s. 300). Genellikle yüzde olarak
ifade edildiğinden araştırmalarda sıkça bahsedilir ve bazı dergiler tarafından
rapor edilmesi önerilir (Akbulut, 2010, s. 62). Regresyon modelinin başarısının bir ölçüsü
olarak determinasyon katsayısı kullanılabilir (Huck, 2012, s. 384). Ancak çoklu
regresyon analizinde modele giren değişken sayısı arttıkça determinasyon
katsayısı da artar. Bu sebepten çoklu doğrusal regresyon analizleri için düzeltilmiş R2 değerlerinin
de rapor edilmesi beklenir (Kalaycı, 2010, s. 259). Düzeltilmiş R2
değeri evrene genellemeler yapılmak istendiği durumlarda ve farklı sayıdaki
bağımsız değişkenlere ait modellerin karşılaştırılmasında ön plana çıkmaktadır
(Alpar, 2013, s. 485; Can, 2018, s. 288). Özellikle R2 ile
düzeltilmiş R2 değerlerinin birbirlerine yakın olması o regresyon
modelinin genellenebilirliğinin yüksek olduğu sonucunu doğurur.
Kısmi-yarı korelasyon: Standardize değerler olan beta katsayıları
değişkenlerin önemi hakkında bilgi verse de her bir bağımsız değişkenin tek
başına bağımlı değişkendeki değişimin yüzde kaçını açıkladığını göstermez
(Huck, 2012, s. 386). Her bir bağımsız değişkenin tek başına oluşturduğu etki
için kısmi-yarı korelasyonlar hesaplanır ve “sr2” ile gösterilir.
Çoklu regresyon analizi türleri
Çoklu regresyonda modele dâhil edilecek bağımsız
değişkenlerin hangileri olacağı ve hangi sıra ile modele girecekleri önemli bir
noktadır. Bu sebepten farklı yöntemler ortaya atılmıştır.
1. Standart
/eş zamanlı (simetenous) çoklu
regresyon analizi: regresyon
modeline bağımsız değişkenlerin hepsinin anlamlı katkıları göz edilmeksizin
dâhil edildiği analiz türüdür (Büyüköztürk, 2015, s. 99; Huck, 2012, s. 382).
Modele dâhil edilen bağımsız değişkenlerin birbirinden üstünlüğü veya önceliği
düşünülmüyorsa eş zamanlı yöntemi tercih edilebilir (Kalaycı, 2010, s. 260). Bu
analiz türünde yordayıcı değişkenlerin hepsinin blok halinde yordanan değişkeni
açıklamadaki ortak etkileri aynı anda görülebilir (Akbulut, 2010, s. 67; Can,
2018, s. 274). Eş zamanlı regresyon analizi teorilerin test edilmesinde etkili
bir yöntem olarak bilinir (Studenmund ve Cassidy, 1987, aktaran Field, 2009, s.
212). Standart regresyon analizinde yalnızca bir adet R2 değeri
hesaplanır.
2. Aşamalı /
adım adım (stepwise) çoklu regresyon analizi: Bu analiz türünde bağımsız değişkenlerden yalnızca
bağımlı değişkeni anlamlı düzeyde yordayan değişkenler modele adım adım alınır (Alpar,
2016, s. 480). Burada amaç değişkenleri tek tek ekleyerek veya çıkartarak
bağımlı değişkeni en iyi açıklayan modeli oluşturmaktır (Güriş ve Astar, 2015,
s. 341). Aşamalı çoklu regresyon analizinde hangi değişkenlerin modele gireceği
bilgisayar tarafından belirlenir (Huck, 2012, s. 382). İleri doğru (değişken
ekleme; forward) ve Geriye doğru (değişken eleme; Backward) olmak üzere iki alt
türe ayrılır. Forward yönteminde ilk model sabit değişken ile kurulur (Model 0)
ve sonrasında modele dâhil edilen ilk bağımsız değişken bağımlı değişken ile en
yüksek derecede bağıntıya sahip olandır (Akbulut, 2010, s. 67; Field, 2009, s.
212). Geriye kalan değişkenlerden yine bağımsız değişken ile en yüksek ilişkiye
sahip olan ikinci olarak modele sokulur. Bu şekilde hiçbir değişken kalmayana
kadar devam edilir. Backward yönteminde ise tam tersi işlem yapılır. Öncelikle
tüm bağımsız değişkenler modele atılır ve sonrasında bağımlı değişken ile
bağıntısı en az olan değişkenden başlayarak tüm önemsiz değişkenler teker teker
modelden çıkartılır (Akbulut, 2010, s. 67; Kalaycı, 2010, s. 260).
Araştırmanızda aşamalı çoklu regresyon analizine karar verdiyseniz geriye doğru
yöntemini tercih etmeniz Tip 2 II hata yapma ihtimalini azaltır ve bastırıcı
etki (suppressor effects) oluşmasını engeller (Field, 2009, s. 213). Aşamalı regresyon analizlerinde birden
çok determinasyon katsayısı (R2) hesaplanır.
3. Hiyerarşik/ardışık (hierarcical) çoklu regresyon analizi: Regresyon modeline girecek bağımsız değişkenlerin
sırasına araştırmacının kendisinin karar verdiği araştırma türüdür (Field,
2009, s. 212). Araştırmacının dayandığı kuram veya kuramlar yardımıyla
değişkenlerin hiyerarşik regresyona sokulma sıraları belirlenir (Akbulut, 2010,
s. 67). Aynı zamanda bu yöntem ile araştırmacı istediği değişkenin etkisini
kontrol altına alarak diğer değişkenlerin bağımlı değişken üzerindeki etkisini
tespit etmek isteyebilir (Can, 2018, s. 274).
Çoklu regresyon analizinde
etki büyüklüğü veya f2 değerleri ile tespit edilir. f2 katsayısı
aşağıdaki gibi hesaplanır.
R2 değerinin
yorumlanması (Alpar, 2016, s. 494)
R2
|
Etki
|
0,02
|
Küçük
|
0,13
|
Orta
|
0,26
|
Büyük
|
f2 değerinin
yorumlanması (Alpar, 2016, s. 494)
f2
|
Etki
|
0,02
|
Küçük
|
0,15
|
Orta
|
0,35
|
Büyük
|
Örnek: Lisansüstü eğitim programı olan yüksek lisans
öğrencisi seçmek isteyen yönetim, öğrencilerin lisans diploma notu, ALES puanı
ve yabancı dil sınavı puanı yardımıyla başarılı öğrencilerin seçimini yapmak
istiyor. Bağımlı değişkenin yüksek lisans genel not ortalaması ve bağımsız
değişkenlerin lisans diploma notu, ALES puanı ve YDS puanı olduğu bir çoklu
regresyon modeli kurulmalıdır.
Örnek: Bir araştırmacı çalıştığı lise öğretmenlerinin iş
memnuniyet düzeylerinin örgütsel iklim ve algılanan örgütsel destek tarafından yordanıp yordanmadığını merak etmektedir. Bu doğrultuda iş
memnuniyet düzeylerinin bağımlı değişken, örgütsel iklim, algılanan örgütsel
destek düzeylerinin bağımsız değişkenler olduğu bir çoklu
regresyon modeli kuruyor.
Veri setine ulaşmak için tıklayınız.
SPSS de varsayım kontrolü: Analyze
sekmesindeki Regression kısmından linear regression e tıklanır. Açılan Linear regression penceresinde plots butonu tıklanır. Bu pencerede ise
X eksenine ZPRED, Y eksenine ZRESID atanır. Bu grafik ile homoscedasticity ve hataların varsayımları kontrol edilebilir
(Field, 2009, s. 229). Y eksenine SRESID ve X eksenine ZPRED atılarak
oluşturulan grafiği ise eş varyanslılık tespit edilebilir. Standardized residual plots kısmındaki histogram ve normal
probability plot sekmeleri tıklanır. Continue
ve OK tuşuna basılarak analiz
yapılır.
SPSS’de Standart Regresyon Analizi: Linear regression penceresinde dependent kısmına
bağımlı değişkeni, independents kısmına bağımlı değişkenleri atılır. Method
sekmesi açılarak enter seçilir. Statistics butonunu tıklandığında model fit, R
squared change, desciptives, part and partial correlations, collinearity
diagnostics ve estimates kısımları tıklanıp continue butonuna basılır.
SPSS çıktı sonuçlarına aşağıdaki sunulardan ulaşabilirsiniz.
Sonuçların yorumlanabilmesi için öncelikle çıktı ekranındaki ANOVA tablosuna bakılmalıdır. Bu tablodaki F değerinin anlamlı olması demek (p < ,05) kurulan modelin anlamlı olması demektir. Modelin anlamlılığı test edildikten sonra bakılması gereken tablo coefficients tablosudur. Bu tabloda bağımsız değişkenlerin modele katkısının anlamlılığına bakılmaktadır. Değişkenlere ait t-testi sonuçlarının istatistiksel olarak anlamlı olması (p < ,05) o değişkenin bağımlı değişken için anlamlı bir yordayıcı olduğunu desteklemektedir. Coefficients tablosundaki beta değerleri kullanılarak yordayıcı değişkenlerin yordanan (bağımlı) değişken üzerindeki göreli önem sırasını tespit edilebilir. SPSS çıktısındaki tablolar yorumlandıktan sonra bulunan sonuçlar aşağıdaki biçimde raporlanabilir.
Örgütsel iklim ve örgütsel
destek değişkenlerine göre iş memnuniyetinin yordanmasına ilişkin çoklu
regresyon analizi sonuçları Tablo da verilmiştir. Bu tablodaki çoklu regresyon
analizi sonuçlarına göre örgütsel iklim ve örgütsel destek değişkenleri iş
memnuniyetini yordadığı model istatistiksel olarak anlamlı bulunmuştur (F(236,3)=
222,06 , p < ,05). Ayrıca lise öğretmenlerinin örgütsel iklim ve örgütsel
destek düzeylerinin iş memnuniyetlerini anlamlı olarak yordadığı tespit
edilmiştir. Standardize edilmiş regresyon katsayıları (β) incelendiğinde örgütsel
iklim örgütsel destek değişkenine göre daha önemli bir değişkendir. Son olarak,
bu iki bağımsız değişken birlikte iş memnuniyetindeki toplam varyansın yaklaşık
%74’ünü açıklamaktadır.
Çoklu regresyon analizi
sonuçlarına göre iş memnuniyetinin yordanmasına ilişkin regresyon denklemi
aşağıda verilmiştir.
İŞ MEMNUNİYET’ = 5,77 +
2,05 ÖRGÜTSEL_İKLİM + 1,72 ÖRGÜTSEL_DESTEK
Aşamalı Regresyon Analizinin SPSS uygulaması
Linear regression penceresinde dependent
kısmına bağımlı değişkeni, independents
kısmına bağımlı değişkenleri atılır. Method
sekmesi açılarak stepwise seçilir. Statistics butonunu tıklandığında model fit, desciptives, part and partial
correlations, collinearity diagnostics ve estimates kısımları tıklanıp continue
butonuna basılır.
Tablo
Örgütsel iklim ve örgütsel desteğin iş
memnuniyetinin yordandığı çoklu regresyon analizi sonuçları
Değişkenler
|
B
|
SE B
|
β
|
t
|
p
|
Sabit
|
5,77
|
2,45
|
2,35
|
,02
|
|
Örgütsel
iklim
|
2,05
|
,14
|
,50
|
15,03
|
,00
|
Örgütsel
destek
|
1,72
|
,16
|
,38
|
10,52
|
,00
|
Not. R= ,86
, R2= ,74 , F(236,3)=222,06 , p < ,05
Not: Yukarıdaki tablo APA 6
stiline göre hazırlanmıştır. Bu
tabloya ulaşmak için tıklayınız.
UYARI: Regresyon
modelinin anlamlı olduğu ancak katsayıların her birinin anlamsız çıktığı
durumlarda nasıl yorum yapılır! Genellikle çoklubağlantılık durumlarında F
testi anlamlı iken t testinin biri veya birkaçı anlamsız çıkabilmektedir
(Alpar, 2016, s. 482; Güriş ve Astar, 2015, s. 364). Bu sebepten varsayımların
kontrol edilmesi önemlidir.
Kukla değişkenli regresyon
modelleri hakkında bilgiye ulaşmak için Güriş ve Astar (2015, s. 385) kaynağına
başvurabilirsiniz.
UYARI:
Çoklu doğrusal regresyon analizi sonucunda istatistiksel olarak anlamlı bulunan
modelleri neden-sonuç ilişkisi biçiminde yorumlayamayız. Bağımlı ve bağımsız değişkenler arasında
kuvvetli ilişkiler bulunsa da bu ilişki bağımsız değişkenlerin bağımlı değişkene
sebep olduğu sonucuna karşılık gelmez (Alpar, 2013, s. 420).
1.
Kavramsal ve
kuramsal temellere dayanarak bağımlı değişken ve bağımsız değişkenler tespit
edilir.
2.
Bağımlı ve
bağımsız değişkenler ölçme hatalarından arındırılır.
3.
Gerekli
örneklem sayısı belirlenir (bağımsız değişken sayısı (p)X 10 ya da 50 + 8p).
4.
Kayıp veri
kontrolü yapılır.
5.
Artıkların
bağımsızlığı, normalliği, doğrusallığı ve eşvaryansılığı test edilir.
6.
Tek değişkenli
ve çok değişkenli uç değerlerin varlığı kontrol edilir.
7.
Çoklu
birliktelik (bağlantılılık) ve tekillik olmadığı ispatlanır.
8.
Ana analizler
yapılır.
a.
Çoklu R2 ve
düzeltilmiş R2 raporlanır
b.
Modelin
manidarlığı gösterilir.
c.
Regresyon
katsayılarının manidarlığı tablo
haline getirilir.
d.
Yarı kısmi
korelasyonların karesinden
bahsedilir.
9.
Standartlaştırılmış
beta katsayıları ve güven aralıkları hesaplanır.
10.
Yordama
denklemi oluşturulur.
Akbulut, Y. (2010). Sosyal bilimlerde
SPSS uygulamaları: Sık kullanılan istatistiksel analizler ve açıklamalı SPSS
çözümleri. İstanbul: İdeal Kültür Yayıncılık.
Alpar, R. (2016). Uygulamalı çok
değişkenli istatistiksel yöntemler. Ankara: Detay Yayıncılık.
Büyüköztürk, Ş. (2015). Sosyal bilimler için veri analizi el kitabı: İstatistik, araştırma
deseni. Ankara: Pegem
Yayıncılık.
Can, A. (2018). SPSS ile bilimsel araştırma sürecinde nicel veri analizi. Ankara: Pegem Yayıncılık.
Çokluk, Ö., Şekercioğlu, G., & Büyüköztürk,
Ş. (2014). Sosyal bilimler için çok
değişkenli istatistik: SPSS ve LISREL uygulamaları. Ankara: Pegem Akademi.
Field, A. (2009). Discovering
statistics using SPSS. Thousand Oaks, CA: Sage.
Güriş, S., & Astar, M. (2015). Bilimsel araştırmalarda SPSS ile istatistik.
İstanbul: Der Yayınları.
Huck, S. W. (2012). Reading
statistics and research. New York, NY: Pearson.
Kalaycı, Ş. (2010). SPSS uygulamalı çok
değişkenli istatistik teknikleri. Ankara: Asil Yayın Dağıtım.
Özdamar, K. (2013). Paket programlar
ile istatistiksel veri analizi-1: SPSS-MINITAB. Eskişehir: Nisan Kitapevi.
Pallant, J. (2001). SPSS Survival Guide: A step by step guide to data
analysis using SPSS. Australia:
Allen & Unwin.
Salkind, N. (2015). İstatistikten
nefret edenler için istatistik. Ankara: Pegem Akademi.
Tabachnick, B. G., & Fidell, L. S. (2015). Çok değişkenli istatistiklerin kullanımı
(Çev. Ed. M. Baloğlu). Ankara:
Nobel Akademik.
Bu metine atıfta bulunmak için: Karakaya Özyer, K. (2019). Çoklu Doğrusal Regresyon [Blog]. Retrieved 24 June 2022, from https://nicelanalizlericindesteksistemi.blogspot.com/.