Hipotez Testleri
Bu bölümde neler var?
1. Bölüm: Hipotez testi nedir?
2. Bölüm: Hipotezlerin belirlenmesi
3. Bölüm: Anlamlılık düzeyine karar verme
4. Bölüm: Örnekleme dağılımının belirlenmesi
5. Bölüm: Ret bölgesinin belirlenmesi
6. Bölüm: Uygun test istatistiğinin hesaplanması
7. Bölüm: İstatistiksel karar verilmesi
8. Bölüm: Hipotez testlerinde hata
9. Bölüm: Etki büyüklüğü
10. Bölüm: Güç analizi
11. Bölüm: Güven aralıkları
12. Bölüm: Kaynakça
2. Bölüm: Hipotezlerin belirlenmesi
3. Bölüm: Anlamlılık düzeyine karar verme
4. Bölüm: Örnekleme dağılımının belirlenmesi
5. Bölüm: Ret bölgesinin belirlenmesi
6. Bölüm: Uygun test istatistiğinin hesaplanması
7. Bölüm: İstatistiksel karar verilmesi
8. Bölüm: Hipotez testlerinde hata
9. Bölüm: Etki büyüklüğü
10. Bölüm: Güç analizi
11. Bölüm: Güven aralıkları
12. Bölüm: Kaynakça
Tanımlayıcı
istatistikler yardımıyla elimizdeki veri setinin ortalaması, yayılımı ve şekli
konusunda bilgiler elde edebiliriz. Ancak araştırmalarımızda bu mevcut bilgiler
ile tanımlayıcı istatistikler dışında evren hakkında genellemeler yapmak
isteriz. Hatta elimizdeki veri sonuçlarının diğer veri setleri için de geçerli
olup olmadığını merak ederiz ve bu yönde araştırma problemleri oluştururuz. Bu
araştırma problemlerine ait farazi cevaplar yani araştırma hipotezleri ortaya
koyarız. Adından da anlaşılacağı üzere bu cevaplar hipotetik/ farazi
ifadelerdir ve toplanan veriler ile desteklenmesi istenir. İşte bu aşamada
çıkarımsal istatistikler (inferential statistics) imdada yetişir. Sosyal bilimlerde en yaygın olarak kullanılan
çıkarımsal istatistiklerden biri de hipotez testleridir (Akbulut, 2010, s. 14).
Hipotez testlerindeki amaç örneklemlerden elde edilen verilerle sonuçlara
ulaşmak ve bu sonuçların evreni ne derecede temsil ettiğini gösterebilmektir (Thompson,
2008, s. 134). Reha Alpar (2016, s. 209) hipotez testlerini “evrenden çekilen
örneklem(ler) yardımıyla evren hakkında bir karara varma konusunda yardımcı
olmak” ve istatistiksel manada hipotez testleri ise “gözlem ya da denemeden
elde edilen sonuçların raslantıya/ şansa bağlı olup olmadığının incelenmesinde
kullanılan istatistiksel yöntemlerin bütünü” biçiminde tanımlamıştır.
Hipotezlerin
test edilmesi kavramını sistematik ve sistematik olmayan varyasyonlar (değişimler)
ile açıklamak mümkündür. Sistematik varyasyon; test etmek istediğimiz hipotezin
mevcut veriler üzerinden açıkladığı varyans olarak tanımlanabilir (Field, 2009,
s. 52). Öte yandan, sistematik olmayan varyasyon; kurduğumuz hipotezin
açıklamadığı değişim miktarıdır. Bu tip varyasyon hata kaynaklı olabilir ya da
işin içine katmadığımız başka değişkenlerden kaynaklanabilir. En basit manasıyla,
kurulan hipotezin veriler tarafından desteklenip desteklemediğini öğrenmek
istiyorsak bu iki varyasyon türünü yani sistematik varyasyonu sistematik
olmayan varyasyona oranlamak gerekmektedir (Field, 2009, s. 52).
Hipotez testlerinde sonuca
ulaşmak için z, t, F, χ2 ve benzeri olasılık dağılımları kullanılır (Alpar,
2016, s. 209). Hipotez testlerinde birçok farklı isimlendirilmeler olsa da
genel anlamda tüm hipotez testlerin mantığı aynıdır: istenen varyansın
istenmeyen varyansa oranlamak. Bu doğrultuda, iyi bir hipotez kurmak istersek
bu hipotezin açıkladığı varyansın miktarının açıklamadığı varyansın miktarından
fazla olması beklenir (Field, 2009, s. 52). Diğer bir deyişle bu oranın 1’den
fazla olması elimizdeki verilerin kurulan hipotezi desteklediğini ve olayın
şans eseri gerçekleşmesi ihtimalinin azaldığını gösterir (Field, 2009, s. 52).
Bir
araştırmacı araştırma sonuçlarını değerlendirirken dikkat edilmesi gereken noktalar
vardır. Doğru hipotez testinin kullanılması, bu testin doğru uygulanması ve
sonucunda çıkan bulguların etkili bir biçimde yorumlanması gerekmektedir. Bu
sebepten, araştırmacılar araştırma sürecinin başında amacına yönelik
kullanabileceği testleri bilmeli ve bu testlere ilişkin varsayım kontrolüne
hâkim olmalılardır (Alpar, 2016, s. 209).
Hipotez
testinin türüne karar verirken; araştırmanın amacına, toplanan verilerin türüne
(ölçek türüne), grup değişkeni sayısına, verilerin normal dağılıp dağılmadığına
ve varyansların homojenliğine bakılarak karar verilir (Alpar, 2016, s. 209).
Hipotez testleri aşamaları aşağıdaki
gibi sıralanabilir (Alpar, 2016, s. 209):
1.
Sıfır hipotezi
ve alternatif hipotezin ifade edilmesi
2.
Anlamlılık
düzeyi alfanın seçilmesi
3.
Örnekleme
dağılımının belirlenmesi
6.
İstatistiksel
karar verilmesi
Huck (2008, s. 179) ise bu
süreci yedi aşamaya çıkartmıştır.
1.
Sıfır
hipotezinin açıklanması
2.
Alternatif
hipotezin oluşturulması
3.
Anlamlılık
düzeyinin belirlenmesi
4.
Örneklem
verisinin toplanıp analiz edilmesi
5.
Örneklem istatistiğini
değerlendirilecek kriterin belirlenmesi
6.
Sıfır
hipotezinin reddedilmesi veya reddedilmemesi
7.
Etki
büyüklüğünün hesaplanması
Araştırmacılar
araştırma sürecinin başında bazı şahsi yargılara sahiptirler (2 grup arasında
fark vardır gibi). Bu yargılara araştırma hipotezi veya alternatif hipotez (HA)
adı verilir. Buna karşın hipotez testlerinin yapılabilmesi için yokluk hipotezi
veya sıfır hipotezi (H0) kurulmuş olması gerekir (Thompson, 2008, s.
144). Araştırmanın başında geliştirilen sıfır hipotezi belirli testler ile
analiz edilir (Akbulut, 2010, s. 14).
Sıfır
hipotezi H0 olarak gösterilir. Hipotezde belirtilen parametrik değer
ile gerçekleşen değer arasında fark olmadığını ifade eden önermedir. Sıfır
hipotezi kurulurken istatistiksel anlamda net bir biçimde yazılmasına dikkat
edilmelidir (Kalaycı, 2010, s. 65). H0 evrende iki grup arasında
fark olmadığını iddia eder. Alternatif hipotez ise HA biçiminde
ifade edilir. Sıfır hipotezinin tam tersi olarak yazılır (Kalaycı, 2010, s. 65).
Araştırmacı
ilk olarak sıfır hipotezini geliştirir ve ardından alternatif hipotez ifade
edilir. Hipotezler ortaya çıktıktan sonra analizin sonuçlarını değerlendirmede
gerekli olan anlamlılık düzeyi belirlenme aşamasına geçilir (Akbulut, 2010, s. 15).
Hipotez
testi için alınan örneklemin sonuçlarının evren sonuçlarından yeterli derecede
farklı olduğuna kanaat getirebilmek için bir karar kuralına ihtiyaç vardır.
Diğer bir ifade ile alınabilecek riskin boyutuna karar verilmelidir. İşte bu
noktaya anlamlılık derecesi (level of significance) adı verilir ve sosyal
bilimlerde yapılan çalışmalarda bu değer 0,05 olarak alınır. Alfa = 0,05 ya da
anlamlılık düzeyi yüzde 5 olarak belirlenmiş bir araştırmada elde edilen sonucun
rastgele olarak gerçekleşme ihtimalinin yüzde 5’ten küçük olması durumu
beklenir (Akbulut, 2010, s. 15). Yani biz aynı çalışmayı benzer özellikteki 100
farklı örneklem üzerinden topladığımız verilerle yaparsak 95’inden aynı
sonuçlara ulaşılır ve en fazla 5 tanesinden farklı sonuçlar elde ederiz
(Akbulut, 2010, s. 15).
Bu
aşamada elde edilen verilerin dağılımının nasıl olduğu belirlenir.
4. Aşama: Ret
bölgesinin (kritik değerinin) belirlenmesi
Bu
aşamada ise sıfır hipotezini ret edebileceğiniz kritik bölgesi tespit edilir.
5. Aşama:
Uygun test istatistiğinin hesaplanması
Sosyal
bilimlerde yapılan araştırmalarda karşınıza iki tür istatistiksel anlamlılık
testi sonuçları çıkar. Birincisi, p= 0,03 biçiminde kesin ve net hesaplanan
değer; ikincisi ise p < 0,05 olarak ifade edilen sonuçtur (Thompson, 2008, s.
145). İkinci durumda araştırmacının alfa yani tip I hata yapma ihtimalini 0,05
olarak aldığı belli olmaktadır. Ancak 1. durumda yalnızca p =0,03 değerinin
verilmesi tek başına yeterli bilgi ihtiva etmez. Bu sebepten anlamlılık testi
sonuçlarını verirken APA, p < ,05 biçiminde raporlaştırılmasını tavsiye etmektedir
(www.apa.org APA sitesi linki). p-value ya da
significance (sig.) olarak istatistiksel yazılımlarda gösterilir ve p-değerinin
mümkün mertebe küçük çıkması beklenir.
Peki, p-değeri nedir?
·
Hipotez testi
sonucunda ortaya çıkan 1. Tip hata yapma ihtimalidir.
·
H0
doğru olduğu durumlarda veri sonuçlarının hipotezi reddetme ihtimalidir.
·
H0’ın
doğru olduğu durumlarda elde edilen sonuçların rastgele elde edilmiş olma
olasılığıdır.
Uyarı:
Tek yönlü veya çift yönlü hipotez testlerinde yapılan en büyük yanlışlardan
biri testin yönüne analiz yapıldıktan sonra karar vermektedir. Eğer araştırmacı
çift yönlü bir hipotez kurup analizi yaptıysa ve sonuç istediği gibi çıkmadığı ise
hipotezi değiştirerek hatalı bir adım atmış olunur. Aynı şekilde, tek yönlü
hipotez testleri kullanırken hipotezin yönünü analiz sonuçlarına göre
değiştirmek bilimsel bir yanlıştır.
Uyarı:
Küçük p-değerleri büyük etki anlamına gelmez. Özellikle örneklem büyüklüğünün
fazla olduğu durumlarda küçük p –değerine sahip analizlerin etki
büyüklüklerinin de küçük çıktığı gözlemlenmiştir (onlinestatbook.com)
Uyarı:
Anlamlı çıkmayan p-değerleri sıfır hipotezinin doğru olduğu anlamına gelmez.
Anlamlı olmayan sonuçlar yokluk hipotezinin (örneğin ortalamaların eşit olması
durumu) yanlış olduğunu göstermek için yeterli bilgi olmadığını ifade eder.
Hipotezdeki
olayın rastgele olarak gerçekleşme olasılığının 0,05’in altında olması, bu
olayın evrende gerçekleştiğine dair yeterli bilgiye sahip olunması demektir. Bu
tür durumlarda test istatistiğinin anlamlı olduğu ifadesi kullanılır (Field,
2009, s. 52).
Eğer
istatistiksel anlamlılık testi sonucunda hesaplanan değer alfa değerinden küçük
ise yokluk hipotezi reddedilir (Thompson, 2008, s. 145). Böyle bir durumda
sonuçların istatistiksel olarak anlamlı olduğu söylenebilir. Ancak bu demek
değildir ki çıkan sonuçlar önemli ya da değerlidir. Sonuçların önemliliği etki
büyüklüğü yardımıyla tespit edilebilir. Diğer yandan hesaplanan p-değeri alfa
değerinde büyük ise yokluk hipotezi reddedilemez (Thompson, 2008, s. 145).
Uyarı:
Hipotez testi aşamalarında test istatistiğini hesaplama kısmına gelindiğinde bu
istatistiğin şans eseri ortaya çıkma ihtimali
0,05’in üzerinde bulunmuş olabilir. Bu durumda sıfır hipotezini
reddedemeyiz. Ancak sonuçların anlamlı çıkmaması sıfır hipotezinin doğru olduğu
anlamına gelmemelidir. Sıfır hipotezi genellikle etki olmadığını ya da fark
olmadığını bizlere söyler. Anlamlı olmayan test istatistiği ise bize sadece bir
fark/etki bulmak için yeterli bilgiye sahip olmadığımızı gösterir (Field, 2009,
s. 53). Cohen’in (1990) belirttiği üzere anlamlı olmayan sonuçlar ortalamalar
arasında fark olmadığı biçiminde çıkarım yapılamaz. Benzer biçimde, test
istatistiği sonuçları anlamlı çıktığı takdirde sıfır hipotezinin tamamen yanlış
olacağı kararına varılamaz. Hipotez testleri olasılık dağılımları üzerine
kurulu olduğu için, test istatistiği anlamlı çıktığı durumlarda sıfır
hipotezinin olmama ihtimali (olasılığı) yüksektir denilebilir (Field, 2009, s. 54).
Olasılık dağılımları
hakkında daha geniş bilgiye ulaşmak için tıklayınız.
Yokluk hipotezini reddedip
reddetmemek üzere yapılan karar verme işine istatistiksel anlamlılık testi veya
hipotez testi adı verilir. Ancak böyle bir işlemde yokluk hipotezinin reddine
veya reddedilmemesine %100 garantili bir biçimde karar verememeyiz (Thompson,
2008, s. 134). Buna karar verebilmenin tek yolu tüm evrendeki kişilere
ulaşmaktır ancak böyle bir durumda çıkarımsal istatistiklerle uğraşmanın anlamı
kalmaz. Evrenden örneklemler alıp üzerinde çalıştığımız çıkarımsal
istatistiklerde her zaman hata yapma ihtimali mevcuttur. Bu sebepten, Hipotez
testi yaparken sonuç ne çıkarsa çıksın (H0 ret ya da reddetmeme)
hata payı ortaya çıkabilir. Bu hata ihtimalini yok etmek imkânsız olsa da, en
aza indirmek için bazı önlemler alınabilir. Bu hataların varlığından haberdar
olmak ve bu konuda dikkatli davranmak bu önlemler arasında yer almaktadır (Thompson,
2008, s. 144).
Tip I hata
Yokluk hipotezi (H0)
reddettiğimizde o hipotezin gerçekte doğru olma ihtimali vardır. Yani evrenden
aldığımız kötü(temsil gücü az olan) bir örnek ile sonucu belirlemiş olabiliriz
ve bu ihtimalde en fazla %5 olarak tanımlanır. Bu durumda Tip 1 hata yapmış
oluruz. Tip I hata yapma ihtimali simgesi alfadır ve aynı zamanda anlamlılık
düzeyi olarak da bilinir. Yokluk hipotezi ifadeleştirilip belirlendikten sonra araştırmanın
başında alfa düzeyine karar verilmelidir (Thompson, 2008, s. 145). Böylelikle,
araştırmanın başında Tip I hata yapma olasılığını sınırlandırmış oluruz. Ancak alfa değerinin 0.01 seçip sonrasında
istenmeyen sonuçlar çıktığında bu değeri 0.05 yükselterek araştırma sonuçlarını
değiştirmeye çalışmak doğru bir strateji değildir (Thompson, 2008, s 146). Alfa
level ve alfa değeri olarak da bilinen bu değer genelde 0.05 ya da %5 olarak
alınır (Field, 2009, s. 56). Bu hata payını %5 veya %1 olarak almak tamamen
araştırmacının görüşüne ve yaptığı araştırmaya bağlıdır. %5’lik Tip I hata
yapma payı araştırma sonuçlarının literatüre etkisi açısından uygun ise bu
düzeyde kalınır ancak daha muhafazakâr sonuçlar elde etmek isteniyorsa
olasılığı %1’lik düzeye indirmek önemlidir. Diğer bir ifade ile seçilen
anlamlılık düzeyinin 0,05 olması takdirde gerçekte doğru olan sıfır hipotezini
yanlışlıkla reddetme şansı 100 denemeden 5 olurken, anlamlılık düzeyi 0,01’e
indiğinde 1. Tip hata yapma ihtimali 100 denemeden 1 olacak şekilde azalacaktır
(Akbulut, 2010, s. 17; Field, 2009, s. 56).
Tip I hata “gerçekte anlamlı
olmayan bir durumu anlamlı bulmak” olarak tanımlanmıştır (Akbulut, 2010, s. 16).
Tip I hata; gerçekte/evrende herhangi bir etki yokken, biz etki olduğuna
inanıyorsak tip I hata yapmışız demektir.
Uyarı: Tip I hata yapma olasılığını gösteren alfa seviyesi, güvenilirlik
hesaplamalarında sıkça kullanılan Cronbach alfa katsayısı ile
karıştırılmamalıdır (Thompson, 2008, s. 145).
Uyarı:
Unutulmamalıdır ki hipotez testleri rastgele örnekleme üzerine kurulmuştur ve
yapılan çalışmalardaki örneklemlerin de rassal olarak evrenden alındığı
varsayılmıştır. Rassal örneklemler
yöntemi kullanılmadığı takdirde Tip I hata anlamlılık seviyesine eşit
olmayabilir.
Uyarı: Literatürde
Yapılan çalışmalara bakıldığında tip I hata yapma ihtimalini 0,05, 0,01 ve 0,001
olarak alındığı görülmüştür. Böyle otomatik bir seviyeyi çalışmanız için
kullanmanın sakıncalı sonuçlar doğurabileceği unutulmamalıdır (Howell, 2008, s.
160). Yapılan çalışmalarda alfa seviyesini 0,025 gibi araştırmanın doğasına
uygun en küçük değeri seçmekte fayda vardır (Thompson, 2008, s. 145).
Tip II hata
Bazen gerçekte doğru
olmayan bir durumu hipotez testi sonucu reddetmeyebiliriz. Yani gerçekte
anlamlı olan bir durumu anlamlı bulamayabiliriz. Bu türde bir hata ise Tip 2
hata olarak tanımlanır (Akbulut, 2010, s. 16). Tip II hata yapma olasılığı ise
beta(β) ile gösterilir.
Field (2009, s. 56) Tip II
hatayı; gerçekte etki varken, etki olmadığına kararı verdiğimizde ortaya çıkan
hata türü şeklinde anlatır. İdeal olarak tip II hatayı en aza indirgemek
istesek de Cohen (1990) Tip II hatanın %20 den fazla olmamasını tavsiye
etmiştir. Özetle, Tip II hata yapma olasılığı en fazla 0,20 ile
sınırlandırılmıştır.
Uyarı: Tip
II hata yapma ihtimalini gösteren Beta sembolü ile regresyon analizinde sonuç
olarak çıkan regresyon katsayıları sembolü beta karıştırılmamalıdır.
Aşağıda verilen tabloda bu
hataları özeti yapılmaktadır.
H0 GERÇEKTE DOĞRU MU?
|
|||
Evet
|
Hayır
|
||
Araştırmacının kararı
|
H0 reddet
|
TİP I HATA = ALFA
|
DOĞRU KARAR (1-
BETA)
|
H0 reddetme
|
DOĞRU KARAR (1- ALFA)
|
TİP II HATA = BETA
|
Tip
I hata ve Tip II hata arasında bir alışveriş söz konusudur. Eğer biz alfa yani
Tip I hata yapma ihtimalini azaltırsak (yani ,05’ten ,01’e indirirsek) gerçekte
olan bir etkiyi reddetme olasılığını yani Tip II hatayı artırmış oluruz. Böyle
bir durumda tip I hata ile tip II hataya nasıl karar vereceğiz? Bu tamamen
yapacağımız çalışmanın sonuçlarının önemine bağlı olarak değişmektedir. Eğer çalışmanın
sonunda hedef kitle için çok önemli kararlar verilecek ise o zaman mümkün
oldukça Tip I hatayı düşük tutmak gerekmektedir (Howell, 2008, s. 160). Tam
tersi bir durumda tip I hata yapma ihtimalini yükselterek Tip II hata yapma
olasılığı azaltılır.
Tablodan
çıkarıldığı üzere kurgulanan yokluk hipotezini reddettiğinizde Tip II hata
yapma ihtimali ortadan kalkar. Benzer şekilde, yokluk hipotezi
reddedilmediğinde Tip I hata yapma ihtimali bulunmaz. İkisinde varsayımları
birbirinden farklıdır. Yani bir durumda hem Tip I hem Tip II hata görülemez (Thompson,
2008, s. 148).
Sosyal
bilimlerde yapılan araştırmalarda Tip I hata ve Tip II hatayı engellemek mümkün
değildir ancak Tip I hata yapma olasılığı yeterli örneklem büyüklüğü seçilerek
kontrol altına alınabilir (Kalaycı, 2010, s. 68).
Ancak
bazı çalışmalarda kullanılan örneklem büyüklüğü gerçekte etkisi olamayan
hipotez testlerinin istatistiksel manada anlamlı çıkmasına sebep
olabilmektedir. Bu sebepten, bir değişkenin etkisinden bahsederken yalnızca
hipotez testlerinin anlamlı çıkıp çıkmamasına bakmak yeterli gelmemektedir
(Field, 2009, s. 53).
Yapılan
hipotez testleri sonucunda hesaplanan test istatistiğinin istatistiksel olarak
anlamlı çıkması, onun oluşturduğu etkinin önemli olduğu anlamına gelmemektedir.
Diğer bir ifade ile istatistiksel manada anlamlı çıkan bir hipotez gerçek
hayatta önemsiz olarak görülebilir. Böyle bir durumda, çalışmalarımızın hem
istatistiksel manada hem de uygulamada önemini göstermek için etki büyüklüğü
hesaplamalarını yapmamız gerekmektedir. Gözlemlenen etkinin standartlaştırılmış
bir ölçümü olarak tanımlanan etki büyüklüğü (effect sizes), benzer çalışmaların
birbiriyle karşılaştırılmasını dahası bu çalışmalarda meta-analiz yapılmasına
olanak sağlamaktadır. Hipotez testleri yapılırken etki büyüklüğünün ortaya konularak
sonuca karar verilmesi bulguların yorumlanmasını kolaylaştırmaktadır
(Büyüköztürk, 2015, s. 44).
Etki
büyüklüğü; “test sonucunda doğru olarak saptayabilmek istediğimiz minimum
değişiklik miktarı” veya “hipotez testi uygulanan bağımlı ve bağımsız değişkenler
arasındaki ilişkinin kuvvet miktarı” olarak tanımlanır (Alpar, 2016, s. 277;
Büyüköztürk, 2015, s. 44). Etki büyüklüğü araştırmanın başında literatürdeki
benzer çalışmalardan veya pilot çalışmadan tahmin edilebileceği gibi, çalışma
sonrasında gözlenen değerler üzerinden formüller yardımıyla da hesaplanabilir
(Alpar, 2016, s. 277).
Hipotez
testlerinin büyük örneklemlere göre hassas olması ve çok büyük örneklemlerde
ufak farkların bile anlamlı çıkabilmesinden dolayı örneklemden etkilenmeyen
etki büyüklüğü hesaplamalarının raporlanması tavsiye edilir (Alpar, 2016, s. 277).
Uygulanacak olan hipotez testinin türüne bağlı olarak farklı etki büyüklüğü
hesaplamaları vardır: eta (η), etakare (η2), kısmi eta-kare, R2,
r, d, Çoklu R2, cohen f, omega kare (ω), epsilon kare(ε2).
Eta-kare tekniği iki örneklem t-testlerinde ve varyans analizlerinde
kullanılırken iki değişkenin ilişkisinin araştırıldığı testlerde ise R2
tercih edilir. Eta-kare ve r değerleri 0 ile 1 arasında değişir ve bu değer 1 e
yaklaştıkça etki büyüklüğü artar. Bu
hesaplamalar sonrasında çıkan sonuçlar yine benzer çalışmaların etki
büyüklükleri ile karşılaştırılarak yorumlanabilir (Alpar, 2016, s. 277).
Böylece bulunan etki büyüklüğünün uygulamaya katkısının büyüklüğü de
değerlendirilmiş olur.
Bir
çok farklı etki büyüklüğü hesaplaması olmasına karşın en çok bilinenleri ve kullanılanları
eta kare, cohen’s d, pearson korelasyon katsayısı r ve odd oranıdır (Field,
2009, s. 57). Andy Field (2009, s. 57) kişisel tercih olarak korelasyon katsayısını
tercih ettiğini söylese de, grup büyüklüklerinin birbirinden farklı olduğu
durumlarda Cohen’s d hesaplamalarını kullanmak daha doğru sonuçlar verecektir
(Alpar, 2016, s. 277). Cohen (1992) makalesinde yaptığı öneriler şu biçimdedir:
Eta kare değeri
|
Etki değerlendirilmesi
|
Eta-kare < 0,01
|
küçük etki
|
0,01<Eta-kare < 0,06
|
orta etki
|
0,06< eta-kare < 0,14
|
geniş etki
|
Cohen’s
d değeri için ise;
Cohen’d değeri
|
Etki değerlendirilmesi
|
d< 0,2
|
küçük etki
|
0,2< d < 0,5
|
orta etki
|
0,5< d < 0,8
|
geniş etki
|
Korelasyon
katsayısı için;
Korelasyon değeri
|
Etki değerlendirilmesi
|
Açıklanan varyans
|
r= ,10
|
küçük etki
|
Etki toplam varyansın %1’ini açıklıyor (r^2 = .1)
|
r= ,30
|
orta etki
|
Etki toplam
varyansın %9’unu açıklıyor (r^2 = .9)
|
r= ,50
|
büyük etki
|
Etki toplam varyansın %25’ini açıklıyor (r^2 = .25)
|
Cohen’in
kitabında belirtiği gibi etki büyüklüklerini küçük, orta ve büyük biçiminde
etiketlemek her zaman mantıklı sonuçlar çıkarmayabilir (Huck, 2008, s. 199; Thompson,
2008, s. 198). Bir sosyolog için küçük etki sayılabilecek bir değer eğitimci
için orta etki büyüklüğünde olabilir. Bu sebepten, etki büyüklükleri
hesaplandıktan sonra sonuçları yorumlarken çalışma grubu ve alanın da dikkate
alınması gerekmektedir. Ayrıca tek bir çalışma etkinin büyüklüğü konusunda çok
bilgi vermeyebilir. Dolayısıyla, meta-analizi çalışmaları yardımıyla doğru
sonuçlar ortaya konulabilir (Thompson, 2008, s. 198). Diğer bir ifade ile
yalnızca etki büyüklüklerini kaynak göstererek sonuca ulaşmak yerine
meta-analitik bir bakış açısı geliştirerek ve araştırmanın ortamını göz önünde
bulundurarak etkinin büyüklüğü yorumlanmalıdır (Thompson, 2008, s. 210).
Hangi çalışmalar için hangi etki büyüklüğü
hesaplaması kullanılmalıdır?
ANOVA
için eta-kare, her hücrede eşit örneklem büyüklüğü olan gruplar arası varyans
analizi için omega kare. Tek değişkenli analizler için Cohen’s d kullanılır
(Tabachnick ve Fidell, 2015, s. 54).
Uyarı:
Etki büyüklüğünü hesaplamak ve raporlamak neden önemlidir?
Yapılan analizlerin
istatistiksel olarak anlamlı çıkması uygulamada anlamlı olduğunu
göstermemektedir. Yapılan çalışmaların uygulamaya katkısını göstermek amacıyla
etki büyüklüğünün hesaplanıp raporlaştırılması gerekmektedir. Son dönemlerdeki
dünya literatüründeki saygın dergilerde etki büyüklüğü ön koşul olarak
istenmektedir. Farklı hesaplama yöntemlerine sahip olan etki büyüklüğünü
çalışmalardan hesaplayıp okuyucuya sunmak önemlidir. Ayrıca, meta-analiz yapmak
isteyen araştırmacıların analiz yapmalarında katkı sağlanmış olunur.
Evrendeki
etki büyüklüğü hesaplanırken örneklem büyüklüğü, alfa seviyesi ve 1- beta
değerleri ön plana çıkmaktadır. İstatistiksel güç olarak da bilinen 1-beta
değeri alınan örneklem büyüklüğü de testin etkiyi tespit edebilme gücü/seviyesi
olarak tanımlanabilir. Etki büyüklüğü, örneklem büyüklüğü, alfa seviyesi ve
istatistiksel güçten herhangi 3’ü bilindiği takdirde geriye kalan diğer değerler
hesaplanabilmektedir (Field, 2009, s. 58). Örneğin, alfa=0,05 olarak aldığımız
bir deneysel çalışmanın örneklem etki büyüklüğünü Cohen’s d veya eta-kare
değerleriyle hesaplayabiliriz. Örneklem büyüklüğü de ortada olduğuna göre bu üç
değeri temel alarak güç analizini yapmak kolaydır. Eğer çıkan güç analizi sonucu 0,8 (1-0,2)’den
fazla ise yaptığımız çalışmanın evrende mevcut olan etkinin tespit
edilebilirliğine dair yeterli güce sahibiz demektir (Field, 2009, s. 58). 0,8’in
çok altında çıkan değerler bizim çalışmamızın çok kaliteli olmadığını ve belki
de tekrarlanması gerektiğini gösterir. İstatistiksel güç analizleri karmaşık
gelse de bu tür analizleri yapmak için programlar geliştirmişlerdir. Ücretsiz
olarak indirilip kullanabilen programlardan biri de GPower’dir (GPower
programını indirmek için tıklayınız).
Ayrıca bu programlar yardımıyla araştırmaya başlamadan önce hedeflediğimiz
güçte analiz yapmak için (örneğin 1-beta= ,85) nasıl bir örneklem büyüklüğüne
ihtiyacımız olduğu da hesaplanabilir (Field, 2009, s. 58).
Reha
Alpar’a (2016, s. 225) göre güç analizi araştırmanın başında yapılmalıdır.
Ancak bunu yaparken birden fazla hipotez mevcut ise en büyük örneklemi isteyen
hipoteze göre hareket edilir. Araştırmanın sonrasında da güç analizi ve etki
büyüklüğü hesaplanabilir ve bunlar gözlenen güç ve gözlenen etki büyüklüğü
biçiminde ifade edilir (Alpar, 2016, s. 225). Yapılan çalışmaların sonrasında
da gözlenen güç ,80’in altında çıkarsa bu durum genelde araştırma örneklem
büyüklüğünün yetersiz olduğu ve sonuçları ortaya koyacak kadar hassas ölçüm
yapılmadığı şeklinde yorumlanır (Alpar, 2016, s. 225). Diğer taraftan, çok
büyük örnekleme sahip olan araştırmalardan gerçekte anlamlı olmayan durumları
da anlamlı bulma eğilim gösterir ve araştırmacıları yanlış yönlendirebilir.
Tip
II hatayı yapma ihtimalini ve dolayısıyla gücü etkileyen faktörleri bulmak Tip
I hata yapma olasılığını bulmaktan daha zordur. Bu faktörler arasında bazıları
kontrol edilebilirken bazıları ise kontrol edilemez. Gücü etkileyen faktörler
sırasıyla: alfa (anlamlılık seviyesi), örneklem büyüklüğü, bağımlı değişkenin
güvenirliği ve etki büyüklüğüdür. Alfa değeri azaldığı (diğer faktörler sabit
kaldığı) takdirde yani 0,05’ten 0,01’e indiği zaman beta seviyesi artar, güç
azalır. Bu durumda görülüyor ki, Tip I hatayı azaltayım derken testin güzünden
kaybedebiliriz. Ancak alfa seviyesi sabit bırakılarak (0,05 gibi), örneklem
büyüklüğü artırıldığı takdirde beta da azalma olup ve dolayısıyla testin gücü
artar. Testin gücünü artırmada kullanılacak diğer bir yöntem ise güvenilir
ölçme araçları kullanmaktır. Güvenirliği düşük araçlarla toplanan verilerde
hata payı fazla olacağından testin gücü azalacaktır. Bu sebepten, analize
geçmeden önce güvenirliği en yüksek ölçme araçlarını tespit ederek kullanmak
testin gücü için önemli bir faktördür. Diğer etki eden faktör de etki
büyüklüğüdür ve etki büyüklüğü testin tespit edebileceği minimum fark olarak
tanımlanabilir.
Testin
gücünü etkileyen faktörler:
·
Alfa azalırsa
güç artar.
·
Örneklem
büyüklüğü n artarsa güç artar.
·
Etki büyüklüğü
(eta-kare) artarsa güç artar.
·
Bazı testler
için tek yönlü testin gücü çift yönlü testin gücünden fazladır.
Tip
II hata payını azaltmaya yönelik araştırmacıların yapması gerekenler;
·
Öncelikle ulaşılmak
istenilen minimum etki büyüklüğü seviyesini belirlenir.
·
Sonrasında
farkı tespit edebilecekler minimum güce karar verilir. Tip I hata için 0,05’in
kabul gördüğü sosyal bilimlerde beta için 0,20 kullanılabilir. Dolayısıyla istatistiksel
güç minimum 0,80 olarak alınabilir.
·
Sonrasında alfa
anlamlılık seviyesi belirlenir.
Bu
üç seviye belirlendikten sonra bilgisayar programlar(Gpower) veya formüller
yardımıyla örneklem büyüklüğü hesaplanabilir.
Uyarı:
p=0,049 gibi 0,05’e yakın bir değer bulunduğu durumlarda ne yapılmalı?
Hipotez testlerinde yalnızca sonuçların anlamlı olup
olmadığını vermek yeterli bilgi vermeyebilir. Bu gibi durumlarda güven
aralıkları ve etki büyüklüğü yardımıyla çalışma desteklenmeli ve sonuçların
güvenirliği artırılmalıdır (Alpar, 2016, s. 278).
Anlamlılık
düzeyi ve güven aralığı kavramları birbirleriyle denge içindedir. Yüzde 5’lik
anlamlılık düzeyi seçilmiş bir hipotez testi için %95’lik bir güven aralığı
hesaplanabilir (Kalaycı, 2010, s. 68). Hipotez testlerini güven aralıkları
bakış açısıyla ifade edersek sıfır hipotezinin reddedilmemesi için hipotez
testi sonucunun % 95’lik güven aralığı değerleri arasında bulunması
gerekmektedir.
Akbulut, Y. (2010). Sosyal bilimlerde
SPSS uygulamaları: Sık kullanılan istatiksel analizler ve açıklamalı SPSS
çözümleri. İstanbul: İdeal Kültür Yayıncılık.
Alpar, R. (2016). Uygulamalı çok
değişkenli istatistiksel yöntemler. Ankara: Detay Yayıncılık.
Büyüköztürk, Ş. (2015). Sosyal bilimler için veri analizi el kitabı: İstatistik, araştırma
deseni. Ankara: Pegem
Yayıncılık.
Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155.
Field, A. (2009). Discovering
statistics using SPSS. Thousand Oaks, CA: Sage.
Huck, S. W. (2012). Reading
statistics and research. New York, NY: Pearson.
Howell, D. C. (2016). Fundamental
statistics for the behavioral sciences. Boston: Nelson Education.
Kalaycı, Ş. (2010). SPSS uygulamalı çok
değişkenli istatistik teknikleri. Ankara: Asil Yayın Dağıtım.
Tabachnick, B. G., & Fidell, L. S. (2015). Çok değişkenli istatistiklerin kullanımı
(Çev. Ed. M. Baloğlu). Ankara:
Nobel Akademik.
Thompson, B. (2008). Foundations of
behavioral statistics: An insight-based approach. New York, NY: Guilford
Press.