Hipotez Testleri

Hipotezlerin test edilmesi kavramını sistematik ve sistematik olmayan varyasyonlar (değişimler) ile açıklamak mümkündür. Sistematik varyasyon; test etmek istediğimiz hipotezin mevcut veriler üzerinden açıkladığı varyans olarak tanımlanabilir (Field, 2009, s. 52). Öte yandan, sistematik olmayan varyasyon; kurduğumuz hipotezin açıklamadığı değişim miktarıdır. Bu tip varyasyon hata kaynaklı olabilir ya da işin içine katmadığımız başka değişkenlerden kaynaklanabilir. En basit manasıyla, kurulan hipotezin veriler tarafından desteklenip desteklemediğini öğrenmek istiyorsak bu iki varyasyon türünü yani sistematik varyasyonu sistematik olmayan varyasyona oranlamak gerekmektedir (Field, 2009, s. 52).

           Hipotez testlerinde sonuca ulaşmak için z, t, F, χ2 ve benzeri olasılık dağılımları kullanılır (Alpar, 2016, s. 209). Hipotez testlerinde birçok farklı isimlendirilmeler olsa da genel anlamda tüm hipotez testlerin mantığı aynıdır: istenen varyansın istenmeyen varyansa oranlamak. Bu doğrultuda, iyi bir hipotez kurmak istersek bu hipotezin açıkladığı varyansın miktarının açıklamadığı varyansın miktarından fazla olması beklenir (Field, 2009, s. 52). Diğer bir deyişle bu oranın 1’den fazla olması elimizdeki verilerin kurulan hipotezi desteklediğini ve olayın şans eseri gerçekleşmesi ihtimalinin azaldığını gösterir (Field, 2009, s. 52). 
Bir araştırmacı araştırma sonuçlarını değerlendirirken dikkat edilmesi gereken noktalar vardır. Doğru hipotez testinin kullanılması, bu testin doğru uygulanması ve sonucunda çıkan bulguların etkili bir biçimde yorumlanması gerekmektedir. Bu sebepten, araştırmacılar araştırma sürecinin başında amacına yönelik kullanabileceği testleri bilmeli ve bu testlere ilişkin varsayım kontrolüne hâkim olmalılardır (Alpar, 2016, s. 209).
Hipotez testinin türüne karar verirken; araştırmanın amacına, toplanan verilerin türüne (ölçek türüne), grup değişkeni sayısına, verilerin normal dağılıp dağılmadığına ve varyansların homojenliğine bakılarak karar verilir (Alpar, 2016, s. 209).

Hipotez testleri aşamaları aşağıdaki gibi sıralanabilir (Alpar, 2016, s. 209):
      1.      Sıfır hipotezi ve alternatif hipotezin ifade edilmesi
      2.      Anlamlılık düzeyi alfanın seçilmesi
      3.      Örnekleme dağılımının belirlenmesi
      6.      İstatistiksel karar verilmesi

Huck (2008, s. 179) ise bu süreci yedi aşamaya çıkartmıştır.
     1.      Sıfır hipotezinin açıklanması
     2.      Alternatif hipotezin oluşturulması
     3.      Anlamlılık düzeyinin belirlenmesi
     4.      Örneklem verisinin toplanıp analiz edilmesi
     5.      Örneklem istatistiğini değerlendirilecek kriterin belirlenmesi
     6.      Sıfır hipotezinin reddedilmesi veya reddedilmemesi
     7.      Etki büyüklüğünün hesaplanması


Araştırmacılar araştırma sürecinin başında bazı şahsi yargılara sahiptirler (2 grup arasında fark vardır gibi). Bu yargılara araştırma hipotezi veya alternatif hipotez (HA) adı verilir. Buna karşın hipotez testlerinin yapılabilmesi için yokluk hipotezi veya sıfır hipotezi (H0) kurulmuş olması gerekir (Thompson, 2008, s. 144). Araştırmanın başında geliştirilen sıfır hipotezi belirli testler ile analiz edilir (Akbulut, 2010, s. 14).
Sıfır hipotezi H0 olarak gösterilir. Hipotezde belirtilen parametrik değer ile gerçekleşen değer arasında fark olmadığını ifade eden önermedir. Sıfır hipotezi kurulurken istatistiksel anlamda net bir biçimde yazılmasına dikkat edilmelidir (Kalaycı, 2010, s. 65). H0 evrende iki grup arasında fark olmadığını iddia eder. Alternatif hipotez ise HA biçiminde ifade edilir. Sıfır hipotezinin tam tersi olarak yazılır (Kalaycı, 2010, s. 65).
Araştırmacı ilk olarak sıfır hipotezini geliştirir ve ardından alternatif hipotez ifade edilir. Hipotezler ortaya çıktıktan sonra analizin sonuçlarını değerlendirmede gerekli olan anlamlılık düzeyi belirlenme aşamasına geçilir (Akbulut, 2010, s. 15).

Hipotez testi için alınan örneklemin sonuçlarının evren sonuçlarından yeterli derecede farklı olduğuna kanaat getirebilmek için bir karar kuralına ihtiyaç vardır. Diğer bir ifade ile alınabilecek riskin boyutuna karar verilmelidir. İşte bu noktaya anlamlılık derecesi (level of significance) adı verilir ve sosyal bilimlerde yapılan çalışmalarda bu değer 0,05 olarak alınır. Alfa = 0,05 ya da anlamlılık düzeyi yüzde 5 olarak belirlenmiş bir araştırmada elde edilen sonucun rastgele olarak gerçekleşme ihtimalinin yüzde 5’ten küçük olması durumu beklenir (Akbulut, 2010, s. 15). Yani biz aynı çalışmayı benzer özellikteki 100 farklı örneklem üzerinden topladığımız verilerle yaparsak 95’inden aynı sonuçlara ulaşılır ve en fazla 5 tanesinden farklı sonuçlar elde ederiz (Akbulut, 2010, s. 15).

Bu aşamada elde edilen verilerin dağılımının nasıl olduğu belirlenir.

      4.      Aşama: Ret bölgesinin (kritik değerinin) belirlenmesi
Bu aşamada ise sıfır hipotezini ret edebileceğiniz kritik bölgesi tespit edilir.

      5.      Aşama: Uygun test istatistiğinin hesaplanması

Peki, p-değeri nedir?
·         Hipotez testi sonucunda ortaya çıkan 1. Tip hata yapma ihtimalidir.
·         H0 doğru olduğu durumlarda veri sonuçlarının hipotezi reddetme ihtimalidir.
·         H0’ın doğru olduğu durumlarda elde edilen sonuçların rastgele elde edilmiş olma olasılığıdır.

Uyarı: Tek yönlü veya çift yönlü hipotez testlerinde yapılan en büyük yanlışlardan biri testin yönüne analiz yapıldıktan sonra karar vermektedir. Eğer araştırmacı çift yönlü bir hipotez kurup analizi yaptıysa ve sonuç istediği gibi çıkmadığı ise hipotezi değiştirerek hatalı bir adım atmış olunur. Aynı şekilde, tek yönlü hipotez testleri kullanırken hipotezin yönünü analiz sonuçlarına göre değiştirmek bilimsel bir yanlıştır.
Uyarı: Küçük p-değerleri büyük etki anlamına gelmez. Özellikle örneklem büyüklüğünün fazla olduğu durumlarda küçük p –değerine sahip analizlerin etki büyüklüklerinin de küçük çıktığı gözlemlenmiştir (onlinestatbook.com)
Uyarı: Anlamlı çıkmayan p-değerleri sıfır hipotezinin doğru olduğu anlamına gelmez. Anlamlı olmayan sonuçlar yokluk hipotezinin (örneğin ortalamaların eşit olması durumu) yanlış olduğunu göstermek için yeterli bilgi olmadığını ifade eder.

Hipotezdeki olayın rastgele olarak gerçekleşme olasılığının 0,05’in altında olması, bu olayın evrende gerçekleştiğine dair yeterli bilgiye sahip olunması demektir. Bu tür durumlarda test istatistiğinin anlamlı olduğu ifadesi kullanılır (Field, 2009, s. 52).
Eğer istatistiksel anlamlılık testi sonucunda hesaplanan değer alfa değerinden küçük ise yokluk hipotezi reddedilir (Thompson, 2008, s. 145). Böyle bir durumda sonuçların istatistiksel olarak anlamlı olduğu söylenebilir. Ancak bu demek değildir ki çıkan sonuçlar önemli ya da değerlidir. Sonuçların önemliliği etki büyüklüğü yardımıyla tespit edilebilir. Diğer yandan hesaplanan p-değeri alfa değerinde büyük ise yokluk hipotezi reddedilemez (Thompson, 2008, s. 145).

Uyarı: Hipotez testi aşamalarında test istatistiğini hesaplama kısmına gelindiğinde bu istatistiğin şans eseri ortaya çıkma ihtimali  0,05’in üzerinde bulunmuş olabilir. Bu durumda sıfır hipotezini reddedemeyiz. Ancak sonuçların anlamlı çıkmaması sıfır hipotezinin doğru olduğu anlamına gelmemelidir. Sıfır hipotezi genellikle etki olmadığını ya da fark olmadığını bizlere söyler. Anlamlı olmayan test istatistiği ise bize sadece bir fark/etki bulmak için yeterli bilgiye sahip olmadığımızı gösterir (Field, 2009, s. 53). Cohen’in (1990) belirttiği üzere anlamlı olmayan sonuçlar ortalamalar arasında fark olmadığı biçiminde çıkarım yapılamaz. Benzer biçimde, test istatistiği sonuçları anlamlı çıktığı takdirde sıfır hipotezinin tamamen yanlış olacağı kararına varılamaz. Hipotez testleri olasılık dağılımları üzerine kurulu olduğu için, test istatistiği anlamlı çıktığı durumlarda sıfır hipotezinin olmama ihtimali (olasılığı) yüksektir denilebilir (Field, 2009, s. 54).

Olasılık dağılımları hakkında daha geniş bilgiye ulaşmak için tıklayınız.

Yokluk hipotezini reddedip reddetmemek üzere yapılan karar verme işine istatistiksel anlamlılık testi veya hipotez testi adı verilir. Ancak böyle bir işlemde yokluk hipotezinin reddine veya reddedilmemesine %100 garantili bir biçimde karar verememeyiz (Thompson, 2008, s. 134). Buna karar verebilmenin tek yolu tüm evrendeki kişilere ulaşmaktır ancak böyle bir durumda çıkarımsal istatistiklerle uğraşmanın anlamı kalmaz. Evrenden örneklemler alıp üzerinde çalıştığımız çıkarımsal istatistiklerde her zaman hata yapma ihtimali mevcuttur. Bu sebepten, Hipotez testi yaparken sonuç ne çıkarsa çıksın (H0 ret ya da reddetmeme) hata payı ortaya çıkabilir. Bu hata ihtimalini yok etmek imkânsız olsa da, en aza indirmek için bazı önlemler alınabilir. Bu hataların varlığından haberdar olmak ve bu konuda dikkatli davranmak bu önlemler arasında yer almaktadır (Thompson, 2008, s. 144).

Tip I hata
Yokluk hipotezi (H0) reddettiğimizde o hipotezin gerçekte doğru olma ihtimali vardır. Yani evrenden aldığımız kötü(temsil gücü az olan) bir örnek ile sonucu belirlemiş olabiliriz ve bu ihtimalde en fazla %5 olarak tanımlanır. Bu durumda Tip 1 hata yapmış oluruz. Tip I hata yapma ihtimali simgesi alfadır ve aynı zamanda anlamlılık düzeyi olarak da bilinir. Yokluk hipotezi ifadeleştirilip belirlendikten sonra araştırmanın başında alfa düzeyine karar verilmelidir (Thompson, 2008, s. 145). Böylelikle, araştırmanın başında Tip I hata yapma olasılığını sınırlandırmış oluruz.  Ancak alfa değerinin 0.01 seçip sonrasında istenmeyen sonuçlar çıktığında bu değeri 0.05 yükselterek araştırma sonuçlarını değiştirmeye çalışmak doğru bir strateji değildir (Thompson, 2008, s 146). Alfa level ve alfa değeri olarak da bilinen bu değer genelde 0.05 ya da %5 olarak alınır (Field, 2009, s. 56). Bu hata payını %5 veya %1 olarak almak tamamen araştırmacının görüşüne ve yaptığı araştırmaya bağlıdır. %5’lik Tip I hata yapma payı araştırma sonuçlarının literatüre etkisi açısından uygun ise bu düzeyde kalınır ancak daha muhafazakâr sonuçlar elde etmek isteniyorsa olasılığı %1’lik düzeye indirmek önemlidir. Diğer bir ifade ile seçilen anlamlılık düzeyinin 0,05 olması takdirde gerçekte doğru olan sıfır hipotezini yanlışlıkla reddetme şansı 100 denemeden 5 olurken, anlamlılık düzeyi 0,01’e indiğinde 1. Tip hata yapma ihtimali 100 denemeden 1 olacak şekilde azalacaktır (Akbulut, 2010, s. 17; Field, 2009, s. 56).
Tip I hata “gerçekte anlamlı olmayan bir durumu anlamlı bulmak” olarak tanımlanmıştır (Akbulut, 2010, s. 16). Tip I hata; gerçekte/evrende herhangi bir etki yokken, biz etki olduğuna inanıyorsak tip I hata yapmışız demektir.

Uyarı: Tip I hata yapma olasılığını gösteren alfa seviyesi, güvenilirlik hesaplamalarında sıkça kullanılan Cronbach alfa katsayısı ile karıştırılmamalıdır (Thompson, 2008, s. 145).
Uyarı: Unutulmamalıdır ki hipotez testleri rastgele örnekleme üzerine kurulmuştur ve yapılan çalışmalardaki örneklemlerin de rassal olarak evrenden alındığı varsayılmıştır.  Rassal örneklemler yöntemi kullanılmadığı takdirde Tip I hata anlamlılık seviyesine eşit olmayabilir.
Uyarı: Literatürde Yapılan çalışmalara bakıldığında tip I hata yapma ihtimalini 0,05, 0,01 ve 0,001 olarak alındığı görülmüştür. Böyle otomatik bir seviyeyi çalışmanız için kullanmanın sakıncalı sonuçlar doğurabileceği unutulmamalıdır (Howell, 2008, s. 160). Yapılan çalışmalarda alfa seviyesini 0,025 gibi araştırmanın doğasına uygun en küçük değeri seçmekte fayda vardır (Thompson, 2008, s. 145).

Tip II hata
Bazen gerçekte doğru olmayan bir durumu hipotez testi sonucu reddetmeyebiliriz. Yani gerçekte anlamlı olan bir durumu anlamlı bulamayabiliriz. Bu türde bir hata ise Tip 2 hata olarak tanımlanır (Akbulut, 2010, s. 16). Tip II hata yapma olasılığı ise beta(β) ile gösterilir.
Field (2009, s. 56) Tip II hatayı; gerçekte etki varken, etki olmadığına kararı verdiğimizde ortaya çıkan hata türü şeklinde anlatır. İdeal olarak tip II hatayı en aza indirgemek istesek de Cohen (1990) Tip II hatanın %20 den fazla olmamasını tavsiye etmiştir. Özetle, Tip II hata yapma olasılığı en fazla 0,20 ile sınırlandırılmıştır.
Uyarı: Tip II hata yapma ihtimalini gösteren Beta sembolü ile regresyon analizinde sonuç olarak çıkan regresyon katsayıları sembolü beta karıştırılmamalıdır.
Aşağıda verilen tabloda bu hataları özeti yapılmaktadır.



H0 GERÇEKTE DOĞRU MU?


Evet
Hayır
Araştırmacının kararı

H0 reddet
TİP I HATA = ALFA
DOĞRU KARAR (1- BETA)
H0 reddetme
DOĞRU KARAR (1- ALFA)
TİP II HATA = BETA

Tip I hata ve Tip II hata arasında bir alışveriş söz konusudur. Eğer biz alfa yani Tip I hata yapma ihtimalini azaltırsak (yani ,05’ten ,01’e indirirsek) gerçekte olan bir etkiyi reddetme olasılığını yani Tip II hatayı artırmış oluruz. Böyle bir durumda tip I hata ile tip II hataya nasıl karar vereceğiz? Bu tamamen yapacağımız çalışmanın sonuçlarının önemine bağlı olarak değişmektedir. Eğer çalışmanın sonunda hedef kitle için çok önemli kararlar verilecek ise o zaman mümkün oldukça Tip I hatayı düşük tutmak gerekmektedir (Howell, 2008, s. 160). Tam tersi bir durumda tip I hata yapma ihtimalini yükselterek Tip II hata yapma olasılığı azaltılır.
Tablodan çıkarıldığı üzere kurgulanan yokluk hipotezini reddettiğinizde Tip II hata yapma ihtimali ortadan kalkar. Benzer şekilde, yokluk hipotezi reddedilmediğinde Tip I hata yapma ihtimali bulunmaz. İkisinde varsayımları birbirinden farklıdır. Yani bir durumda hem Tip I hem Tip II hata görülemez (Thompson, 2008, s. 148).
Sosyal bilimlerde yapılan araştırmalarda Tip I hata ve Tip II hatayı engellemek mümkün değildir ancak Tip I hata yapma olasılığı yeterli örneklem büyüklüğü seçilerek kontrol altına alınabilir (Kalaycı, 2010, s. 68).
Ancak bazı çalışmalarda kullanılan örneklem büyüklüğü gerçekte etkisi olamayan hipotez testlerinin istatistiksel manada anlamlı çıkmasına sebep olabilmektedir. Bu sebepten, bir değişkenin etkisinden bahsederken yalnızca hipotez testlerinin anlamlı çıkıp çıkmamasına bakmak yeterli gelmemektedir (Field, 2009, s. 53).

Yapılan hipotez testleri sonucunda hesaplanan test istatistiğinin istatistiksel olarak anlamlı çıkması, onun oluşturduğu etkinin önemli olduğu anlamına gelmemektedir. Diğer bir ifade ile istatistiksel manada anlamlı çıkan bir hipotez gerçek hayatta önemsiz olarak görülebilir. Böyle bir durumda, çalışmalarımızın hem istatistiksel manada hem de uygulamada önemini göstermek için etki büyüklüğü hesaplamalarını yapmamız gerekmektedir. Gözlemlenen etkinin standartlaştırılmış bir ölçümü olarak tanımlanan etki büyüklüğü (effect sizes), benzer çalışmaların birbiriyle karşılaştırılmasını dahası bu çalışmalarda meta-analiz yapılmasına olanak sağlamaktadır. Hipotez testleri yapılırken etki büyüklüğünün ortaya konularak sonuca karar verilmesi bulguların yorumlanmasını kolaylaştırmaktadır (Büyüköztürk, 2015, s. 44).
Etki büyüklüğü; “test sonucunda doğru olarak saptayabilmek istediğimiz minimum değişiklik miktarı” veya “hipotez testi uygulanan bağımlı ve bağımsız değişkenler arasındaki ilişkinin kuvvet miktarı” olarak tanımlanır (Alpar, 2016, s. 277; Büyüköztürk, 2015, s. 44). Etki büyüklüğü araştırmanın başında literatürdeki benzer çalışmalardan veya pilot çalışmadan tahmin edilebileceği gibi, çalışma sonrasında gözlenen değerler üzerinden formüller yardımıyla da hesaplanabilir (Alpar, 2016, s. 277).
Hipotez testlerinin büyük örneklemlere göre hassas olması ve çok büyük örneklemlerde ufak farkların bile anlamlı çıkabilmesinden dolayı örneklemden etkilenmeyen etki büyüklüğü hesaplamalarının raporlanması tavsiye edilir (Alpar, 2016, s. 277). Uygulanacak olan hipotez testinin türüne bağlı olarak farklı etki büyüklüğü hesaplamaları vardır: eta (η), etakare (η2), kısmi eta-kare, R2, r, d, Çoklu R2, cohen f, omega kare (ω), epsilon kare(ε2). Eta-kare tekniği iki örneklem t-testlerinde ve varyans analizlerinde kullanılırken iki değişkenin ilişkisinin araştırıldığı testlerde ise R2 tercih edilir. Eta-kare ve r değerleri 0 ile 1 arasında değişir ve bu değer 1 e yaklaştıkça etki büyüklüğü artar.  Bu hesaplamalar sonrasında çıkan sonuçlar yine benzer çalışmaların etki büyüklükleri ile karşılaştırılarak yorumlanabilir (Alpar, 2016, s. 277). Böylece bulunan etki büyüklüğünün uygulamaya katkısının büyüklüğü de değerlendirilmiş olur.
Bir çok farklı etki büyüklüğü hesaplaması olmasına karşın en çok bilinenleri ve kullanılanları eta kare, cohen’s d, pearson korelasyon katsayısı r ve odd oranıdır (Field, 2009, s. 57). Andy Field (2009, s. 57) kişisel tercih olarak korelasyon katsayısını tercih ettiğini söylese de, grup büyüklüklerinin birbirinden farklı olduğu durumlarda Cohen’s d hesaplamalarını kullanmak daha doğru sonuçlar verecektir (Alpar, 2016, s. 277). Cohen (1992) makalesinde yaptığı öneriler şu biçimdedir:

Eta kare değeri
Etki değerlendirilmesi
Eta-kare < 0,01
küçük etki
0,01<Eta-kare < 0,06
orta etki
0,06< eta-kare < 0,14
geniş etki

Cohen’s d değeri için ise;
Cohen’d değeri
Etki değerlendirilmesi
d< 0,2
küçük etki
0,2< d < 0,5
orta etki
0,5< d < 0,8
geniş etki

Korelasyon katsayısı için;
Korelasyon değeri
Etki değerlendirilmesi
Açıklanan varyans
r= ,10
küçük etki
Etki toplam varyansın %1’ini açıklıyor (r^2 = .1)
r= ,30
orta etki
Etki toplam varyansın %9’unu açıklıyor (r^2 = .9)
r= ,50
büyük etki
Etki toplam varyansın %25’ini açıklıyor (r^2 = .25)

Cohen’in kitabında belirtiği gibi etki büyüklüklerini küçük, orta ve büyük biçiminde etiketlemek her zaman mantıklı sonuçlar çıkarmayabilir (Huck, 2008, s. 199; Thompson, 2008, s. 198). Bir sosyolog için küçük etki sayılabilecek bir değer eğitimci için orta etki büyüklüğünde olabilir. Bu sebepten, etki büyüklükleri hesaplandıktan sonra sonuçları yorumlarken çalışma grubu ve alanın da dikkate alınması gerekmektedir. Ayrıca tek bir çalışma etkinin büyüklüğü konusunda çok bilgi vermeyebilir. Dolayısıyla, meta-analizi çalışmaları yardımıyla doğru sonuçlar ortaya konulabilir (Thompson, 2008, s. 198). Diğer bir ifade ile yalnızca etki büyüklüklerini kaynak göstererek sonuca ulaşmak yerine meta-analitik bir bakış açısı geliştirerek ve araştırmanın ortamını göz önünde bulundurarak etkinin büyüklüğü yorumlanmalıdır (Thompson, 2008, s. 210).

                                          

Hangi çalışmalar için hangi etki büyüklüğü hesaplaması kullanılmalıdır?
ANOVA için eta-kare, her hücrede eşit örneklem büyüklüğü olan gruplar arası varyans analizi için omega kare. Tek değişkenli analizler için Cohen’s d kullanılır (Tabachnick ve Fidell, 2015, s. 54).

Uyarı: Etki büyüklüğünü hesaplamak ve raporlamak neden önemlidir?
Yapılan analizlerin istatistiksel olarak anlamlı çıkması uygulamada anlamlı olduğunu göstermemektedir. Yapılan çalışmaların uygulamaya katkısını göstermek amacıyla etki büyüklüğünün hesaplanıp raporlaştırılması gerekmektedir. Son dönemlerdeki dünya literatüründeki saygın dergilerde etki büyüklüğü ön koşul olarak istenmektedir. Farklı hesaplama yöntemlerine sahip olan etki büyüklüğünü çalışmalardan hesaplayıp okuyucuya sunmak önemlidir. Ayrıca, meta-analiz yapmak isteyen araştırmacıların analiz yapmalarında katkı sağlanmış olunur.



Evrendeki etki büyüklüğü hesaplanırken örneklem büyüklüğü, alfa seviyesi ve 1- beta değerleri ön plana çıkmaktadır. İstatistiksel güç olarak da bilinen 1-beta değeri alınan örneklem büyüklüğü de testin etkiyi tespit edebilme gücü/seviyesi olarak tanımlanabilir. Etki büyüklüğü, örneklem büyüklüğü, alfa seviyesi ve istatistiksel güçten herhangi 3’ü bilindiği takdirde geriye kalan diğer değerler hesaplanabilmektedir (Field, 2009, s. 58). Örneğin, alfa=0,05 olarak aldığımız bir deneysel çalışmanın örneklem etki büyüklüğünü Cohen’s d veya eta-kare değerleriyle hesaplayabiliriz. Örneklem büyüklüğü de ortada olduğuna göre bu üç değeri temel alarak güç analizini yapmak kolaydır.  Eğer çıkan güç analizi sonucu 0,8 (1-0,2)’den fazla ise yaptığımız çalışmanın evrende mevcut olan etkinin tespit edilebilirliğine dair yeterli güce sahibiz demektir (Field, 2009, s. 58). 0,8’in çok altında çıkan değerler bizim çalışmamızın çok kaliteli olmadığını ve belki de tekrarlanması gerektiğini gösterir. İstatistiksel güç analizleri karmaşık gelse de bu tür analizleri yapmak için programlar geliştirmişlerdir. Ücretsiz olarak indirilip kullanabilen programlardan biri de GPower’dir (GPower programını indirmek için tıklayınız). Ayrıca bu programlar yardımıyla araştırmaya başlamadan önce hedeflediğimiz güçte analiz yapmak için (örneğin 1-beta= ,85) nasıl bir örneklem büyüklüğüne ihtiyacımız olduğu da hesaplanabilir (Field, 2009, s. 58).  
Reha Alpar’a (2016, s. 225) göre güç analizi araştırmanın başında yapılmalıdır. Ancak bunu yaparken birden fazla hipotez mevcut ise en büyük örneklemi isteyen hipoteze göre hareket edilir. Araştırmanın sonrasında da güç analizi ve etki büyüklüğü hesaplanabilir ve bunlar gözlenen güç ve gözlenen etki büyüklüğü biçiminde ifade edilir (Alpar, 2016, s. 225). Yapılan çalışmaların sonrasında da gözlenen güç ,80’in altında çıkarsa bu durum genelde araştırma örneklem büyüklüğünün yetersiz olduğu ve sonuçları ortaya koyacak kadar hassas ölçüm yapılmadığı şeklinde yorumlanır (Alpar, 2016, s. 225). Diğer taraftan, çok büyük örnekleme sahip olan araştırmalardan gerçekte anlamlı olmayan durumları da anlamlı bulma eğilim gösterir ve araştırmacıları yanlış yönlendirebilir.
Tip II hatayı yapma ihtimalini ve dolayısıyla gücü etkileyen faktörleri bulmak Tip I hata yapma olasılığını bulmaktan daha zordur. Bu faktörler arasında bazıları kontrol edilebilirken bazıları ise kontrol edilemez. Gücü etkileyen faktörler sırasıyla: alfa (anlamlılık seviyesi), örneklem büyüklüğü, bağımlı değişkenin güvenirliği ve etki büyüklüğüdür. Alfa değeri azaldığı (diğer faktörler sabit kaldığı) takdirde yani 0,05’ten 0,01’e indiği zaman beta seviyesi artar, güç azalır. Bu durumda görülüyor ki, Tip I hatayı azaltayım derken testin güzünden kaybedebiliriz. Ancak alfa seviyesi sabit bırakılarak (0,05 gibi), örneklem büyüklüğü artırıldığı takdirde beta da azalma olup ve dolayısıyla testin gücü artar. Testin gücünü artırmada kullanılacak diğer bir yöntem ise güvenilir ölçme araçları kullanmaktır. Güvenirliği düşük araçlarla toplanan verilerde hata payı fazla olacağından testin gücü azalacaktır. Bu sebepten, analize geçmeden önce güvenirliği en yüksek ölçme araçlarını tespit ederek kullanmak testin gücü için önemli bir faktördür. Diğer etki eden faktör de etki büyüklüğüdür ve etki büyüklüğü testin tespit edebileceği minimum fark olarak tanımlanabilir.

Testin gücünü etkileyen faktörler:
·         Alfa azalırsa güç artar.
·         Örneklem büyüklüğü n artarsa güç artar.
·         Etki büyüklüğü (eta-kare) artarsa güç artar.
·         Bazı testler için tek yönlü testin gücü çift yönlü testin gücünden fazladır.

Tip II hata payını azaltmaya yönelik araştırmacıların yapması gerekenler;
·         Öncelikle ulaşılmak istenilen minimum etki büyüklüğü seviyesini belirlenir.
·         Sonrasında farkı tespit edebilecekler minimum güce karar verilir. Tip I hata için 0,05’in kabul gördüğü sosyal bilimlerde beta için 0,20 kullanılabilir. Dolayısıyla istatistiksel güç minimum 0,80 olarak alınabilir.
·         Sonrasında alfa anlamlılık seviyesi belirlenir.
Bu üç seviye belirlendikten sonra bilgisayar programlar(Gpower) veya formüller yardımıyla örneklem büyüklüğü hesaplanabilir.

Uyarı: p=0,049 gibi 0,05’e yakın bir değer bulunduğu durumlarda ne yapılmalı?
            Hipotez testlerinde yalnızca sonuçların anlamlı olup olmadığını vermek yeterli bilgi vermeyebilir. Bu gibi durumlarda güven aralıkları ve etki büyüklüğü yardımıyla çalışma desteklenmeli ve sonuçların güvenirliği artırılmalıdır (Alpar, 2016, s. 278).

Anlamlılık düzeyi ve güven aralığı kavramları birbirleriyle denge içindedir. Yüzde 5’lik anlamlılık düzeyi seçilmiş bir hipotez testi için %95’lik bir güven aralığı hesaplanabilir (Kalaycı, 2010, s. 68). Hipotez testlerini güven aralıkları bakış açısıyla ifade edersek sıfır hipotezinin reddedilmemesi için hipotez testi sonucunun % 95’lik güven aralığı değerleri arasında bulunması gerekmektedir.

Akbulut, Y. (2010). Sosyal bilimlerde SPSS uygulamaları: Sık kullanılan istatiksel analizler ve açıklamalı SPSS çözümleri. İstanbul: İdeal Kültür Yayıncılık.
Alpar, R. (2016). Uygulamalı çok değişkenli istatistiksel yöntemler. Ankara: Detay Yayıncılık.
Büyüköztürk, Ş. (2015). Sosyal bilimler için veri analizi el kitabı: İstatistik, araştırma deseni. Ankara: Pegem Yayıncılık.
Cohen, J. (1992). A power primer. Psychological Bulletin112(1), 155.
Field, A. (2009). Discovering statistics using SPSS. Thousand Oaks, CA: Sage.
Huck, S. W. (2012). Reading statistics and research. New York, NY: Pearson.
Howell, D. C. (2016). Fundamental statistics for the behavioral sciences. Boston: Nelson Education.
Kalaycı, Ş. (2010). SPSS uygulamalı çok değişkenli istatistik teknikleri. Ankara: Asil Yayın Dağıtım.
Tabachnick, B. G., & Fidell, L. S. (2015). Çok değişkenli istatistiklerin kullanımı (Çev. Ed. M. Baloğlu). Ankara: Nobel Akademik.
Thompson, B. (2008). Foundations of behavioral statistics: An insight-based approach. New York, NY: Guilford Press.