Model Geçerliliği Nasıl Test Edilir?
R², F Testi ve Varsayım Kontrolleri
Bir regresyon modeli kurduğunuzda akla gelen ilk soru genellikle şudur: "Bu model gerçekten işe yarıyor mu?" Model geçerliliği, kurulan regresyon modelinin verileri ne ölçüde açıkladığını ve istatistiksel olarak anlamlı olup olmadığını değerlendirme sürecidir. R², F istatistiği, p değeri ve varsayım kontrolleri bu sürecin temel araçlarıdır. Bu rehberde her birini adım adım ele alıyoruz.
1. R² (R-Kare) — Açıklanan Varyans Oranı
R², bağımsız değişken(ler)in bağımlı değişkendeki varyansı ne ölçüde açıkladığını gösterir. 0 ile 1 arasında değer alır; 1'e yaklaştıkça model daha güçlüdür.
| R² Değeri | Yorum |
|---|---|
| 0.01 – 0.09 | Küçük etki, zayıf açıklama gücü |
| 0.10 – 0.29 | Orta düzey etki |
| 0.30 – 0.49 | Orta-iyi düzey etki |
| ≥ 0.50 | Güçlü açıklama gücü |
Örneğin R² = 0.42 ise model, bağımlı değişkendeki toplam varyansın %42'sini açıklamaktadır.
💡 Önemli: R² modele her yeni değişken eklendiğinde artar — bu nedenle tek başına yanıltıcı olabilir. Birden fazla bağımsız değişken kullanıldığında mutlaka düzeltilmiş R² (Adjusted R²) raporlanmalıdır. Düzeltilmiş R², anlamsız değişken eklenmesini cezalandırır.
2. F İstatistiği — Modelin Genel Anlamlılığı
F testi, kurulan modelin bir bütün olarak istatistiksel açıdan anlamlı olup olmadığını sınar. Şu hipotezi test eder:
- H₀: Tüm bağımsız değişkenlerin katsayıları sıfırdır (model anlamsızdır)
- H₁: En az bir bağımsız değişkenin katsayısı sıfırdan farklıdır
SPSS ve R çıktılarında ANOVA tablosunda görünen F değeri ve ona ait p değeri incelenir:
- p < 0.05 → Model bir bütün olarak istatistiksel açıdan anlamlı
- p ≥ 0.05 → Model anlamlı değil, yorumlamaya devam edilmez
F değeri ne kadar büyükse, model o kadar güçlüdür. Ancak büyük örneklemlerde küçük F değerleri bile anlamlı çıkabilir; bu nedenle R² ile birlikte değerlendirilmelidir.
3. Beta Katsayıları ve p Değerleri
Model genel olarak anlamlıysa, her bağımsız değişkenin bireysel katkısı beta (β) katsayısı ve p değeriyle değerlendirilir:
- Standardize edilmemiş beta (B): Bağımsız değişkendeki 1 birimlik artışın bağımlı değişkende yarattığı değişimi gösterir. Birimi değişkene bağlıdır.
- Standardize edilmiş beta (β): Tüm değişkenler aynı ölçeğe çevrildiğinde göreli etki büyüklüğünü gösterir. Hangi değişkenin daha güçlü etkisi olduğunu karşılaştırmak için kullanılır.
- p değeri: p < 0.05 ise o değişkenin etkisi istatistiksel olarak anlamlıdır.
4. Varsayım Testleri
Regresyon analizinin geçerli sonuçlar üretebilmesi için bazı varsayımların karşılanması gerekir. Bu varsayımların ihlali, model katsayılarını ve p değerlerini güvenilmez kılar.
4a. Normallik
Regresyon artıklarının (residuals) normal dağılım göstermesi beklenir.
- Shapiro-Wilk testi: p > 0.05 → normallik varsayımı karşılanıyor
- Histogram ve Q-Q plot: Görsel kontrol için
- Çarpıklık/basıklık: ±2 aralığında olmalı
4b. Varyans Homojenliği (Homoskedastisite)
Artıkların varyansı, tahmin edilen değerler boyunca sabit olmalıdır. Sabit değilse heteroskedastisite sorunu vardır.
- Artık-tahmin grafikleri: Artıklar rastgele dağılmalı, bir örüntü göstermemeli
- Breusch-Pagan testi: p > 0.05 → homojenlik varsayımı karşılanıyor
4c. Otokorelasyon
Artıklar birbirinden bağımsız olmalıdır. Zaman serisi verilerinde özellikle önemlidir.
- Durbin-Watson istatistiği: 1.5 ile 2.5 arasında olması beklenir. 2'ye yakın değer otokorelasyon olmadığını gösterir.
4d. Çoklu Bağlantı (Multicollinearity)
Çoklu regresyonda bağımsız değişkenlerin birbirleriyle yüksek korelasyon göstermesi sorundur.
- VIF (Variance Inflation Factor): VIF < 5 kabul edilebilir, VIF > 10 ciddi çoklu bağlantı sorunu var demektir.
- Tolerans (Tolerance): 1/VIF. 0.20'nin üzerinde olmalı.
💡 SPSS'te varsayım kontrolleri: Analyze → Regression → Linear yolunda "Statistics" butonundan Collinearity diagnostics (VIF), Durbin-Watson; "Plots" butonundan artık grafikleri; "Save" butonundan standardize artıklar alınarak normallik testi yapılabilir.
5. Sonuçların Raporlanması
APA formatında model geçerliliği raporlama örneği:
"Çoklu doğrusal regresyon analizi sonuçlarına göre kurulan model istatistiksel olarak anlamlıdır, F(3, 146) = 18.42, p < .001. Model, bağımlı değişkendeki varyansın %27'sini açıklamaktadır (R² = .27, Düzeltilmiş R² = .26). VIF değerlerinin 1.12 ile 2.34 arasında olduğu görülmüş; çoklu bağlantı sorunu saptanmamıştır. Durbin-Watson değeri 1.94 olarak hesaplanmış, otokorelasyon olmadığı doğrulanmıştır."
Model Geçerliliği Özet Tablosu
| Test | Ne Ölçer? | Kabul Kriteri |
|---|---|---|
| R² | Açıklanan varyans oranı | Araştırma alanına göre değişir |
| Düzeltilmiş R² | Değişken sayısı düzeltilmiş R² | R²'ye yakın olmalı |
| F istatistiği (p) | Modelin genel anlamlılığı | p < 0.05 |
| Beta p değeri | Değişken anlamlılığı | p < 0.05 |
| VIF | Çoklu bağlantı | < 5 (ideal < 3) |
| Durbin-Watson | Otokorelasyon | 1.5 – 2.5 arası |
| Shapiro-Wilk | Normallik | p > 0.05 |
Kaynaklar
- Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics (4th ed.). SAGE Publications.
- Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences (3rd ed.). Lawrence Erlbaum.
- Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2019). Multivariate Data Analysis (8th ed.). Cengage Learning.
- Tabachnick, B. G., & Fidell, L. S. (2013). Using Multivariate Statistics (6th ed.). Pearson.
Regresyon Modelinizi Birlikte Test Edelim
R², F testi, varsayım kontrolleri ve APA formatında tam raporlama için profesyonel destek. 24-48 saat içinde teslim.
Hemen Sipariş Ver Teklif Al