Veri Görselleştirme: Doğru Grafik Nasıl Seçilir?
İyi bir grafik, bin kelimelik açıklamadan daha fazlasını anlatır. Kötü bir grafik ise gerçeği çarpıtabilir, izleyiciyi yanıltabilir ya da mesajı büsbütün gizleyebilir. Veri görselleştirme hem bir bilim hem de bir sanattır; doğru grafik türünü seçmek, renkleri ve ölçekleri bilinçli kullanmak ham veriyi anlamlı bir hikayeye dönüştürür. Tufte'nin (1983) data-ink ratio ilkesinden Wilkinson'ın (2005) Grammar of Graphics felsefesine kadar bu alanın sağlam teorik temelleri vardır.
Grafik Türleri ve Ne Zaman Kullanılır
Çubuk Grafik (Bar Chart)
Kategoriler arasındaki değerleri karşılaştırmak için idealdir. Dikey çubuklar zaman içindeki değişimleri, yatay çubuklar ise uzun etiketli kategorileri göstermede daha okunaklıdır. Dikkat: çubuk grafiğin ekseni her zaman sıfırdan başlamalıdır; aksini yapmak farklılıkları abartır.
Pasta Grafik (Pie Chart)
Bir bütünün parçalarını göstermek için kullanılır. Ancak insan gözü açıları karşılaştırmakta zayıftır; bu nedenle pasta grafikler 3-4 kategoriden fazlası için önerilmez. Kategoriler dörtten fazlaysa yığılmış çubuk grafik (stacked bar) çok daha okunabilirdir.
Çizgi Grafik (Line Chart)
Zaman içindeki değişimi göstermek için en uygun grafik türüdür. Birden fazla çizgi eklenebilir; ancak 5-6 çizgiden fazlası grafiği karmaşık hale getirir. Zaman serisi analizlerinde, trendleri ve mevsimselliği görselleştirmede vazgeçilmezdir.
Saçılım Diyagramı (Scatter Plot)
İki sürekli değişken arasındaki ilişkiyi gösterir. Korelasyon var mı? Doğrusal mı, eğrisel mi? Aykırı değerler nerede? Bu soruların tümüne scatter plot yanıt verir. Renk ve boyut kodlamasıyla üçüncü ve dördüncü değişken de aynı grafiğe eklenebilir.
Kutu Grafik (Boxplot)
Dağılımın özetini ve aykırı değerleri eş zamanlı gösterir. Birden fazla grubu karşılaştırmak için çok kullanışlıdır. Özellikle dağılımların merkezi, yayılımı ve asimetrisi hakkında çok bilgi verir. Violin plot, boxplot'un dağılımın yoğunluk bilgisini de katan zenginleştirilmiş versiyonudur.
Isı Haritası (Heatmap)
Korelasyon matrisleri, karışıklık matrisleri veya zaman × kategori verisi için idealdir. Renk yoğunluğu değer büyüklüğünü temsil eder. Yüzlerce değeri tek bir görsel tabloda sunar.
| Grafik Türü | Ne Zaman Kullanılır | Kaçınma Durumu |
|---|---|---|
| Çubuk grafik | Kategorik karşılaştırma | Çok fazla kategori (15+) |
| Çizgi grafik | Zaman serisi, trend | Sırasız kategorik veri |
| Scatter plot | İki sürekli değişken ilişkisi | Kategorik değişkenler |
| Boxplot | Grup karşılaştırması, dağılım | Tek gözlem |
| Pasta grafik | 2-4 kategorili pay analizi | 5+ kategori veya benzer değerler |
| Heatmap | Matris yapısındaki veri | Az sayıda değer (tablo yeterli) |
Renk Seçimi İlkeleri
Renk görselleştirmede en güçlü ve en çok kötüye kullanılan araçtır. Temel ilkeler:
- Sıralı veriler için ardışık (sequential) palet: Açıktan koyuya tek renk geçişi. Örneğin mavi tonları nüfus yoğunluğunu göstermek için.
- Iraksayan (diverging) veriler için ikili palet: Orta değerden iki yönde giden renkler. Örneğin korelasyon matrisinde mavi-beyaz-kırmızı.
- Kategorik veriler için niteliksel (qualitative) palet: Birbirinden belirgin şekilde ayrılan renkler. Renk körlüğüne duyarlı ColorBrewer paletleri tercih edilmelidir.
💡 Tufte İlkesi — Veri-Mürekkep Oranı: Grafikteki her mürekkep damlası bir veri noktasını temsil etmelidir. Gereksiz ızgara çizgileri, 3D efektler, gölgeler ve abartılı arka plan desenleri grafiği süslemez, aksine mesajı gizler.
ggplot2 ve matplotlib Karşılaştırması
R'daki ggplot2 paketi Wilkinson'ın Grammar of Graphics ilkelerine dayanır: veri, estetik (aes) ve geometri (geom) katmanlarını birleştirerek son derece özelleştirilebilir ve tutarlı grafikler üretir. Varsayılan temaları bile yayın kalitesine yakındır.
Python'daki matplotlib daha düşük seviyeli bir kütüphanedir; her şey elle ayarlanabilir ama ayrıntılar çok zaman alabilir. Seaborn, matplotlib üzerine kurulu yüksek seviyeli bir API sunarak ggplot2'ye benzer kullanım kolaylığı sağlar. Plotly ise interaktif grafikler için güçlü bir seçenektir.
Yaygın Görselleştirme Hataları
- Eksen sıfırdan başlatmamak — farklılıkları abartır
- Kesik eksen (truncated axis) kullanmak — oransal karşılaştırmayı bozar
- Tek renk kullanırken renk körlüğünü göz ardı etmek
- Başlık ve eksen etiketi olmayan grafik sunmak
- 3D pasta veya 3D çubuk grafik kullanmak — perspektif yanılsaması yaratır
- Örneklem boyutunu belirtmemek
Verilerinizi Görsel Hikayeye Dönüştürelim
Akademik yayın kalitesinde veya iş sunumu için etkileyici, doğru ve anlaşılır veri görselleri hazırlıyoruz. ggplot2, matplotlib ve Plotly ile.
Ücretsiz Danışma AlKaynaklar
- Tufte, E. R. (1983). The Visual Display of Quantitative Information. Graphics Press.
- Wilkinson, L. (2005). The Grammar of Graphics (2nd ed.). Springer.