🤖 Makine Öğrenmesi

Makine Öğrenmesi Nedir?
Temel Kavramlar ve Uygulama Alanları

📅 3 Haziran 2026 ⏱ 9 dakika okuma ✍️ FM Analitik

Makine öğrenmesi (Machine Learning), bilgisayar sistemlerinin açıkça programlanmadan veriden öğrenmesini ve deneyimle performansını geliştirmesini sağlayan yapay zeka dalıdır. Geleneksel programlamada kurallar insan tarafından yazılırken, makine öğrenmesinde bu kuralları veriden sistem kendisi çıkarır. Bu temel fark, makine öğrenmesini özellikle karmaşık ve çok boyutlu problemlerde son derece güçlü kılar.

Makine Öğrenmesi Nasıl Çalışır?

Bir makine öğrenmesi modeli temel olarak üç aşamadan geçer:

  1. Eğitim (Training): Model, etiketli veya etiketsiz verilerle beslenir ve içindeki örüntüleri öğrenir.
  2. Doğrulama (Validation): Modelin genelleme yeteneği test verisiyle ölçülür; aşırı öğrenme (overfitting) kontrol edilir.
  3. Tahmin (Prediction): Eğitilen model yeni ve daha önce görmediği verilere uygulanır.

Modelin başarısı; doğruluk (accuracy), kesinlik (precision), duyarlılık (recall) ve F1 skoru gibi metriklerle değerlendirilir.

Makine Öğrenmesi Türleri

1. Denetimli Öğrenme (Supervised Learning)

Her eğitim örneği için doğru cevap (etiket) mevcuttur. Model, girdi-çıktı ilişkisini öğrenerek yeni girdiler için tahmin üretir.

  • Sınıflandırma: Çıktı kategoriktir. Örn: e-posta spam mı değil mi?
  • Regresyon: Çıktı süreklidir. Örn: ev fiyatı tahmini.

Yaygın algoritmalar: Lojistik Regresyon, Karar Ağaçları, Rastgele Orman (Random Forest), Destek Vektör Makineleri (SVM), Gradyan Artırma (XGBoost).

2. Denetimsiz Öğrenme (Unsupervised Learning)

Veride etiket yoktur; model kendi başına yapı ve örüntü keşfeder.

  • Kümeleme (Clustering): Benzer örnekleri gruplar. Örn: müşteri segmentasyonu.
  • Boyut azaltma: Veriyi daha az değişkenle temsil eder. Örn: PCA.
  • Birliktelik kuralları: Birlikte görülen örüntüleri bulur. Örn: market sepet analizi.

Yaygın algoritmalar: K-Means, DBSCAN, Hiyerarşik Kümeleme, PCA, t-SNE.

3. Pekiştirmeli Öğrenme (Reinforcement Learning)

Bir ajan, çevresiyle etkileşime girerek ödül/ceza mekanizmasıyla öğrenir. Oyun oynayan yapay zekalar ve robot kontrolü bu kategoriye girer. Veri bilimi projelerinde daha az yaygındır; uzmanlık gerektirir.

💡 Hangi türü seçmeliyim? Etiketli veriniz varsa ve bir sonuç tahmin etmek istiyorsanız → Denetimli öğrenme. Veriyi anlamlandırmak, gruplamak istiyorsanız → Denetimsiz öğrenme. Karar verme süreçlerini otomatikleştirmek istiyorsanız → Pekiştirmeli öğrenme.

Temel Kavramlar

Aşırı Öğrenme (Overfitting) ve Az Öğrenme (Underfitting)

Aşırı öğrenme, modelin eğitim verisini ezberlemesi ve yeni verilerde başarısız olmasıdır. Az öğrenme ise modelin veriyi yeterince kavrayamamasıdır. İkisi arasındaki denge (bias-variance tradeoff) makine öğrenmesinin en kritik konularından biridir.

  • Aşırı öğrenmeyi önlemek için: Regularization (L1/L2), dropout, erken durdurma (early stopping)
  • Az öğrenmeyi önlemek için: Daha karmaşık model, daha fazla özellik (feature) kullanmak

Özellik Mühendisliği (Feature Engineering)

Ham veriden modele yararlı girdiler türetme sürecidir. Gereksiz değişkenleri çıkarmak, eksik verileri doldurmak, kategorik değişkenleri kodlamak (one-hot encoding) bu sürecin parçasıdır. Genellikle model seçiminden daha fazla etkiye sahiptir.

Çapraz Doğrulama (Cross-Validation)

Modelin farklı veri bölümlerinde nasıl performans gösterdiğini ölçen tekniktir. En yaygın yöntem k-fold cross-validation'dır: veri k parçaya bölünür, model her seferinde farklı bir parçayı test seti olarak kullanarak k kez eğitilir.

Uygulama Alanları

  • Finans: Kredi riski skorlaması, dolandırıcılık tespiti, hisse senedi tahmini
  • Sağlık: Hastalık teşhisi, ilaç keşfi, hasta riski sınıflandırması
  • Perakende: Müşteri segmentasyonu, ürün öneri sistemleri, talep tahmini
  • Üretim: Arıza tahmini (predictive maintenance), kalite kontrol
  • Pazarlama: Churn tahmini, kampanya optimizasyonu, duygu analizi
  • Doğal Dil İşleme: Metin sınıflandırma, çeviri, özetleme

Makine Öğrenmesi için Hangi Araçlar Kullanılır?

  • Python: En yaygın kullanılan dil. scikit-learn, TensorFlow, PyTorch, XGBoost kütüphaneleri
  • R: İstatistiksel modelleme için güçlü. caret, randomForest, glmnet paketleri
  • Jupyter Notebook: Analiz ve görselleştirme için standart ortam
  • AutoML araçları: H2O, AutoSklearn — kod yazmadan model eğitimi

💡 Başlangıç için tavsiye: Python + scikit-learn kombinasyonu en iyi başlangıç noktasıdır. Temel sınıflandırma ve regresyon modellerini öğrendikten sonra derin öğrenme (deep learning) kütüphanelerine geçilebilir.

Makine Öğrenmesi ile Geleneksel İstatistiğin Farkı

Geleneksel istatistik açıklayıcı (explanatory) odaklıdır: değişkenler arası ilişkileri anlamaya çalışır. Makine öğrenmesi ise tahmin (predictive) odaklıdır: doğruluğu maksimize etmek önceliklidir. Bu nedenle araştırma sorularınıza göre hangisini kullanacağınıza karar vermelisiniz:

  • "X, Y'yi etkiliyor mu?" → İstatistiksel analiz (regresyon, t-testi)
  • "Y'yi en doğru şekilde tahmin edebilir miyim?" → Makine öğrenmesi

Kaynaklar

  • Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3rd ed.). O'Reilly Media.
  • Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An Introduction to Statistical Learning (2nd ed.). Springer.
  • Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning (2nd ed.). Springer.

Makine Öğrenmesi Projeniz İçin Destek Alın

Python veya R ile model geliştirme, değerlendirme ve raporlama için profesyonel destek. 24-48 saat içinde teslim.

Hemen Sipariş Ver   Teklif Al