Dengesiz veri setli sağkalım verilerinde Cox regresyon ve rastgele orman yöntemlerin karşılaştırılması


Creative Commons License

Akın P., Terzi Y.

Veri Bilimi, cilt.3, sa.1, ss.21-25, 2020 (Hakemli Dergi)

  • Yayın Türü: Makale / Tam Makale
  • Cilt numarası: 3 Sayı: 1
  • Basım Tarihi: 2020
  • Dergi Adı: Veri Bilimi
  • Sayfa Sayıları: ss.21-25
  • Ondokuz Mayıs Üniversitesi Adresli: Evet

Özet

Cox regresyon modeli, temel olarak, hastaların sağkalım süresi ile bir veya daha fazla faktörlerin yaşam süreleri üzerindeki etkilerini incelemek amacıyla yaygın olarak kullanılan bir regresyon modelidir. Yüksek sayıdaki verilerin oluşu, verilerde doğrusal olmayan durum, yüksek derecede etkileşim ve yüksek boyutlu ilişkileri açıklamada kullanılabilecek Cox Regresyon yöntemine alternatif olarak makine öğrenme yöntemleri kullanılmaya başlanılmıştır. Bu çalışmada, veri seti Ondokuz Mayıs Üniversitesi göğüs hastalıkları servisinde yatmakta olan akut lösemi hastalarından elde edilmiştir. Analizden önce, çıktı değişkenin kategorisindeki dengesizliği düzeltmek için sentetik azınlık aşırı örnekleme (Smote) yöntemi uygulandı. Daha sonra, her hastanın riskini belirmek için rastgele orman ve Cox Regresyon yöntemleri kullanılmıştır. Bu iki yöntem uyum indeks, roc eğrisinin altında elde edilen alan (AUC) ve hata oranına göre karşılaştırılmıştır. Sonuç olarak, rastgele orman sağkalım analizinde Cox regresyonuna alternatif bir yöntem olarak kullanabilir.