Medikal Görüntülerde Bilgisayarlı Görü

Original article was published on Deep Learning on Medium

Eğer ikiden fazla sınıfın yani etiketin olduğu durum varsa yine aynı şekilde ağırlıklandırılmış yitim hesabı yapılırken her bir etiket için bu işlem gerçekleştirilmelidir.

Diğer bir sorun da veri kümesi boyutunun az olmasıdır. Genelde nesne sınıflandırma gibi çalışmalarda böyle bir sorun yoktur. Konu sağlık verisi olunca işler değişiyor. Bu problemi çözmek için de temel iki yaklaşımı benimsemek uygun olur. Ama yine de dikkatlı olmalıyız! Önceden eğitilmiş model ile sağlık veri kümemizi eğiterek bir transfer öğrenme uygulaması yapabiliriz. Burada da sık yapılan bir hata, modelin son katmanlarında hatta bazen sadece sınıflandırma katmanından faydalanarak medikal bir görüntüyü sınıflandırmaya çalışmaktır. Oysa eğitilmiş modelin hangi tür ve domaindeki verilerle eğitildiği de çok önemlidir. Sizin veriniz ile model ön eğitiminde (pre-training) kullanılan verinin boyutları arasındaki ilişki de değerli bir kriterdir. Aşağıdaki şekilde de gördüğünüz gibi 4 farklı şekilde transfer öğrenme stratejisi benimseyebiliriz. Eğitilen modelin veri kümesi ile sağlık görüntüsünün benzerliği zayıftır. Elimizdeki X-ray görüntü büyüklüğümüz de azdır. Demek oluyor ki; aşağıdaki veri büyüklüğü-veri benzerliği grafiğinde sol alttaki gibi ilk katmanları farklı veri kümesinde eğitilmiş ancak modelin orta ve daha derin katmanlarında sağlık verileri ile eğitim yapılması gerekir.

Açık seminer sunumundan

Transfer öğrenme hakkında daha detaylı bilgiye buradan erişebilirsiniz.

Açık seminer sunumundan

Bu sorun için önerilen bir başka yöntem de veri artırmadır. Ancak yine nesne tanıma problemlerini ele aldığımız gibi davranamayız. Soldaki şekilde yukarda gördükleriniz uygun veri artırma yöntemidir. Ancak aşağıdaki gibi y ekseninde simetrisi alınan bir görüntüde kalbin yeri tamamen değişir ve bu nadir rastlanan bir hastalığın belirtisidir. Bu yüzden eğer bu şekilde bir çalışma yapıldıysa ya mutlaka çoğaltılmış olan verinin etiketi konusunda da hemfikir olması gerekir ya da güvenilir veri artırma yöntemleri uygulanmalıdır.

Veri artırma uygulamalı anlatımına buradan erişebilirsiniz.

📈 Değerlendirme Metrikleri

AI for Medicine

Tabiri caizse veri kümenizin çöp olmaması ve modelinizin başarımını doğru anlamlandırabilmeniz için hastanın çakışması, küme örnekleme stratejisi ve gerçek etiket kesinliği gibi 3 konuyu doğru şekilde ele almış olmanız gerekir.

Nesne tanıma problemlerinde aynı verilerin eğitim, test ve geçerleme (validation) kümelerinde olmamasına özen gösteririz. Sağlık verisinde bir hastanın birden fazla görüntüsü varsa bu görüntüler farklı mıdır yoksa aynı mıdır? Görüntülerin etiketleri değişmiş; yani kişi hastalanmış ya da iyileşmiş olsa da aynı kişiye ait bir veri hem eğitimde hem de test kümesinde olmamalıdır. Basit örüntüler evrişimli sinir ağları tarafından kolay öğrenilir ve kolay unutulmaz. Eğer böyle bir hata yapılırsa, test performansını yukarı çeken bir manipülasyon yapılmış olur ve bu hatanın literatürdeki adı aşırı-iyimser test seti performansıdır (over-optimistic test set performance) ve gerçeği yansıtmaz!

Açık seminer sunumundan

Pekala; eğitim ve geçerleme setlerini hasta IDlerine göre ayırdığımızı varsayalım ve test kümesindeki rastgele örneklerimizi test edelim. Biraz bekleyin! Yukardaki şekilde bir sorun daha var: hastalıklı görüntülerdeki veri dengesizliği sebebiyle genellikle test kümeniz normale (bias) yanlıdır. Bu da test kümesinden doğru bir performans değerlendirmesi yapılamamasına sebep olur. Bu yüzden nesne tanıma problemlerinden farklı olarak, önce test kümesi mümkün derecede sınıflandırılması istenen etiketli verilerden barındırdığına emin olarak düzenlenmelidir. Ardından geçerleme ve eğitim kümeleri uygun şekilde hazırlanmalıdır.

Açık seminer sunumundan

Gerçek etiketimizden şüphe duyduduğumuz durumlar olabilir. Örneğin; soldaki şekilde bir X-ray görüntüsü uzmanlara gösterildiğinde kimi zatürre kimi ise COVID-19 tanısı koyabilmektedir. O halde, biz bunu nasıl güvenilir şekilde etiketleyebiliriz? Uzmanların eş görüş veremediği durumda, uzman görüşlerinin ortalamaları bizim etiketimiz olarak atanabilir ya da bir grup uzmanın kendi arasında tartışıp tek bir görüş sunması istenebilir. Ancak bu şekilde görüş alarak bu sorunun önüne geçmek mümkün olabilir.