Veri Artırma (Data Augmentation)

Derin öğrenme yaklaşımlarında genel görüş elimizde ne kadar çok veri mevcutsa modelin o kadar iyi öğreneceği yönünde. Dolayısıyla bazı uygulamalarda mevcut veri setinin az olması yöntem başarısının düşmesini de beraberinde getirmiştir. Bu durumu önlemek amacıyla mevcut veri setinden sentetik veriler üretilerek örnek sayısı artırılmaktadır, buna da “Data Augmentation” adı verilmektedir.

Bu amaçla kullanılan çeşitli teknikler mevcut ancak hangisinin daha iyi olacağına dair kesin bir bilgi yok. Sentetik veri üretilirken amaç, problemimizin gerçek dünyadaki örneklerin çeşitliliğine ne kadar yakın olduğudur. Nesne tanıma problemlerinde genellikle orjinal resmi döndürme (rotation), öteleme (translation), ölçekleme (scaling), resme gürültü (Gauss vb.) ekleme (add noise), resmi belirli bölgeden kırpma (cropping) gibi farklı teknikler uygulanmaktadır.

Source: Deep Learning on Medium