PyTorch 自定義資料集 (Custom Dataset)

“CAPTCHA” by Markus Spiske on Unsplash PyTorch 將資料用torch.utils.data.Dataset類別包裝起來,定義每一次訓練迭代的資料長相,例如:一張影像和一個標籤、一張影像和多個標籤、一張影像和多個矩形方框的座標與長寬……等,並且將所有資料打包起來,再送進torch.utils.data.DataLoader類別,再定義如何取樣資料,以及使用多少資源來得到一個批次 (batch) 的資料。 常用的資料集官方已整理好,逕行呼叫使用,如下熊秘書以 MS COCO 資料集為例;亦能夠依照同學們的需求,建立自定義資料集,以下針對此兩種使用方式介紹。 官方支持的常見資料集 官方提供以下常用公開資料集的 torchvision.datasets 類別,按應用條列如下,熊秘書皆建立資料集主頁面的連結,點擊進入將有更詳細的資料集說明與下載方式。 物件辨識:MNIST、EMNIST、Fashion-MNIST、LSUN、ImageFolder、Imagenet-12、CIFAR、STL10、SVHN 物件偵測:MS COCO 標題生成:MS COCO 其他:PhotoTour、DatasetFolder 其中,將影像按資料夾儲存,如下所示。ImageFolder class

Read more