Customize Dataloader¶

📂

ZhiJian is an unifying and rapidly deployable toolbox for pre-trained model reuse.

Overview¶

In the following example, we show how to customize your own dataloader for a new target dataset in ZhiJian.

Feel free to deploy model reusability technology on any dataset, with loading in the conventional PyTorch style.

Prepare Custom Dataset¶

Configure without dataset configuration and organize the custom dataset in the following structure:

within the your/dataset/dir directory
create a separate folder for each category

store all the data corresponding to each category within its respective folder

/your/dataset/directory
├── train
│   ├── class_1
│   │   ├── train_class_1_img_1.jpg
│   │   ├── train_class_1_img_2.jpg
│   │   ├── train_class_1_img_3.jpg
│   │   └── ...
│   ├── class_2
│   │   ├── train_class_2_img_1.jpg
│   │   └── ...
│   ├── class_3
│   │   └── ...
│   ├── class_4
│   │   └── ...
│   ├── class_5
│   │   └── ...
└── test
    ├── class_1
    │   ├── test_class_1_img_1.jpg
    │   ├── test_class_1_img_2.jpg
    │   ├── test_class_1_img_3.jpg
    │   └── ...
    ├── class_2
    │   ├── test_class_2_img_1.jpg
    │   └── ...
    ├── class_3
    │   └── ...
    ├── class_4
    │   └── ...
    └── class_5
        └── ...

Set up the custom dataset:

train_transform = transforms.Compose([
    transforms.RandomResizedCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize(
        mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]
    )
])
val_transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(
        mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]
    )
])

train_dataset = ImageFolder(root='/your/dataset/directory/train', transform=train_transform)
val_dataset = ImageFolder(root='/your/dataset/directory/test', transform=val_transform)

Implement the corresponding loader:

train_loader = torch.utils.data.DataLoader(
        train_dataset,
        batch_size=args.batch_size,
        num_workers=args.num_workers,
        pin_memory=True,
        shuffle=True
    )
val_loader = torch.utils.data.DataLoader(
        val_dataset,
        batch_size=args.batch_size,
        num_workers=args.num_workers,
        pin_memory=True,
        shuffle=False
    )
num_classes = len(train_dataset.classes)

Now, set up the trainer with passing in parameter train_loader and val_loader:

trainer = prepare_trainer(
    args,
    model=model, model_args=model_args, device=device,
    train_loader=train_loader,
    val_loader=val_loader,
    num_classes=num_classes,
    optimizer=optimizer,
    lr_scheduler=lr_scheduler,
    criterion=criterion
)

trainer.fit()
trainer.test()

$ Log level set to: INFO
  Log files are recorded in: your/log/directory/0718-20-10-57-792
  Trainable/total parameters of the model: 0.30M / 86.10M (0.34700%)

      Epoch   GPU Mem.       Time       Loss         LR
          1/5      5.48G      1.686       1.73      0.001: 100%|██████████| 1.00/1.00 [00:01<00:00, 1.22s/batch]

      Epoch   GPU Mem.       Time      Acc@1      Acc@5
          1/5      5.48G     0.3243         16        100: 100%|██████████| 1.00/1.00 [00:00<00:00, 2.39batch/s]
  ***   Best results: [Acc@1: 16.0], [Acc@5: 100.0]

      Epoch   GPU Mem.       Time       Loss         LR
          2/5       5.6G      1.093      1.448 0.00090451: 100%|██████████| 1.00/1.00 [00:00<00:00, 1.52batch/s]

      Epoch   GPU Mem.       Time      Acc@1      Acc@5
          2/5       5.6G     0.2647         12        100: 100%|██████████| 1.00/1.00 [00:00<00:00, 2.58batch/s]
  ***   Best results: [Acc@1: 12.0], [Acc@5: 100.0]

      Epoch   GPU Mem.       Time       Loss         LR
          3/5       5.6G      1.088      1.369 0.00065451: 100%|██████████| 1.00/1.00 [00:00<00:00, 1.54batch/s]

      Epoch   GPU Mem.       Time      Acc@1      Acc@5
          3/5       5.6G     0.2899         12        100: 100%|██████████| 1.00/1.00 [00:00<00:00, 2.54batch/s]
  ***   Best results: [Acc@1: 12.0], [Acc@5: 100.0]

      Epoch   GPU Mem.       Time       Loss         LR
          4/5       5.6G      1.067      1.403 0.00034549: 100%|██████████| 1.00/1.00 [00:00<00:00, 1.53batch/s]

      Epoch   GPU Mem.       Time      Acc@1      Acc@5
          4/5       5.6G     0.2879         16        100: 100%|██████████| 1.00/1.00 [00:00<00:00, 2.42batch/s]
  ***   Best results: [Acc@1: 16.0], [Acc@5: 100.0]

      Epoch   GPU Mem.       Time       Loss         LR
          5/5       5.6G      1.077      1.342 9.5492e-05: 100%|██████████| 1.00/1.00 [00:00<00:00, 1.55batch/s]

      Epoch   GPU Mem.       Time      Acc@1      Acc@5
          5/5       5.6G      0.246         16        100: 100%|██████████| 1.00/1.00 [00:00<00:00, 2.79batch/s]
  ***   Best results: [Acc@1: 16.0], [Acc@5: 100.0]

      Epoch   GPU Mem.       Time      Acc@1      Acc@5
          1/1       5.6G     0.2901         16        100: 100%|██████████| 1.00/1.00 [00:00<00:00, 2.52batch/s]
  ***   Best results: [Acc@1: 16.0], [Acc@5: 100.0]