CollieDataLoader¶
- class CollieDataLoader(dataset, batch_size, accumulation_steps=1, shuffle=False, pin_memory=True, collate_fn=None, num_workers=None, sampler=None, drop_last=False, data_efficiency_config={})[源代码]¶
CoLLiE 封装的 DataLoader。
在流水线并行的情景下每次迭代取出
batch_size * accumulation_steps个 sample。- 参数:
dataset –
batch_size –
pin_memory (default:
True) –shuffle (default:
False) –accumulation_steps (default:
1) –collate_fn (default:
None) –num_workers (default:
None) –sampler (default:
None) –drop_last (default:
False) – 当最后一个 batch 样本数不足时是否丢弃。在流水线情况下如果为False,则会补齐最后一个 batch。data_efficiency_config (default:
{}) – DeepSpeed 中关于Data Effiency部分的设置