2020-10-02 Quelques articles#

`Compiling ONNX Neural Network Models Using MLIR
<https://arxiv.org/pdf/2008.08272.pdf>`_
Scaling Distributed Training with Adaptive Summation
ZeRO: Memory Optimizations Toward Training Trillion Parameter Models