
1 Kursy
Cel pokazu:
Celem pokazu jest zapoznanie uczestników z praktykami dotyczącymi wydajnego współdzielenia zasobów obliczeniowych do zadań związanych z uczeniem maszynowym. Zaprezentowane zostaną metody monitorowania i rezerwacji serwerów wyposażonych w GPU oraz uruchamiania rozproszonych procesów przy użyciu narzędzia TensorHive.
Treść:
1. Przedstawienie możliwości oraz ograniczeń podstawowych narzędzi do monitorowania i selekcji GPU (nvidia-smi i CUDA_VISIBLE_DEVICES);
2. Pokaz instalacji narzędzia TensorHive;
3. Pokaz wykorzystania narzędzia TensorHive do monitorowania rozproszonych procesorów graficznych;
4. Pokaz wykorzystania narzędzia TensorHive do rezerwacji i kontroli dostępu do rozproszonych procesorów graficznych.
5. Omówienie procesów typowych dla bibliotek TensorFlow oraz PyTorch oraz sposobu ich definiowania wraz z listami parametrów;
6. Pokaz uruchamiania rozproszonych procesów treningu sieci neuronowych za pomocą narzędzia TensorHive.