Globalne wyszukiwanie nie jest włączone
Przejdź do głównej zawartości

1 Kursy

Nauczyciel: Paweł Rościszewski

Organizacja współdzielenia serwerów obliczeniowych z GPU za pomocą narzędzia TensorHive

Cel pokazu:

Celem pokazu jest zapoznanie uczestników z praktykami dotyczącymi wydajnego współdzielenia zasobów obliczeniowych do zadań związanych z uczeniem maszynowym. Zaprezentowane zostaną metody monitorowania i rezerwacji serwerów wyposażonych w GPU oraz uruchamiania rozproszonych procesów przy użyciu narzędzia TensorHive.

Treść:

1. Przedstawienie możliwości oraz ograniczeń podstawowych narzędzi do monitorowania i selekcji GPU (nvidia-smi i CUDA_VISIBLE_DEVICES);

2. Pokaz instalacji narzędzia TensorHive;

3. Pokaz wykorzystania narzędzia TensorHive do monitorowania rozproszonych procesorów graficznych;

4. Pokaz wykorzystania narzędzia TensorHive do rezerwacji i kontroli dostępu do rozproszonych procesorów graficznych.

5. Omówienie procesów typowych dla bibliotek TensorFlow oraz PyTorch oraz sposobu ich definiowania wraz z listami parametrów;

6. Pokaz uruchamiania rozproszonych procesów treningu sieci neuronowych za pomocą narzędzia TensorHive.