Обучение акустических нейросетевых моделей
Команда для запуска процесса обучения акустических нейросетевых моделей:
python ./openav/api/train_audio.py --config <путь_к_вашему_конфигурационному_файлу>.yaml
Important
Для запуска команды необходимо обязательно указать путь к конфигурационному файлу. Запускать программу необходимо из директории, где она расположена.
Конфигурационный файл
Конфигурационный файл включает в себя следующие настройки:
Отображение процесса выполнения программы в терминале (командной строке)
Работа с файловой системой
Параметры настройки процесса обучения нейросетевых моделей
Пример конфигурационного файла
Important
Для обучения на видеоадапторе потребуется вручную установить библиотеку для машинного обучения PyTorch с использованием GPU.
Отображение процесса выполнения команды в терминале
Параметр |
Тип |
Значение по умолчанию |
Описание |
|---|---|---|---|
hide_metadata |
bool |
|
Включение отображения метаданных |
hide_libs_vers |
bool |
|
Включение отображения версий установленных библиотек в командной строке |
Работа с файловой системой
Параметр |
Тип |
Значение по умолчанию |
Описание |
|---|---|---|---|
path_to_dataset |
str |
|
Директория, где размещается подготовленный набор данных для обучения нейросетевых моделей |
Параметры процесса обучения акустических нейросетевых моделей
Параметр |
Тип |
Значение по умолчанию |
Описание |
|---|---|---|---|
len_audio |
int |
|
Количество аудиофайлов |
size_spec |
int |
|
Размер входного изображения спектрограммы в |
padding_spec |
bool |
|
Добавление отступов на изображениях спектрограмм |
seed |
int |
|
Параметр для инициализации случайных процессов, который обеспечивает воспроизводимость результатов и одинаковые начальные условия |
batch_size |
int |
|
Размер батча. Общее число тренировочных объектов, представленных в одном батче. Устанавливается в зависимости от возможности вашего оборудования |
channels_spec |
int |
|
Количество каналов изображения. |
lr |
float |
|
Коэффициент скорости обучения. Чем меньше значение, тем дольше будет идти обучение модели. Однако, стоит помнить, что может наступить переобучение модели. Данный коэффициент подбирается эмпирическим путем |
epoch |
int |
|
Количество эпох обучения модели. Проход одной эпохи значит, что весь датасет прошел через нейронную сеть в прямом и обратном направлении только один раз. Параметр |
epoch_stop |
int |
|
Количество эпох, в течении которых модель не прогрессирует в обучении. Т.е. если по прошествии, например, |