Аннотация: В условиях глобального потепления, роста цен на энергоносители, вызванного энергетическим кризисом, оптимизация систем энергопотребления становится все более и более востребованной, как со стороны бизнеса, так и со стороны государств. Активная цифровизация в энергетической отрасли способствует внедрению технологий искусственного интеллекта для управления энергопотреблением. Целью данного исследования является минимизация затрат на электроэнергию на примере ледовой арены. Используя данные, полученные с датчиков интернета-вещей, необходимо разработать модель глубокого обучения с подкреплением, поддерживающую оптимальное состояние ледового покрытия. Результаты моделирования показывают, что применение алгоритмов обучения с подкреплением приводит к снижению потребления энергии.
Введение
Расходы на электроэнергию и обеспечение контроля климата внутри ледовых арен, а также их техническое содержание являются основными проблемами при строительстве и проектировании объектов такого типа.
[1] При использовании на уже построенных ледовых аренах современных технологий удается значительно сократить потребление энергии при одновременном уменьшении эксплуатационных расходов и обеспечении качества поддержания микроклимата внутри помещений.
Для внедрения управления холодильной установкой на ледовой арене, потребление которой составляет от 60 до 80% от всего объекта [1], на этапе предварительного планирования можно недорого установить интеллектуальную систему на основе IoT ("Интернет вещей").
Чтобы создать систему мониторинга и управления, к поверхности здания прикрепляются приборы IoT для выполнения важных задач. Иначе говоря, IoT-устройства устанавливаются на здании и внутри оборудования в непосредственной близости от внешней среды, и это не требует замены тяжелого и дорогостоящего оборудования для реализации интеллектуальной системы управления в эксплуатируемом здании. Кроме всего прочего, датчики и устройства управления IoT монтируются на поверхности объекта для сбора энергетической и климатической информации и интеллектуального управления объектом на основе этой информации. Концепция IoT заключается в использовании больших данных, благодаря которой осуществляется анализ об энергии и окружающей среде из большого количества данных, собранных с IoT-устройств за определенный период времени, в результате чего к системе управления могут быть применены наиболее эффективные рекомендации по энергосбережению. Система управления использует полученные, на основе проанализированных данных, рекомендации для обеспечения оптимальных условий эксплуатации объекта для потребителя при одновременном снижении расхода энергии.
Литературный обзор
Материалы и методы
2. испаритель;
3. конденсатор;
4. регулирующий клапан;
5. система управления.
Рисунок 1. Устройство холодильной машины
Рисунок 2. Взаимодействие между агентом и средой в марковском процессе принятия решений.
Ожидаемая награда на соседних временных шагах связана друг с другом:
Функция ценности состояния при стратегии определяется:
В двойном DQN [22] значения Q-функции оцениваются и обновляются с помощью двух глубоких нейронных сетей: Q-сети и целевой сети. Q-сеть принимает наблюдения из окружающей среды в качестве входных данных и возвращает Q-значения для каждого действия в качестве выходных. В качестве наилучшего действия выбирается действие с наибольшим значением из Q-сети.Обучение Q-сети проводится с помощью целевой сети и воспроизведения опыта [23]. На каждом шаге исходное
Чтобы иметь возможность постоянно учиться, алгоритм должен балансировать между эксплуатацией (выбором тех действий, с помощью которых он уже научился получать наилучшие результаты) и исследованием (пробными действиями, которые еще не протестированы). Это реализуется с помощью ε-жадной стратегии: с вероятностью ε вместо оптимального на основе текущей Q-функции совершается случайное действие.
На рисунке 3 показан реализованный пример обучения с подкреплением для нахождения наилучших заданных значений заданного значения температуры толщи ледового покрытия через 30 минут для достижения оптимального вознаграждения (поддержка уставки – 3.5°С).
Рисунок 3. Пример обучения с подкреплением для нахождения наилучших заданных значений заданного значения температуры толщи ледового покрытия.
Результаты
2. pump – потребление циркуляционного насоса, который характеризует производительность; теплообмена между гликолем и льдом, напрямую влияя на объем прокачки теплоносителя, кВт*ч;
3. compressors – суммарное потребление 4 ступеней компрессоров, кВт*ч;
4. hum_inside – относительная влажность внутри арены, %;
5. illum – уровень освещенности внутри арены, единица измерения - условная;
6. max_motion – уровень максимально зафиксированного движения на льду, единица измерения - условная;
7. cur_motion – уровень текущего движения, единица измерения - условная;
8. temp_inside – внутренняя температура ледовой арены, °C;
9. temp_outside – внешняя температура, °C;
10.temp_supply_glyc – температура подаваемого гликоля (теплоносителя) в контур теплоносителя, °C;
11. temp_return_glyc – температура возвращаемого гликоля из контура теплоносителя, °C;
12. time – время в минутах.
Состоянием окружающей среды в данной работе принят прогноз состояния толщи льда (temp_body) через 30 минут. В качестве признаков для обучения использовались агрегированные поминутные данные, собранные с датчиков, установленных на ледовой арене.
Рисунок 4. График функции вознаграждения агента.
Таблица 1. Характеристики набора данных.
Рисунок 5. Прогноз модели CNN + LSTM.
Рисунок 6. Производительности моделей.
Таким образом была выбрана модель CNN + LSTM в качестве окружающей среды, где ее состоянием является прогноз температуры толщи льда через тридцать минут.
Таблица 2. Сравнение MAE обученных моделей.
Базовая модель потребления – это модель поведения объекта до внедрения комплекса мер по энергоэффективности. Обучать модель необходимо на данных мониторинга до реализации управления.
Обучена линейная регрессионная модель базового уровня потребления на данных за период 21.09.22 – 20.10.22, которая учитывает режим нагрузки на лед, сезонность и строит потребление энергии компрессоров в час:
Рисунок 7. Базовый уровень потребления компрессоров.
За все время обучения средняя награда составила 7.33 при средней температуре толщи льда – 3.87.
Рисунок 8. Температура толщи льда, действия и вознаграждения.
льда резко возрастала.
Рисунок 9. Потребление суммы компрессоров в сутки.
Обсуждения
Заключение
Список литературы