Младший инженер по данным - прогнозирование энергии

Вакансия закрыта
Оплата: По договоренности
Удаленно
Full-time

Вы погрузитесь в реальные кейсы прогнозирования энергопотребления, улучшите ETL-скрипты и освоите Apache Airflow.


Вам предстоит  

- Создавать и поддерживать простые пайплайны данных для задач прогнозирования потребления энергии.  

- Анализировать качество сыровых данных, устранять пропуски, дубликаты, аномалии.  

- Оптимизировать существующие Python /SQL- скрипты, сокращая время выполнения и ресурсопотребление.  

- Настраивать расписания DAG’ов в Apache Airflow (изучение под наставничеством).  

- Писать понятную техническую документацию, фиксируя логику трансформаций.  

- Сотрудничать с аналитиками и дата-сайентистами, внедряя их модели в продуктивный контур.  

- Мониторить метрики пайплайнов, инициировать улучшения при сбоях.  


Опыт и знания, которые мы ценим 

- Базовое понимание ETL-процессов и структур хранения данных.  

- Уверенное владение Python: pandas, SQLAlchemy, Jupyter.  

- Знакомство с SQL (SELECT, JOIN, оконные функции).  

- Навыки решения задач: вы формулируете проблему, предлагаете варианты, проверяете гипотезу.  

- Английский на уровне чтения технической документации.  

- Желание учиться: Airflow, Spark, BigQuery, Docker.  

- Готовность к коммуникации - async-чат, стендапы, короткие демо.  


Что важно вам знать  

- Проект - цифровая платформа в энергетике, мы прогнозируем нагрузку и оптимизируем генерацию.  

- Вы будете работать в кросс-функциональной команде: DevOps, ML-инженеры, продукт-менеджер.  

- Наставник выделит 4-6 часов в неделю на код-ревью и парное программирование.  

- Современный стек: Python 3.11, FastAPI, PostgreSQL 14, Airflow 2.8, GitLab CI/CD.  

- Формат гибридный: офис-хабы в крупных городах, приоритет - удаленная занятость из любой точки РФ.