Младший инженер по данным - прогнозирование энергии
Вакансия закрытаВы погрузитесь в реальные кейсы прогнозирования энергопотребления, улучшите ETL-скрипты и освоите Apache Airflow.
Вам предстоит
- Создавать и поддерживать простые пайплайны данных для задач прогнозирования потребления энергии.
- Анализировать качество сыровых данных, устранять пропуски, дубликаты, аномалии.
- Оптимизировать существующие Python /SQL- скрипты, сокращая время выполнения и ресурсопотребление.
- Настраивать расписания DAG’ов в Apache Airflow (изучение под наставничеством).
- Писать понятную техническую документацию, фиксируя логику трансформаций.
- Сотрудничать с аналитиками и дата-сайентистами, внедряя их модели в продуктивный контур.
- Мониторить метрики пайплайнов, инициировать улучшения при сбоях.
Опыт и знания, которые мы ценим
- Базовое понимание ETL-процессов и структур хранения данных.
- Уверенное владение Python: pandas, SQLAlchemy, Jupyter.
- Знакомство с SQL (SELECT, JOIN, оконные функции).
- Навыки решения задач: вы формулируете проблему, предлагаете варианты, проверяете гипотезу.
- Английский на уровне чтения технической документации.
- Желание учиться: Airflow, Spark, BigQuery, Docker.
- Готовность к коммуникации - async-чат, стендапы, короткие демо.
Что важно вам знать
- Проект - цифровая платформа в энергетике, мы прогнозируем нагрузку и оптимизируем генерацию.
- Вы будете работать в кросс-функциональной команде: DevOps, ML-инженеры, продукт-менеджер.
- Наставник выделит 4-6 часов в неделю на код-ревью и парное программирование.
- Современный стек: Python 3.11, FastAPI, PostgreSQL 14, Airflow 2.8, GitLab CI/CD.
- Формат гибридный: офис-хабы в крупных городах, приоритет - удаленная занятость из любой точки РФ.
