← В ленту
Регистрация: 29.05.2025

Скиллы

Python
SQL
Machine learning
Data Science
NLP
Pandas
Deep Learning
Sklearn
PyTorch Geometric
Sklearn
XGBoost
CatBoost
LightGBM
Transformers
Gymnasium
OpenCV
SpaCy
NLTK
Surprise
NetworkX
DGL
Pandas
NumPy
PySpark
Power Query
Git
Jupyter
Hue
Matplotlib
Seaborn
Plotly
Streamlit
Excel
DataLens

Опыт работы

Data Scientist
с 11.2024 - По настоящий момент |X5-Retail Group
PySpark MLlib
Сегментация пользователей для увеличения конверсии в партнерских программах: ● Выделил признаки по 2М+ пользователям на основе данных об активности (просмотры, клики, конверсии). ● Cнизил размерность данных с 300+ до 20 признаков, ускорив обучение моделей в 2 раза. ● Иерархически кластеризовал пользователей на 15 ключевых сегментов. ● Интерпретировал кластеры с помощью деревьев решений (PySpark MLlib), дополнительно обучил CatBoost для выявления нелинейных зависимостей. ● Внедрил результаты моделирования в Excel с интераткивными дашбордами. ● Провел A/B тестирование сегментированной рассылки, подтвердив рост CTR в группе B на 8%. ● Результат: Увеличение точности прогнозных моделей на 4% за счет обогащения данных кластерными метками.
Data Scientist
01.2024 - 10.2024 |Аэрофлот, Финансовый Университет
PyTorch
Разработка модели прогнозирования спроса на авиабилеты: ● Разработал и внедрил модель прогнозирования спроса на авиабилеты с использованием PyTorch transformers, превзошедший ARIMA и Prophet по точности на 15% (MAPE: 8.2% -> 6.9%). ● Провел комплексный анализ и визуализацию данных с использованием Matplotlib и Seaborn (ТОП драйверы спроса: сезонные паттерны (пики перед праздниками) и география запросов). ● Разработал Streamlit-приложение с возможностью прогнозировать спрос на заданный период с учетом пользовательских сценариев (выбор класса обслуживания, даты, места вылета и посадки).
Junior Data Scientist
с 12.2023 - По настоящий момент |NDA
PySpark, Python, SQL, Impala, Sklearn
● Фич инжиниринг. ● Обработка данных. ● Кластеризация. ● A/B тестирование.
Стажер-исследователь
12.2022 - 02.2023 |ЦИАРС
Python, Pandas
● Аннотировал наборы данных изображений с помощью VGG Image Annotator. ● Работал с Python и Pandas для подготовки и обработки данных. ● Сотрудничал с исследователями для разработки новых методов обработки данных и повышения качества аннотированных наборов.

Образование

Прикладное машинное обучение (Бакалавр)
с 2022 - По настоящий момент
Финансовый университет при правительстве РФ

Языки

РусскийРоднойАнглийскийВыше среднего