Я выполнила несколько проектов:
1. Анализ бронирований и пользовательского поведения в сервисе Яндекс.Афиша.
Задачи:
● Исследовать динамику ключевых бизнес-показателей.
● Выявить успешные сегменты по выручке.
● Оценить поведение пользователей в разрезе устройств и типов мероприятий.
● Проверить гипотезы о различиях в поведении пользователей мобильных и стационарных устройств.
Что сделала:
● Разработала аналитический дашборд в Yandex DataLens на основе SQL-запросов для отслеживания KPI, анализа популярности мероприятий и структуры выручки.
● Провела предобработку и исследовательский анализ 13k заказов билетов.
● Изучила сезонные изменения спроса, распределение событий по регионам и партнёрам.
● Проверила статистические гипотезы о различиях поведения пользователей.
Стек: SQL, DataLens, Python (pandas, matplotlib, seaborn, numpy, scipy), Jupyter Notebook.
Дашборд: https://datalens.yandex/skfq3ozyxtwqd
2. Исследование стартапов.
Задачи:
● Провести исследовательский анализ данных о стартапах для построения бизнес-модели финансовой компании.
● Изучить динамику финансирования, сделки по приобретению компаний, категории стартапов и влияние статуса компании на инвестиционные раунды.
Что сделала:
● Провела предобработку 5 таблиц (2 таблицы по ~200k строк и 2 по ~100k строк).
● Проанализировала распределение финансирования и выявила неравномерность инвестиций.
● Изучила характеристики компаний: численность сотрудников, образование, категории.
● Проанализировала сделки по продаже стартапов, включая аномальные сделки за 0 или 1 доллар.
● Исследовала количество инвестиционных раундов в зависимости от статуса компании (IPO, acquired и другие).
Стек: Python (pandas, matplotlib, seaborn, phik), Jupyter Notebook.
3. Проверка гипотезы о различии времени активности пользователей из Москвы и Санкт-Петербурга.
Задача:
● Проверить гипотезу, что пользователи из Санкт-Петербурга проводят больше времени за чтением и прослушиванием книг, чем пользователи из Москвы.
Что сделала:
● Загрузила и очистила данные.
● Проверила дубликаты.
● Рассчитала статистики по группам.
● Проверила гипотезу с помощью A/B-теста.
● Сформулировала выводы и возможные объяснения.
Стек: Python (pandas, scipy, statsmodels), Jupyter Notebook.