Анализ цен на покупку недвижимости в Москве:
● Парсинг 3500+ наблюдений, предобработка данных в Python (выбросы, категориальные признаки).
● Корреляционный и статистический анализ, визуализация в Python (boxplotsгистограммы, scatter-plot).
● Машинное обучение: линейная регрессия, случайный лес.
Анализ влияния ключевых характеристик фильмов на пользовательский рейтинг:
● Разработка гипотез: «Агрегированная оценка критиков (Metascore) положительно влияет на пользовательский рейтинг фильма» и «Фильмы с более строгим возрастным рейтингом получают, в среднем, более высокие пользовательские оценки».
● Сбор и обработка данных (3000+ записей, Pandas), статистический анализ в Python (описательная статистика, StatModels).
● Визуализация (матрица корреляций, boxplots, Matplotlib и Seaborn) и выводы по гипотезам.
Влияние TikTok на успеваемость студентов:
● Разработка гипотезы о влиянии TikTok на успеваемость студентов.
● Симулирование данных (1000+ наблюдений), предобработка и статистический анализ (NumPy, Pandas, StatsModels).
● Построение моделей: OLS, логистическая регрессия, случайный лес, градиентный бустинг, CatBoost (scikitlearn, CatBoost, StatsModels).
● Оценка ATE, CATE, LATE с помощью Double ML, IV, X-Learner (scikit-learn, EconML, StatsModels).
● Построение визуализации: гистограммы, scatter plot, ROC-кривые (Matplotlib, Seaborn).