Дарья Cолодова

Регистрация: 13.03.2026

Специализация: Data Science Engineer

— Учусь на третьем курсе МФТИ, интересуюсь алгоритмами и оптимизацией. — Люблю статистику и теорию вероятностей. — Считаю, что лучший код — тот, который легко читать и поддерживать. — Быстро осваиваю новые технологии и эффективно применяю их на практике. — Умею работать в команде, соблюдаю дедлайны и требования к стилю кода. — Открыта к новым вызовам и возможностям для профессионального роста.

Python SQL Git PostgreSQL Docker Linux Jira C++ GitHub Machine Learning Confluence JSON Excel Bash pandas Bootstrap

Скиллы

Python

Pandas

NumPy

Sentence-Transformers

Scikit-learn

Опыт работы

Стажер-разработчик

06.2025 - 08.2025 |Яндекс

REST API

● Разработала и внедрила систему мониторинга для видеохостинга. ● Развивала функциональность различных утилит для видео. ● Разрабатывала REST API эндпоинты для управления артиклями бизнеса. ● Работала с высоконагруженными распределенными системами, Protocol Buffers и системами мониторинга Juggler, Solomon.

Ассистент, соавтор учебных материалов

02.2025 - 10.2025 |ИИ МФТИ

ИИ

● Участвовала в создании открытого учебного курса: разрабатывала конспекты, практические задания и примеры кода для репозитория OPTIMIZATION-METHODS-COURSE. ● Ассистировала в организации учебного процесса: проводила консультации и проверяла работы на основе созданных материалов.

Ассистент

09.2025 - 01.2026 |Центральный университет

MS Office, CRM

● Ассистировала на курсе, проверяла домашние задания и проводила экзамены.

Data Science Engineer

Проекты

BM25, Sentence Transformers, LightGBM, Python, spaCy, Scikit-learn

Детектор семантических дубликатов с LTR-ранжированием ● Реализовала двухэтапную архитектуру (Retrieval + Re-ranking) для поиска дубликатов вопросов. ● Использовала BM25 для отбора кандидатов и LightGBM Ranker для сортировки на гибридных признаках (BM25, Sentence Transformer). ● Повысила метрику Recall@1 с 73.5% до 89.2%. Интеллектуальный классификатор SMS-спама ● Разработала ML-пайплайн и провела сравнительный анализ моделей: Naive Bayes, Logistic Regression, LinearSVC. ● Использовала spaCy для предобработки текста. Модель LinearSVC достигла F1-score 0.9366, показав лучший баланс метрик.

Образование

Прикладная математика и информатика (Бакалавр)

с 2022 - По настоящий момент

МФТИ

Языки

АнглийскийВыше среднего