← В ленту
Регистрация: 13.03.2026

Дарья Cолодова

Специализация: Data Science Engineer
— Учусь на третьем курсе МФТИ, интересуюсь алгоритмами и оптимизацией. — Люблю статистику и теорию вероятностей. — Считаю, что лучший код — тот, который легко читать и поддерживать. — Быстро осваиваю новые технологии и эффективно применяю их на практике. — Умею работать в команде, соблюдаю дедлайны и требования к стилю кода. — Открыта к новым вызовам и возможностям для профессионального роста.
— Учусь на третьем курсе МФТИ, интересуюсь алгоритмами и оптимизацией. — Люблю статистику и теорию вероятностей. — Считаю, что лучший код — тот, который легко читать и поддерживать. — Быстро осваиваю новые технологии и эффективно применяю их на практике. — Умею работать в команде, соблюдаю дедлайны и требования к стилю кода. — Открыта к новым вызовам и возможностям для профессионального роста.

Скиллы

Python
Pandas
NumPy
Sentence-Transformers
Scikit-learn

Опыт работы

Стажер-разработчик
06.2025 - 08.2025 |Яндекс
REST API
● Разработала и внедрила систему мониторинга для видеохостинга. ● Развивала функциональность различных утилит для видео. ● Разрабатывала REST API эндпоинты для управления артиклями бизнеса. ● Работала с высоконагруженными распределенными системами, Protocol Buffers и системами мониторинга Juggler, Solomon.
Ассистент, соавтор учебных материалов
02.2025 - 10.2025 |ИИ МФТИ
ИИ
● Участвовала в создании открытого учебного курса: разрабатывала конспекты, практические задания и примеры кода для репозитория OPTIMIZATION-METHODS-COURSE. ● Ассистировала в организации учебного процесса: проводила консультации и проверяла работы на основе созданных материалов.
Ассистент
09.2025 - 01.2026 |Центральный университет
MS Office, CRM
● Ассистировала на курсе, проверяла домашние задания и проводила экзамены.
Data Science Engineer
Проекты
BM25, Sentence Transformers, LightGBM, Python, spaCy, Scikit-learn
Детектор семантических дубликатов с LTR-ранжированием ● Реализовала двухэтапную архитектуру (Retrieval + Re-ranking) для поиска дубликатов вопросов. ● Использовала BM25 для отбора кандидатов и LightGBM Ranker для сортировки на гибридных признаках (BM25, Sentence Transformer). ● Повысила метрику Recall@1 с 73.5% до 89.2%. Интеллектуальный классификатор SMS-спама ● Разработала ML-пайплайн и провела сравнительный анализ моделей: Naive Bayes, Logistic Regression, LinearSVC. ● Использовала spaCy для предобработки текста. Модель LinearSVC достигла F1-score 0.9366, показав лучший баланс метрик.

Образование

Прикладная математика и информатика (Бакалавр)
с 2022 - По настоящий момент
МФТИ

Языки

АнглийскийВыше среднего