← В ленту
Регистрация: 17.03.2025

Роман Иванов

Специализация: Data Scientist

Скиллы

Data Science
JavaScript
SQL
Python
PyTorch
TensorFlow
Pandas
Numpy
C/C++
Matplotlib
Machine learning
Deep Learning
Git
Docker
HTML/CSS
PostgreSQL
OOP
Web programming
Natural Language Processing
FastAPI

Опыт работы

Программист-разработчик
с 03.2024 - По настоящий момент |NDA
Python, PyTorch, Docker, Hugging Face, OpenCV
1. Yolo-based детекция объектов (Python, PyTorch, Docker). ● Разработал приложение для детекции объектов в реальном времени с использованием архитектуры Yolo (tiny-YOLO/Darknet). ● Реализовал пайплайн обработки видео: предобработка кадров, инференс модели, постобработка с non-max suppression и отрисовка bounding boxes. ● Оптимизировал производительность за счет распараллеливания вычислений на GPU и кэширования промежуточных результатов. ● Настроил автоматическое логирование метрик обучения (потери, точность), добавил early stopping для предотвращения переобучения. ● Интегрировал решение в Docker-контейнер для упрощения развертывания, включая настройку CUDA-совместимой среды. 2. Fine-tuning Bert для классификации документов (Python, Hugging Face). ● Адаптировал предобученную Bert-модель для задачи классификации текстовых документов на 10 категорий. ● Провел предобработку данных: токенизация, формирование attention masks, балансировка датасета через аугментацию текста. ● Реализовал механизм динамического изменения learning rate с использованием оптимизатора AdamW и линейного расписания. ● Добился точности 92% на тестовой выборке, сократив время обучения на 20% за счет заморозки начальных слоев модели. ● Разработал API для инференса с использованием FastAPI, обеспечивающий обработку до 50 запросов в секунду. 3. Распознавание рукописных цифр (Python, OpenCV, PyTorch). ● Создал end-to-end пайплайн для извлечения и классификации цифр из изображений (на основе MNIST и кастомного датасета). ● Реализовал алгоритм сегментации цифр через бинаризацию изображений и кластеризацию DBSCAN с автоматическим подбором параметров. ● Разработал CNN-архитектуру с тремя сверточными блоками и dropout-слоями, достигшую 98.7% точности на валидационной выборке. ● Внедрил non-max suppression для фильтрации пересекающихся bounding boxes, что снизило количество ложных срабатываний на 35%. ● Добавил визуализацию промежуточных этапов обработки (бинаризация, сегментация) через Matplotlib для отладки.

Образование

Информатика и вычислительная техника
По настоящий момент
Московский государственный технологический университет "Станкин"

Языки

РусскийРоднойАнглийскийСредний