Роман Иванов

← В ленту

Регистрация: 17.03.2025

Специализация: Data Scientist

JavaScript Machine Learning SQL Tensorflow Matplotlib Data Science Python

Скиллы

Data Science

JavaScript

SQL

Python

PyTorch

TensorFlow

Pandas

Numpy

C/C++

Matplotlib

Machine learning

Deep Learning

Git

Docker

HTML/CSS

PostgreSQL

OOP

Web programming

Natural Language Processing

FastAPI

Опыт работы

Программист-разработчик

с 03.2024 - По настоящий момент |NDA

Python, PyTorch, Docker, Hugging Face, OpenCV

1. Yolo-based детекция объектов (Python, PyTorch, Docker). ● Разработал приложение для детекции объектов в реальном времени с использованием архитектуры Yolo (tiny-YOLO/Darknet). ● Реализовал пайплайн обработки видео: предобработка кадров, инференс модели, постобработка с non-max suppression и отрисовка bounding boxes. ● Оптимизировал производительность за счет распараллеливания вычислений на GPU и кэширования промежуточных результатов. ● Настроил автоматическое логирование метрик обучения (потери, точность), добавил early stopping для предотвращения переобучения. ● Интегрировал решение в Docker-контейнер для упрощения развертывания, включая настройку CUDA-совместимой среды. 2. Fine-tuning Bert для классификации документов (Python, Hugging Face). ● Адаптировал предобученную Bert-модель для задачи классификации текстовых документов на 10 категорий. ● Провел предобработку данных: токенизация, формирование attention masks, балансировка датасета через аугментацию текста. ● Реализовал механизм динамического изменения learning rate с использованием оптимизатора AdamW и линейного расписания. ● Добился точности 92% на тестовой выборке, сократив время обучения на 20% за счет заморозки начальных слоев модели. ● Разработал API для инференса с использованием FastAPI, обеспечивающий обработку до 50 запросов в секунду. 3. Распознавание рукописных цифр (Python, OpenCV, PyTorch). ● Создал end-to-end пайплайн для извлечения и классификации цифр из изображений (на основе MNIST и кастомного датасета). ● Реализовал алгоритм сегментации цифр через бинаризацию изображений и кластеризацию DBSCAN с автоматическим подбором параметров. ● Разработал CNN-архитектуру с тремя сверточными блоками и dropout-слоями, достигшую 98.7% точности на валидационной выборке. ● Внедрил non-max suppression для фильтрации пересекающихся bounding boxes, что снизило количество ложных срабатываний на 35%. ● Добавил визуализацию промежуточных этапов обработки (бинаризация, сегментация) через Matplotlib для отладки.

Образование

Информатика и вычислительная техника

По настоящий момент

Московский государственный технологический университет "Станкин"

Языки

РусскийРоднойАнглийскийСредний