1. Yolo-based детекция объектов (Python, PyTorch, Docker).
● Разработал приложение для детекции объектов в реальном времени с использованием архитектуры Yolo (tiny-YOLO/Darknet).
● Реализовал пайплайн обработки видео: предобработка кадров, инференс модели, постобработка с non-max suppression и отрисовка bounding boxes.
● Оптимизировал производительность за счет распараллеливания вычислений на GPU и кэширования промежуточных результатов.
● Настроил автоматическое логирование метрик обучения (потери, точность), добавил early stopping для предотвращения переобучения.
● Интегрировал решение в Docker-контейнер для упрощения развертывания, включая настройку CUDA-совместимой среды.
2. Fine-tuning Bert для классификации документов (Python, Hugging Face).
● Адаптировал предобученную Bert-модель для задачи классификации текстовых документов на 10 категорий.
● Провел предобработку данных: токенизация, формирование attention masks, балансировка датасета через аугментацию текста.
● Реализовал механизм динамического изменения learning rate с использованием оптимизатора AdamW и линейного расписания.
● Добился точности 92% на тестовой выборке, сократив время обучения на 20% за счет заморозки начальных слоев модели.
● Разработал API для инференса с использованием FastAPI, обеспечивающий обработку до 50 запросов в секунду.
3. Распознавание рукописных цифр (Python, OpenCV, PyTorch).
● Создал end-to-end пайплайн для извлечения и классификации цифр из изображений (на основе MNIST и кастомного датасета).
● Реализовал алгоритм сегментации цифр через бинаризацию изображений и кластеризацию DBSCAN с автоматическим подбором параметров.
● Разработал CNN-архитектуру с тремя сверточными блоками и dropout-слоями, достигшую 98.7% точности на валидационной выборке.
● Внедрил non-max suppression для фильтрации пересекающихся bounding boxes, что снизило количество ложных срабатываний на 35%.
● Добавил визуализацию промежуточных этапов обработки (бинаризация, сегментация) через Matplotlib для отладки.