Стажер по интеллектуальному анализу данных
Компания-разработчик продуктов информационной безопасности помогает бизнесу выявлять риски раньше, чем они превращаются в убытки. Мы строим алгоритмы, которые ежедневно проверяют миллионы событий, ищут нестандартные поведения пользователей и сигнализируют о нарушениях. Вам откроется доступ к живым данным, современным практикам DevSecOps и наставничеству экспертов, которые прошли путь от стажёра до тимлида.
Обязанности
– Собирать структурированные выборки из открытых источников с использованием BeautifulSoup и Scrapy.
– Предобрабатывать данные: удалять шум, нормализовать текст, кодировать категории.
– Искать и описывать статистические аномалии в поведенческих логах.
– Визуализировать результаты в Jupyter, отчётах и презентациях для бизнеса.
– Писать чистый Python-код, оформлять pull-request и покрывать функции тестами.
– Работать в распределённой команде через GitLab, Agile-подход и ежедневные стендапы.
– Документировать принятые решения, фиксировать гипотезы и выводы экспериментов.
Требования
– Базовое владение Python 3: списки, словари, функции, PEP-8.
– Понимание принципов HTTP и HTML-структуры страниц.
– Опыт учебных проектов по web-скрейпингу или курсовой аналитике.
– Знание библиотек pandas, numpy, matplotlib на уровне навигации по документации.
– Умение формулировать гипотезы, терпеливо доводить их до результата.
– Грамотная письменная русская речь для описания сделанной работы.
– Самоорганизация при удалённой работе, готовность участвовать в код-ревью.
Навыки, которые пригодятся (но можно освоить в процессе)
– Регулярные выражения для сложного парсинга.
– Основы алгоритмов машинного обучения (sklearn, isolation forest).
– Docker для воспроизводимых сред.
– SQL-запросы к Postgres, обработка миллионов строк.
– Базовые концепции безопасности данных.