Стажер по интеллектуальному анализу данных

Оплата: По договоренности
Удаленно
Full-time

Компания-разработчик продуктов информационной безопасности помогает бизнесу выявлять риски раньше, чем они превращаются в убытки. Мы строим алгоритмы, которые ежедневно проверяют миллионы событий, ищут нестандартные поведения пользователей и сигнализируют о нарушениях. Вам откроется доступ к живым данным, современным практикам DevSecOps и наставничеству экспертов, которые прошли путь от стажёра до тимлида.


Обязанности  

– Собирать структурированные выборки из открытых источников с использованием BeautifulSoup и Scrapy.  

– Предобрабатывать данные: удалять шум, нормализовать текст, кодировать категории.  

– Искать и описывать статистические аномалии в поведенческих логах.  

– Визуализировать результаты в Jupyter, отчётах и презентациях для бизнеса.  

– Писать чистый Python-код, оформлять pull-request и покрывать функции тестами.  

– Работать в распределённой команде через GitLab, Agile-подход и ежедневные стендапы.  

– Документировать принятые решения, фиксировать гипотезы и выводы экспериментов.  


Требования  

– Базовое владение Python 3: списки, словари, функции, PEP-8.  

– Понимание принципов HTTP и HTML-структуры страниц.  

– Опыт учебных проектов по web-скрейпингу или курсовой аналитике.  

– Знание библиотек pandas, numpy, matplotlib на уровне навигации по документации.  

– Умение формулировать гипотезы, терпеливо доводить их до результата.  

– Грамотная письменная русская речь для описания сделанной работы.  

– Самоорганизация при удалённой работе, готовность участвовать в код-ревью.  


Навыки, которые пригодятся (но можно освоить в процессе)  

– Регулярные выражения для сложного парсинга.  

– Основы алгоритмов машинного обучения (sklearn, isolation forest).  

– Docker для воспроизводимых сред.  

– SQL-запросы к Postgres, обработка миллионов строк.  

– Базовые концепции безопасности данных.