Стажер по интеллектуальному анализу данных

Оплата: По договоренности

Удаленно

Full-time

Компания-разработчик продуктов информационной безопасности помогает бизнесу выявлять риски раньше, чем они превращаются в убытки. Мы строим алгоритмы, которые ежедневно проверяют миллионы событий, ищут нестандартные поведения пользователей и сигнализируют о нарушениях. Вам откроется доступ к живым данным, современным практикам DevSecOps и наставничеству экспертов, которые прошли путь от стажёра до тимлида.

Обязанности

– Собирать структурированные выборки из открытых источников с использованием BeautifulSoup и Scrapy.

– Предобрабатывать данные: удалять шум, нормализовать текст, кодировать категории.

– Искать и описывать статистические аномалии в поведенческих логах.

– Визуализировать результаты в Jupyter, отчётах и презентациях для бизнеса.

– Писать чистый Python-код, оформлять pull-request и покрывать функции тестами.

– Работать в распределённой команде через GitLab, Agile-подход и ежедневные стендапы.

– Документировать принятые решения, фиксировать гипотезы и выводы экспериментов.

Требования

– Базовое владение Python 3: списки, словари, функции, PEP-8.

– Понимание принципов HTTP и HTML-структуры страниц.

– Опыт учебных проектов по web-скрейпингу или курсовой аналитике.

– Знание библиотек pandas, numpy, matplotlib на уровне навигации по документации.

– Умение формулировать гипотезы, терпеливо доводить их до результата.

– Грамотная письменная русская речь для описания сделанной работы.

– Самоорганизация при удалённой работе, готовность участвовать в код-ревью.

Навыки, которые пригодятся (но можно освоить в процессе)

– Регулярные выражения для сложного парсинга.

– Основы алгоритмов машинного обучения (sklearn, isolation forest).

– Docker для воспроизводимых сред.

– SQL-запросы к Postgres, обработка миллионов строк.

– Базовые концепции безопасности данных.