Чем предстоит заниматься
- Работа с потоковыми данными: анализ, языковое моделирование, классификация, кластеризация, анализ тональности и прочего: много текста, много медиа;
- Реализовывать новый функционал системы: продуктовые и технические фичи;
- Проверка и генерация гипотез для решения задач: поиск нестандартных подходов, совершенствование существующей архитектуры;
- Принятие участия в выборе нового инструментария;
- Структурирование, планирование и менеджмент: начиная с себя до всего отдела;
Чего мы от тебя ждем
- Продуктового опыта: от ресерча до запуска в прод;
- Знания классических ML алгоритмов (TF-IDF, кластеризация, классификация и т.п.);
- Понимания трансформерных архитектур (MLM, LM), а также методы их обучения;
- Умения писать на чистом Python;
- Опыта работы с PyTorch;
- Опыта работы с FastAPI, MLFlow, AirFlow, Docker;
- Желания изучать новое и находить нетипичные решения;
- Умения разбираться в чужом коде, оптимизировать и улучшать.
Будет плюсом
- MLOps;
- GoLang;
- Знание SQL, noSQL;
- Автоматизация ML-пайплайнов