Стажер NLP
57000
Обязанности
Мы приглашаем исследователей в области NLP на стажировку в центр ML инструментов Лаборатории ИИ Сбербанка. Основная задача центра - применение классического и глубокого обучения для нетривиальных задач банка и экосистемы Сбера. Наши проекты включают исследования в области анализа больших объемов текстовых, табличных (и не только) данных, а также написание opensource библиотек.
Обязанности:
- Разработка алгоритмов кластеризации и тематического моделирования диалогов, методы суммаризации, развитие генеративных и retrieval подходов, интерпретации моделей
- Быстрая апробация новых DS подходов и методов, в том числе не типовых
- Разработка, обучение и оптимизация моделей
Оценка качества моделей, трекинг и анализ результатов экспериментов.
Требования
Требования:
- Неоконченное высшее техническое образование с хорошей подготовкой в области математики и алгоритмов;
- Хорошее знание Python и библиотеками для машинного обучения, такими как NumPy, Pandas, Scikit-learn, PyTorch.
- Знание основ NLP и опыт работы с базовыми алгоритмами обработки естественного языка и библиотеками, такими как Transformers, spaCy, NLTK, Gensim.
- Базовое знание статистики и алгоритмов машинного обучения.
- Уверенный английский язык для чтения и анализа научных статей и документации.
- Опыт работы в Linux средах обязателен.
- Опыт работы Git.
Преимуществом будет:
- Опыт в соревнованиях (к примеру Kaggle Expert+, или успехи на других платформах)
- Опыт работы с глубоким обучением в области NLP, в том числе с BERT, T5, GPT, и другими моделями.
- Знание других языков программирования (например, C++, Java);
Условия
Условия работы:
- Профессиональный коллектив (в группе разработки AutoML работают грандмастера и мастера Kaggle)
- Интересные задачи на переднем крае науки, активная работа с новыми технологиями
- Возможность совмещать работу с соревнованиями на Kaggle и написанием научных статей
Вакансия на 90% составлена ChatGPT