TGTGInsightаналитика telegramLIVE / telegram public index
← Стартап слезам не верит
Стартап слезам не верит avatar

TGINSIGHT POST

Post #1276

@startupslezamneverit

Стартап слезам не верит

Просмотры768Количество просмотров
Опубликован12 февр.12.02.2025, 05:17
Содержимое поста

Содержимое

Среда - по традиции день бесплатных объявлений для стартапов. Вакансия: Специалист по NLP/ML и команда Data Engineers/Data Miners Мы разрабатываем инновационную LegalTech платформу будущегои ищем талантливых специалистов, которые помогут нам в этом. Обязанности и задачи: 1. NLP/ML специалист: • Дообучение модели на основе собранного датасета. • Тестирование и оценка качества работы модели. • Работа с библиотеками NLP и ML, такими как Hugging Face Transformers. • Оценка и улучшение качества модели на реальных данных. 2. Data Engineers/Data Miners (2-3 человека): • Сбор и структурирование данных из проверенных источников. • Удаление нерелевантных данных (например, данных, относящихся к другим юрисдикциям или устаревших документов). • Формирование QA-датасета с вопросами и ответами. • Работа с большими объемами данных и их очистка для оптимизации обучающего процесса. Технический стек для Data Engineers/Data Miners: • Языки программирования: • Python (основной язык для обработки данных) • Инструменты для работы с данными: • Pandas, NumPy (для обработки и очистки данных) • SQL (для работы с базами данных) • Навыки веб-скрэпинга: (сбор данных с открытых источников и веб-ресурсов) • Хранение данных: • PostgreSQL, MySQL или MongoDB (для структурирования и хранения данных) • Контроль версий: • Git/GitHub (для совместной работы и версионности данных) Требования к кандидатам: • Опыт работы с машинным обучением (ML) и обработкой естественного языка (NLP). • Умение работать с большими данными и очисткой данных. • Знание библиотек и фреймворков для работы с ML, таких как TensorFlow, PyTorch, Hugging Face Transformers. • Опыт работы с PostgreSQL, MongoDB или аналогичными системами. • Опыт работы с Python и его библиотеками для обработки данных. Напиши нам и стань частью чего-то большего. @ProLegalTech