🔥Тематическое моделирование LDA — [16:15]
В ролике решается реальная задача Data Science — разделить отзывы на сайте по темам используя Python.
Вы узнаете про LDA, предобработку текста и обучение модели, как правильно оценить результат, проанализировать его и предсказать тематику.
Перейти к просмотру
#видео#теория
Российский проект RakeSearch имеет неприятную особенность – после перезагрузки задачи начинают считаться заново. Когда задачи считаются в 30+ потоков и среди них есть задачи длительностью до часа, то это приводит к потере до получаса рабочего времени мощного компа.
На скринах пример списка задач до и после перезагрузки.
В общей картине эти потери, конечно, незначительны.
А вот ведущему проекта Эдуарду Ватутину спасибо за регулярные посты о ходе проекта и публикациию результатов в энциклопедии OEIS. Имхо достойно того, чтобы 100% времени наших CPU выделять на RakeSearch.
Вот бы ещё на Apple Silicon и на Linux появились задачи от проекта!
Подписывайтесь на Эдуарда: https://vk.com/id162891802
#rakesearch
#silicon