TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Анализ текста Второй пост из серии про анализ тг-чата. В первом показывала, как получить архив чата и вытащить из него сообщения. На этот раз разбираю, как посчитать частотность слов и определить части речи✒️ Файл ipynb с кодом и примечаниями выложила на github: https://github.com/alsosha/text_analysis/blob/main/text_analysis.ipynb Остается пост про генерацию облака слов, постараюсь с ним не затягивать😜 P.S. В карточках упомянула, что кроме pymorphy3 есть и другие подобные библиотеки. Например, spacy, natasha, nltk и т.д. Сравнение результатов лемматизации нашла вот тут, а общее сравнение библиотек тут. Можно попробовать разное и подобрать удобный вариант под себя💞 #python