TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Публикуем материалы дата-среды, посвященной особенностям извлечения данных с сайтов, их очистке и структуризации. Сергей Бершадский, backend-разработчик и в прошлом системный архитектор таких проектов, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др., рассказал об опыте веб-скрейпинга с использованием библиотек Python Scrapy, Beautiful Soup, Asyncio. http://aurd.ru/robo-vs-humans-data