TGTGInsightаналитика telegramLIVE / telegram public index
← Ассоциация участников рынка данных
Ассоциация участников рынка данных avatar

TGINSIGHT POST

Post #77

@aurdata

Ассоциация участников рынка данных

Просмотры238Количество просмотров
Опубликован24 июл.24.07.2019, 09:44
Содержимое поста

Содержимое

Публикуем материалы дата-среды, посвященной особенностям извлечения данных с сайтов, их очистке и структуризации. Сергей Бершадский, backend-разработчик и в прошлом системный архитектор таких проектов, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др., рассказал об опыте веб-скрейпинга с использованием библиотек Python Scrapy, Beautiful Soup, Asyncio. http://aurd.ru/robo-vs-humans-data