Намери подобно съдържание

Изходен канал @clockstackwheels · Post #704 · 17.12

Я всегда был уверен, что системы рекомендаций работают так плохо, потому что это слишком сложная задача. Владельцы площадок бьются с алгоритмами, машинным обучением, деревьями решений и взвешенными суммами, но получается всё равно херня, и человеку могут рекомендовать нерелевантный бред (и, что ещё хуже — не рекомендовать интересный для него контент). Кажется, хорошо работают только рекомендации на Ютубе, но этому есть объяснение: контент на Ютубе более длительный и дорогой. Его сложнее производить, он выходит реже. Качественный ролик на Ютубе не будет говном практически независимо от темы, на которую он снят. А ещё меньшее число объёмных роликов проще кластеризовать и можно предлагать пользователю в небольших количествах. Но если мы откроем YouTube Shorts (это очередной аналог тиктока с короткими вертикальными видео), то заметим, что качество рекомендаций упало сразу на два порядка: какие-то тупые попсовые шутки, "удивительные" факты из жизни, завлекающие отрывки из фильмов "код смотри в телеграм-канале", озвучка анекдотов и прочий мусор. Алгоритмы уже совсем не справляются с тем, чтобы предложить что-то годное, не говоря уже о релевантности конкретно мне, хотя история моих просмотров и вкусов Ютубу, очевидно, известна. Тем не менее, иногда разработчики могут не только не уметь, но и не хотеть писать нормальные рекомендации. Вот ВК предложил мне BadComedian в блоке "Интересные авторы". Оставим в стороне, что Бэдкомендиан это ютубер, и у него в ВК в лучшем случае будут репосты ссылок на Ютуб. Но мне предлагают не паблик, а личную страницу.... на которой не было записей с сентября 2021 года. Нет совершенно никакого смысла быть подписанным на личную страницу Бэдкомедиана сейчас. Кажется, единственный критерий, на котором основывались эти рекомендации: общее число подписчиков. Как должны работать рекомендации на самом деле? Алгоритмически я бы оценивал частоту постов (кстати, чрезмерно частые это тоже плохо, должно работать в минус), оценивал бы, является пост просто публикацией внешней ссылки на другой ресурс, является ли репостом паблика, и смотрел бы, сколько прошло времени с последней записи на странице автора. Наверное, в качестве коэффициента с небольшим весом можно добавить ещё объём контента в посте и активность людей (лайки + комментарии). Причём, делается это достаточно просто, никакой ML не нужен. Даже такая оценка, не берущая в расчёт тематику страницы, всё равно лучше, чем "Просто покажем людей, на которых когда-то подписалось куча народу, и им до сих пор лень отписаться после прекращения активности автора". По крайней мере теперь меня не удивляет, что хвалёные Клипы постоянно подсовывают мне какой-то подростковый шлак вместо крутых видео с полётами на FPV-квадрокоптерах. YouTube Shorts по крайней мере пару раз такие вещи предлагал, а вот Клипы вообще ни разу (станицу Клипов я не открываю, разумеется, но в ленте новостей встречаются блоки с автовоспроизведением). Кстати, на скрине есть второй автор — Стас "Ай как просто". Его банят на Ютубе за критику западной модели текущих событий, и он пишет: "Буду создавать каналы-однодневки, куда деваться". То есть у него даже мысли не возникает, что какая-то ещё площадка может служить его целям. Ну с таким отношением других площадок к рекомендациям — понятно. #web

Hashtags

#web

Резултати

Намерени 8 подобни публикации

Търсене: #requests

当前筛选 #requests清除筛选

djangoproject

@djangoproject · Post #268 · 26.02.2017 г., 05:52

Намери подобни Прегледай

https://pawelmhm.github.io/asyncio/python/aiohttp/2016/04/22/asyncio-aiohttp.html 👌Making 1 million requests with python -#aiohttp Apr 22, 2016 - by Paweł Miech - about: #asyncio, aiohttp, #python In this post I’d like to test limits of python aiohttp and check its performance in terms of requests per minute. Everyone knows that asynchronous code performs better when applied to network operations, but it’s still interesting to check this assumption and understand how exactly it is better and why it’s is better. I’m going to check it by trying to make 1 million #requests with aiohttp client. How many requests per minute will aiohttp make? What kind of exceptions and crashes can you expect when you try to make such volume of requests with very primitive scripts? What are main gotchas that you need to think about when trying to make such volume of requests?

Hashtags

#aiohttp #asyncio #python #requests

djangoproject

@djangoproject · Post #218 · 04.01.2017 г., 22:36

Намери подобни Прегледай

http://docs.python-requests.org/en/latest/user/quickstart/#post-a-multipart-encoded-file #Requests makes it simple to #upload#Multipart-encoded #files

Hashtags

#requests #upload #multipart #files

djangoproject

@djangoproject · Post #219 · 04.01.2017 г., 22:43

Намери подобни Прегледай

https://www.blog.pythonlibrary.org/2012/06/08/python-101-how-to-submit-a-web-form/ Today we’ll spend some time looking at three different ways to make Python submit a web form. In this case, we will be doing a web search with duckduckgo.com#searching on the term “python” and saving the result as an HTML file. We will use Python’s included #urllib modules and two 3rd party packages: #requests and #mechanize. We have three small scripts to cover, so let’s get cracking!

Hashtags

#searching #urllib #requests #mechanize

djangoproject

@djangoproject · Post #536 · 28.12.2017 г., 10:21

Намери подобни Прегледай

http://www.djangocrew.com/blog/how-startstopget-google-compute-instance-python/ In this post we gonna tell you about How to start/stop/get for the #google compute instance with python. Sometimes we don’t want (or need) a compute engine instance running 24hs every day but we need to run #task/s periodically. To solve this we can have an app engine task runing using cron service to start the VM instance. Once the VM has started, it can have a startup script that runs the actual task it was needed for and then stops the machine. #REST#Linux#Windows#requests

Hashtags

#google #task #rest #linux #windows #requests

djangoproject

@djangoproject · Post #421 · 21.08.2017 г., 10:39

Намери подобни Прегледай

https://alysivji.github.io/flask-part1-generating-html-pages-with-mongoengine-jinja2.html Generating HTML Pages from #MongoDB with #MongoEngine and #Jinja2 (Flask Part 1) Summary Overview of MongoDB Discussion of Object-Relational Mapping (#ORM) Use MongoEngine to get items out of MongoDB Render #HTML pages using Jinja2 Interact with #REST API to send emails with #Requests

Hashtags

#mongodb #mongoengine #jinja2 #orm #html #rest #requests

djangoproject

@djangoproject · Post #420 · 21.08.2017 г., 10:36

Намери подобни Прегледай

https://alysivji.github.io/mongodb-pipelines-in-scrapy.html #Scraping Websites into #MongoDB using Scrapy #Pipelines Summary Discuss advantages of using Scrapy framework Create #Reddit spider and scrape top posts from list of subreddits Implement Scrapy pipeline to send scraped data into MongoDB Sure, we could hack together a solution using #Requests and #Beautiful_Soup (bs4), but if we ever wanted to add features like following next page links or creating data validation pipelines, we would have to do a lot more work.

Hashtags

#scraping #mongodb #pipelines #reddit #requests #beautiful_soup

djangoproject

@djangoproject · Post #519 · 10.12.2017 г., 18:14

Намери подобни Прегледай

https://blog.wallaroolabs.com/2017/12/stateful-multi-stream-processing-in-python-with-wallaroo/ #Wallaroo is a high-performance, open-source framework for building distributed stateful applications. In an earlier post, we looked at how Wallaroo scales #distributed_state. In this post, we’re going to see how you can use Wallaroo to implement multiple data processing #tasks performed over the same shared #state. We’ll be implementing an application we’ll call “Market Spread” that keeps track of the latest pricing information by stock while simultaneously using that state to determine whether stock order #requests should be rejected. #pipeline

Hashtags

#wallaroo #distributed_state #tasks #state #requests #pipeline

djangoproject

@djangoproject · Post #224 · 07.01.2017 г., 16:53

Намери подобни Прегледай

#AI #automated_testing #automation #asyncio #atexit #button #concurrency #Coroutines #data_mining #dropdownbox #Debian #decorators #django_cms #form #Google #Gym #intelligence #input #lists #machine_learning #map #Metaprogramming #Micro_services #monitoring #Multipart #multi_touch_apps #multiprocessing #Nodes #numerical #OAuth #package #pytest #python #requests #Requests #satellite #scrapy #scikit_learn #SciPy #searching #submit #selectbox #sessions #TensorFlow #text_boxes #text #telegram #Threads #tuples #Universe #urllib #upload