Поговорим про ML.
Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно.
Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости.
Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :)
Глобально же нейросетями пытаются решать три вида задач:
1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок.
2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом.
3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу.
Поверьте: человечество пока что в безопасности касательно захвата машинами.
#dev
#Italia#Comunali
L'ex avvocato di Andrea Sempio nel caso Garlasco, Massimo #Lovati lascia la professione forense e di candida a sindaco di Vigevano con #DSP|Sovranisti euroscettici.
@Osservatorioitaliano
#Turchia: la commissione parlamentare che studia il nuovo processo di pace decide di visitare #Ocalan nell'isola di #Imrali. Il principale partito d'opposizione, #CHP e i partiti minoritari #DP, #DSP e #HüdaPar, decidono di non aderire all'iniziativa.
Лизинг. Впервые это понятие пришло ко мне не из сферы автомобилей. Пришло из музыки. Это когда человек написал инструментал и даёт его погонять разным исполнителям. Русским, американским.
А если это делает сибиряк, то это Рома Cvpellv. Он открылся для меня в томской группе "Забытый полк". Затем появилось объединение Diamond Style Production (DSP). Оказалось, что наши продюсеры и битмейкеры могут делать музыку, которая одинаково хорошо звучит и с русскими, и с английскими куплетами поверх. Не важно, Kristina Si это или Freddie Gibbs.
Рома Capella — человек, который может сказать: "сидел я как-то со Снуп Догом на студии...", — и это будет не понтами, а обычной историей из жизни. Вообще интересно посмотреть за профессией битмейкер. Вот один из выпусков "По классике" с Ромой.
Рома уникум. Может органично звучать в рэпе, электронщине. Отдельное удовольствие то, как на его биты начинает звучать наша попса. Ну и лайвы на akai mpc, конечно, удивительно заходят даже мне, который всегда был за текстоцентричность.
#cvpellv#capella#биты#заполк#dsp#плейлист#электро#instrumental#внк
Вопросик на контроле
#Italia#Sondaggi
Sondaggio autoprodotto EMG Different:
"E PER QUALE PARTITO VOTEREBBE? Base: coloro che hanno intenzione di andare a votare"
Totale cdx: 45,2%
#FdI|ECR: 27%
#FI|EPP: 8,7%
#Lega|PfE: 8%
#NM|EPP: 1,5%
Totale csx: 44,9%
#PD|S&D: 22,7%
#M5S|LEFT: 12%
#AVS|G/EFA|LEFT: 6%
#IV|RE: 2,2%
#PiùE|RE 2%
Totale centro 3,9%
#Azione|RE 2,7%
#PLD|Centro: 1,2%
#FN|ESN: 3,6%
#DSP|Populisti euroscettici: 1,4%
Altra lista 1,0%
Rilevazione: 30-31 marzo
Intervistati: 1000
Margine d’errore: ±3,1%
@OsservatorioItaliano