Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

#dev

Резултати

Намерени 4 подобни публикации

Търсене: #hoith

当前筛选 #hoith清除筛选

Когнитивная нагрузка Майка Новикова

@cogload · Post #118 · 09.11.2023 г., 07:02

Намери подобни Прегледай

Буду потихоньку тизерить личный проект. Покажу процесс и что в итоге получилось На видео собираю данные 👩‍💻 #hoith

Hashtags

#hoith

Когнитивная нагрузка Майка Новикова

@cogload · Post #125 · 20.11.2023 г., 07:36

Намери подобни Прегледай

Как я влюбился в картографию Хочу поделится проектом, который в свое время зажег во мне интерес к картографии и представлению информации. https://nakarte.me/#m=15/46.46893/8.10358&l=O/Si&r=46.798562/8.231974/Switzerland ↑ Сначала откройте ссылку и полистайте карту Все началось с заметки в блоге Эдварда Тафти про топографический атлас Швейцарсих Альп. На примере этой карты, он объясняет принципы хорошей визуализации: Общие принципы - Фокус на содержании. - Высокое разрешение. - Каждый элемент имеет несет в себе информацию, нет элементов «для красоты». - Видно картину в целом, а детали вписаны в контекст и доступны при необходимости. Детали - Объекты органично вписаны в рельеф, нет нужды во всплывающих окнах. По соседним деталям можно понять размеры рядом стоящих. - Контрастные контурные линии проявляют топографический рельеф гор. Подписи рядом с ними и на пиках сообщают количественную информацию. Цвет - Низкий контраст не создает визуального шума. - Интуитивные цвета, основанные на объектах из природы — белый снег, черные скалы, голубая вода, зеленая растительность. Типографика - Строгая иерархия шрифтов и их насыщенности (см. дополнение в коментах). - Размер шрифта соответствует масштабу объекта — чем больше объект, тем больше шрифт. Почему это круто? Все это вместе создает эффект проявления информации Когда я впервые увидел эту анимацию плавно двигающейся карты — я словил ощущение эйфории и расфокуса — информация как будто сама заливалась мне в глаза и я её моментально понимал. С тех пор, я искал и пробовал делать штуки, которые бы повторили это ощущение. У Тани Мисютиной из лаборатории данных как раз недавно вышла заметка про этот эффект. Очень советую почитать. Ещё Таня рассказывала как книжки Тафти повлияли на неё и вдохновили начать заниматься визуализацией данных. #hoith#любопытство

Hashtags

#hoith #любопытство

Когнитивная нагрузка Майка Новикова

@cogload · Post #126 · 06.12.2023 г., 17:24

Намери подобни Прегледай

Почему карта возможно не лучший каркас для визуализации данных Продолжаю рассказывать про персональный проект. Как вы могли догадаться речь пойдет про карту. Любые данные — это косвенное отражение того что происходит в реальном мире. Даже спутниковое фото может искажать реальное положение вещей. Что уж говорить о численной статистике, которая была собрана людьми в неидеальных условиях за большой период времени. Если в данных есть графа с местоположением, это не значит что карта — подходящий способ визуализации. Есть даже мем про то что все карты Европы выглядят одинаково Данные никогда не находятся в вакууме и закономерность в статистике может отражать не то, что пытались измерить. Почему же в моем случае карта подходит? Я пытаюсь визуализировать возраст домов. Минимальная частица тут — год, когда были возведены стены фасада (год постройки). В городе домов много, и общие закономерности можно оценить по столбчатой диаграмме — года выстроить по порядку, а высотой столбика показать количество домов построенных в этом году. Но чтобы действительно проявить суть информации — какие исторические слои сохранились до наших дней и как они соотносятся с моим текущим пониманием местности — эти данные нужно нанести на карту города. То есть нужно задать ключевой вопрос: помогает ли визуализация найти новые знания в общем массиве данных, или просто показывает то, что я мог увидеть и в таблице? На выходных я буду рассказывать про проект на Новисадском Митапе. Запись уже закрыта, но если вы в Сербии или поблизости — можете написать организаторам, иногда люди не успевают попасть и открываются свободные места. #hoith#maps

Hashtags

#hoith #maps

Когнитивная нагрузка Майка Новикова

@cogload · Post #128 · 10.12.2023 г., 10:46

Намери подобни Прегледай

Карта возраста домов — ссылки Онлайн версия карты домов Томска. По нажатию открывается карточка дома с доступной информацией https://kontikimaps.ru/how-old/tomsk?p=h-tom Мой рассказ о процессе создания карты https://kontikimaps.ru/how-old/tomsk/process?p Карты других городов https://kontikimaps.ru/how-old/cities?p=h-menu Пост Никиты Славина на Хабре с которого все началось https://habr.com/ru/articles/504216/ Рассказ Александра Качкаева о карте Пензы и написании фреймворка для сбора данных https://kontikimaps.ru/how-old/penza/process?p=h-pnz Сайт издательства Кон Тики https://kontikimaps.ru #hoith#maps#сделал

Hashtags

#hoith #maps #сделал