Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

#dev

Резултати

Намерени 2 подобни публикации

Търсене: #scientist

当前筛选 #scientist清除筛选

Data Science Jobs

@datasciencejobs · Post #3048 · 26.11.2025 г., 16:04

Намери подобни Прегледай

#вакансия#data#scientist#ML#remote#удаленка Название компании: deeplay Формат работы: Удаленка Занятость: Полная Контакты: @hitommooo Мы разрабатываем роботов-аниматоров для интеллектуальных карточных игр: покер, бридж, маджонг, преферанс. Аниматоры создают активность на игровой платформе, привлекая пользователей 🎲🧩 Ищем сильного Middle Data Scientist 🎯 Что по задачам? - Разработка инструментов, автоматических отчётов и методов кластеризации данных и системы мониторинга работы ML-моделей - Контроль качества ML-моделей, обнаружение дата-дрифта и поддержание качества предсказаний на необходимом уровне - Аналитика данных, проверка гипотез, исследования данных и методов 🧑‍💻Наши ожидания - Коммерческий опыт работы в должности Data Scientist от 3х лет - Уверенное знание ML (опыт работы с полным ML-пайплайном) - Знание методов статистического анализа данных (EDA, LDA, MDS) - Знание методов кластеризации и её оценки, методов понижения размерности - Опыт программирования на Python - Знание различных видов визуализаций в python, любовь к графикам — приветствуется 🍪Мы предлагаем - Полностью удаленный формат работы - График работы с гибким началом и окончанием рабочего дня - Ежегодно проводим performance review, по итогу которых намечаем планы развития сотрудника - Частичная компенсация расходов на медицинские услуги, бассейн, массаж - Частичная компенсация расходов на спорт - Материальная помощь к важным событиям и в сложных жизненных ситуациях - Регулярные шаринги знаний, хакатоны, митапы, трансляции, турниры - Изучение английского языка для всех желающих 2 раза в неделю 📩 Контакты:@hitommooo

Hashtags

#вакансия #data #scientist #ml #remote #удаленка

Data Science Jobs

@datasciencejobs · Post #1850 · 25.12.2023 г., 09:01

Намери подобни Прегледай

#вакансия#vacancy#senior#lead#data#scientist ✨Senior/Lead Data Scientist Компания: WILDBERRIES ЗП: по результатам собеседования Wildberries - это 9 млн заказов и 1 млрд поисковых запросов в сутки. Мы ищем Senior/Lead Data Scientist в команду FBO Wildberries. Наша команда управляет процессом с момента планирования поставки товара на склад Wildberries до момента, когда этот товар оказывается на месте хранения и становится доступен к продаже. Ключевые требования - Знание классического ML, DL. - Знание методов оптимизации, временных рядов. - Хорошее знание алгоритмов и структур данных. - Знание и умение применять для ML стек Python (Pandas, Sklearn, Numpy, Scipy, XGBoost/LightGBM/Catboost), а также SQL. - Опыт обучения моделей, которые работают в продуктах для массовой аудитории и приносят там пользу. - Для Lead опыт управления командой DS, внедрения корпоративных моделей данных. - Опыт работы – от 3 лет. Основные задачи Предстоит заниматься рекомендациями по завозу товаров, управлением потоком товаров по складам, а именно: - Прогнозирование спроса и предложений товара у покупателей для продавцов на Wildberrries. - Оптимизация потока завоза товаров на склады. - Динамическое тарификация для продавцов на склад, где цена будет меняться в зависимости от загрузки склада, длительности хранения и так далее. - Вместе с бэкендерами строить production pipeline. Компенсация/мотивационный пакет Мы предлагаем: - Оформление по ТК, ГПХ, ИП. - Гибридный формат работы: от офиса в Москве (с бесплатными завтраками, обедами и ужинами) до удаленки из любой точки мира. - Гибкое начало рабочего дня. - Возможность увидеть однозначные результаты работы, напрямую влияющие на бизнес с триллионами GMV. - Возможность брать 3 day-off в любой день. - Необходимое мощное железо и ПО. - Ежегодная 40%-ая скидка на покупку ноутбука или мобильного телефона. - Премии и бонусы по итогам работы. - Карьерный и профессиональный рост. Откликнуться: @yana_itrec Не забудьте уточнить, что вы из @datasciencejobs

Hashtags

#вакансия #vacancy #senior #lead #data #scientist