Лет десять назад мне очень нравилось всё, что делает и пишет Тёма Лебедев. Я с удовольствием читал "Ководство" и "Бизнес-линч". Мне импонировали его подходы к дизайну и к организации работы своей студии. Ещё я считал его человеком очень прямолинейным, который называет вещи своими именами и не боится высказываться не по шаблону. Когда я первый раз зашёл на сайт Студии Лебедева, увидел там слоган "Долго. Дорого. Ох**нно.", подумал ещё: "Ого, чувак прямо на своём официальном бизнес-сайте пишет не приторным рекламным языком, а что-то такое дерзкое."
Потом на время перестал за ним следить, переключившись на другие источники. И вот в этих новых источниках в какой-то момент появился дискурс "Тёма Лебедев сошёл с ума и несёт какую-то ересь". Источники были в основном либерально-прозападные, я очень сильно им доверял и всецело без каких-либо сомнений принимал ту картину мира, которую они преподносят. Поэтому, не став вообще ничего смотреть и читать, что говорит Лебедев, я тоже совершенно чётко и однозначно принял для себя тезис "Лебедев сошёл с ума и несёт чушь". Если бы вы меня год назад спросили про Лебедева, я бы вам сказал: "Но ведь совершенно очевидно же, что Лебедев свихнулся и несёт херню". Это было частью объективной реальности вокруг меня, наряду с утверждениями "вода мокрая" и "солнце жёлтое".
Как это совмещалось с тем, что прежде мне нравилось то, что делает и говорит Тёма? Никак. Кац, которого я активно смотрел, даже в одном из своих видео подробно пытался ответить на вопрос "Почему в целом неглупый Лебедев несёт чушь и высказывает какие-то нелиберальные и незападные идеи?". И ответом Каца было что-то в духе: "Это необъяснимо, скорее всего он один раз пошутил и сказал что-то пророссийское, шутка затянулась, теперь уже продолжает так говорить, чтобы сохранить лицо". Так себе объяснение, но я и его принял.
За этот год на фоне известных событий мои взгляды претерпели много изменений. Я рефлексировал в себе этот вопрос, и когда-нибудь может напишу вам более подробно. Но Каца смотреть перестал почти сразу где-то в марте. Как минимум, либеральная идеология оказалась для меня несовместима с решением остаться в России, а я уезжать совсем не хочу.
Тогда я для интереса посмотрел несколько роликов Лебедева и с удивлением обнаружил, что, во-первых, я согласен с 90% того, что он говорит. Ну вот прям дословно по некоторым пунктам (типа взгляды на взаимоотношения Европы с мигрантами или взгляды на ЛГБТ). И вообще у него удивительно близкая к моей система ценностей и представление о том, как люди должны себя вести. Во-вторых, он всё так же выглядит для меня просто чуваком, который прямым текстом называет вещи своими именами и открыто высказывает своё мнение по тем или иным вопросам, независимо от того, попадает ли это мнение в какую-либо идеологию или нет. Ну то есть я лет пять на полном серьёзе считал чела городским юродивым и был абсолютно уверен, что он задвигает безумную хрень, а чел всё это время говорил нормальные и правильные вещи (с моей точки зрения). Вместо того, чтобы самому сходить посмотреть на канал Тёмы, я посмотрел реакцию Каца на канал Тёмы и удовлетворился этим.
Не будьте мной в этом вопросе. Независимо от вашей позиции на идеологическом компасе и от вашего отношения к упомянутым персонажам: формируйте своё мнение самостоятельно.
P.S. Политические споры под этой записью запрещены, сразу бан.
#life
🔎 Группа британских ученых создала ИИ-алгоритм для автоматической обработки и извлечения огромных объемов информации из различных документов.
Система анализирует содержание и структуру счет-фактур, налоговых форм и других цифровых данных, а затем сортирует их по категориям.
🗣 По словам исследователей, технология упростит открытие банковских счетов, утверждение ипотечных кредитов, ответы на запросы клиентов и обработку страховых требований, ускорив проверку на мошенничество и извлечение сведений из удостоверяющих личность документов.
#NLP
🗣 Компания Veritone запустила платформу Marvel.AI для клонирования голоса знаменитостей.
По словам разработчиков, любой желающий может создать цифровую копию своего голоса и выставить ее на продажу. Затем образцы речи можно использовать для озвучивания новостей, рекламных роликов и другого контента.
💿 Также платформа может оцифровывать голоса умерших людей. Для этого ей необходимо предоставить их архивные голосовые записи.
#NLP
A team of ex-OpenAI fellows at Together have released a 20B chat-GPT model, fine-tuned for chat using EleutherAI's GPT-NeoX-20B, with over 43 million instructions under the Apache-2.0 license.
https://github.com/togethercomputer/OpenChatKit
https://www.together.xyz/blog/openchatkit
#nlp
Haystack
• Ask questions in natural language and find granular answers in your documents.
• Perform semantic search and retrieve documents according to meaning, not keywords.
• Use off-the-shelf models or fine-tune them to your domain.
• Use user feedback to evaluate, benchmark, and continuously improve your live models.
• Leverage existing knowledge bases and better handle the long tail of queries that chatbots receive.
• Automate processes by automatically applying a list of questions to new documents and using the extracted answers.
https://github.com/deepset-ai/haystack
#nlp
#nlp#news
Опасный ИИ –– OpenAI создала генератор текстов, который работает слишком хорошо
Алгоритм GPT-2, натренированный на 40 гигабайтах текстов из интернета, научился писать осмысленные тексты. Он предсказывает каждое следующее слово, подходящее по стилю и содержанию. OpenAI решила не выкладывать в открытый доступ полноценный программный код, полагая, что алгоритм может быть опасным, что сильно расстроило сообщество, ведь компания создавалась именно на принципах полной открытости полученных результатов.
Почему важно: В 2015 году лаборатория, основанная Илоном Маском, зарядилась альтруистической целью –– создавать ИИ на благо человечества. Но это было 4 года назад, а сейчас OpenAI побоялась выкладывать свою разработку в открытый доступ. Уж слишком высока вероятность, что ИИ быстро переманят на сторону зла и будут использовать для генерации фейковых новостей и спама. OpenAI создали мощного противника человечества в Dota 2, теперь –– идеального писателя, которому не нужно вдохновение.
Эта новость –– отличный повод поговорить о NLP (направление ML по обработке текста) и его ключевых проблемах. Даже самые огромные бюджеты, которые компании тратят на попытки автоматизации службы поддержки и ответы в чатах пользователям, упираются в число 30%. Это средний объем автоматизации сообщений, выше которого прыгнуть сложно, даже внутри одного маленького домена тем. NLP ждет какого-то фундаментального открытия, которое позволит перейти от статистических методов к полноценному deep learning подходу. Возможно алгоритм GPT-2 поможет сдвинуть NLP с текущей мертвой точки.
🗣Googleподелилась прогрессом в создании Universal Speech Model (USM), поддерживающей 1000 различных языков.
По данным разработчиков, модель имеет 2 млрд параметров. Ее обучили на 12 млн часов речи и 28 млрд предложений.
🌐 На сегодня USM поддерживает более 100 языков. Модель уже используют в YouTube для автоматического создания субтитров.
#Google#NLP
🗣Googleразработала систему голосовой идентификации Speaker ID для колл-центров.
При первом взаимодействии абонента с ИИ, сервис предложит ему зарегистрироваться и предоставить образец речи. Система не требует специального текста или пароля — после верификации она определит звонящего по трехсекундному фрагменту голоса.
⚙️ Speaker ID является частью платформы Contact Center AI.
#Google#NLP
🗣 Китайские разработчики представили языковую модель WuDao 2.0. По их словам, она превосходит аналогичные технологии Google и OpenAI
WuDao 2.0 использует 1,75 трлн параметров для имитации разговорной речи, написания текстов и понимания изображений. Она работает с китайским и английским языками благодаря изучению 4,9 терабайт различных данных.
Разработчики заявили, что побили рекорд компании Google, которая в январе 2021 года представила Switch Transformer с 1,6 трлн параметров. До этого крупнейшей языковой моделью была OpenAI GPT-3 со 175 млрд параметров.
🤝 Исследователи также сообщили, что уже нашли 22 партнеров, в числе которых производитель смартфонов Xiaomi, служба доставки Meituan и платформа для обмена короткими видео Kuaishou.
#Китай#NLP
💬Alexa AIпредставила многоязычную нейросеть-трансформер AlexaTM с 20 млрд параметров. Модель способна изучать новые задачи по нескольким примерам и переводить их без вмешательства человека.
Алгоритм основан на архитектуре кодер-декодер. Для тренировки нейросети исследователи использовали комбинацию задач шумоподавления и каузально-языкового моделирования.
☝️ По данным разработчиков, AlexaTM превосходит аналоги в выполнении задач обобщения и машинного перевода, а углеродный след при ее тренировке составляет всего пятую часть от выбросов при обучении GPT-3.
#Amazon#NLP