TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #contentmoderation

当前筛选 #contentmoderation清除筛选
AI & Law

@ai_and_law · Post #790 · 23.03.2026 г., 08:04

🌐A CCDH Study Findings on AI Chatbots and Extremism A study by the Center for Countering Digital Hate (CCDH) and CNN reports that 8 out of 10 leading AI chatbots responded in ways that supported violent ideology and assisted in planning attacks. The analysis included ChatGPT, Google Gemini, Claude, Microsoft Copilot, Meta AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI, and Replika. Researchers, posing as teenagers, tested whether these systems would discourage harmful behavior. All but one chatbot could not be reliably relied upon to prevent or counteract planning scenarios. CCDH CEO Imran Ahmed stated that the results reflect a pattern where leading technology companies prioritize innovation while neglecting safeguards. #AIRegulation#AIethics#ContentModeration#OnlineSafety#TechPolicy

AI & Law

@ai_and_law · Post #798 · 02.04.2026 г., 07:04

📖Wikipedia Restricts Use of AI-Generated Content Wikipedia introduced new guidelines prohibiting editors from using large language models (LLMs) to generate or rewrite article content. The platform allows only two limited exceptions: AI may be used for basic copyediting of existing text with human review, and for translating articles between languages under specific guidance. The policy links AI use to potential violations of core content standards, including verifiability and the prohibition on original research. LLM outputs may lack reliable source attribution and can introduce inaccuracies or synthesized content not supported by published sources. The guidelines also note that detecting AI-generated text cannot rely on stylistic signals and provide no specific detection method. #AIRegulation#AIethics#ContentModeration#KnowledgeGovernance#Wikipedia

AI & Law

@ai_and_law · Post #147 · 25.10.2023 г., 07:04

Proposed Chinese AI Safety Standards: A Closer Look Hey there, AI & Law community! On October 11, the National Information Security Standardization Technical Committee in China released a draft document outlining precise regulations for evaluating generative AI models. Unlike the often vague AI regulations, this document provides a clear blueprint for compliance. This standards proposal sets forth rigorous criteria for assessing AI data sources and their content. The document covers topics like training data diversity, moderation, and prohibited content. It emphasizes the need for diversified training corpora and the assessment of data quality. If more than 5% of data is "illegal and negative information," the corpus is flagged for future training. The proposal also suggests that AI companies employ moderators to enhance generated content quality, aligning with national policies and third-party complaints. This implies a potential expansion of the human-driven moderation and censorship workforce in the AI era. Companies are tasked with identifying hundreds of keywords for flagging unsafe or banned content, with separate categories for political and discriminative content. They must also generate more than 2,000 prompts, ensuring fewer than 10% of responses breach the rules. Interestingly, the document encourages subtler censorship measures, such as not refusing to answer sensitive prompts but allowing AI models to respond to specific, non-sensitive inquiries. It's crucial to clarify that these standards are not laws, and non-compliance doesn't result in penalties. However, proposals like these can significantly influence future regulations or work alongside them. The standards receive input from tech experts hired by companies, giving corporations like Huawei, Alibaba, and Tencent a say in shaping these regulations. Their influence could have far-reaching implications for the global AI industry and how AI technologies are regulated worldwide. #AISafety#AIRegulations#GenerativeAI#ContentModeration#ChineseTech#AIInfluence#GlobalAI

Crypto M - Crypto News

@CryptoM · Post #64833 · 10.04.2026 г., 03:04

🚀 WeChat Updates Guidelines to Prohibit Automated Content Creation WeChat has updated its 'Public Account Behavior Guidelines' to include a new rule prohibiting non-human automated content creation. According to Foresight News, the new guideline, Article 3.27, specifically bans the use of artificial intelligence for generating, rewriting, splicing, or transporting content, as well as the bulk or continuous publication of content through scripts or program hosting. It also prohibits the dissemination of tutorials, methods, or services related to non-human automated creation. WeChat clarified that AI can be used as an auxiliary tool for tasks such as sentence refinement, error correction, icon generation, and information retrieval. However, the final content must reflect the style, stance, and judgment of a real creator. Violations of these guidelines may result in traffic restrictions, content deletion, or account suspension. A significant number of accounts have already been deleted or banned due to bulk AI-generated content. Previously, on March 10, Xiaohongshu announced measures to combat AI-managed accounts. #WeChat#AIContent#ContentGuidelines#AutomatedContent#AccountSuspension#AIRegulation#SocialMediaPolicy#ContentModeration#DigitalCompliance#Xiaohongshu