TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #hallucinations

当前筛选 #hallucinations清除筛选
AI & Law

@ai_and_law · Post #512 · 24.02.2025 г., 08:04

🇨🇦Canadian Tribunal Rejects Fabricated Case Law In Canada a family couple relied on Microsoft Copilot to generate legal precedents in a condo dispute—only to discover that nine out of ten cited rulings didn’t exist. The Civil Resolution Tribunal found the cases to be AI “hallucinations,” raising serious concerns about the reliability of AI-generated legal research. While AI can streamline legal work, this case underscores a fundamental risk: without proper verification, reliance on AI-generated case law can undermine legal arguments and credibility. . #AI#LegalTech#AIEthics#Hallucinations

AI & Law

@ai_and_law · Post #819 · 04.05.2026 г., 07:04

🇿🇦South Africa Withdraws AI Policy Over Hallucinated Sources South Africa has withdrawn its draft national AI policy after discovering that at least 6 of its 67 academic citations were AI-generated and referred to non-existent journal articles. Communications Minister Solly Malatsi stated that the most plausible explanation is the inclusion of unverified AI-generated references, calling the lapse a failure that “compromised the integrity and credibility” of the policy. The draft policy had proposed establishing a national AI commission, an AI ethics board, and a regulatory authority, alongside incentives such as tax breaks and grants to support AI infrastructure. The issue was identified after News24 found fabricated citations, later confirmed by journal editors. The policy will be revised before being reissued, and the minister indicated there would be consequences for those responsible. The case highlights risks of using generative AI in policy drafting without verification. A Nature study cited in the report found that over 2.5% of academic papers in 2025 contained at least one potentially hallucinated reference, up from 0.3% in 2024, amounting to more than 110,000 papers. #AIRegulation#AIethics#Hallucinations#PublicPolicy#AIGovernance

People who eat the mushroom Lanmaoa asiatica raw or undercooked have reported seeing tiny human-like figures moving around them. These are called lilliputian hallucinations. Reports from people across different cultures and backgrounds describe similar details, including small figures walking on floors and furniture. The effects can begin 12–24 hours after eating and may last 1–3 days. Some cases are serious and require hospital care. Don't try this yourself.. 🍄😵‍💫🧚‍♀🦄🍄‍🟫 [Read more 1] [Read more 2] [Read more 3] @googlefactss #Mushrooms#ScienceFacts#Hallucinations#Nature#DidYouKnow If you have ideas or feedback contact us: @Googlefactss_Feedback_bot

Machinelearning

@ai_machinelearning_big_data · Post #8518 · 11.09.2025 г., 17:11

🔥WFGY 2.0 — Semantic Reasoning Engine for LLMs (MIT) Это движок с открытым исходным кодом, цель которого — уменьшить галлюцинации и логические сбои в системах типа RAG / LLM, особенно когда: - источники OCR-текста плохо распознаются, - происходит «semantic drift» (когда ответ уходит от вопроса), - «ghost matches», когда извлечённый фрагмент кажется релевантным, но на самом деле нет. Обычно ошибки ловят уже в готовом сгенерированном тексте, из-за чего они часто повторяются. В Semantic Reasoning Engine всё наоборот: если система видит, что рассуждения «кривые» или сбились с курса, она останавливается, сбрасывается или ищет другой путь и отвечает только когда состояние стабильно. 🛡Авторы называют это semantic firewall - семантический «файрвол». Проверки встроены прямо в процесс мышления модели, а не поверх ответа с фильтрами или регексами. Это помогает избегать ошибок до того, как они попадут в вывод. 📌 Проект включает карту из 16 типичных ошибок LLM: - неверный поиск данных, - сбившаяся логика, - «провалы памяти», - путаница ролей агентов и другие. Для каждой есть простое текстовое исправление. Никаких SDK — достаточно вставить инструкции прямо в промпт. 🟢Как модель решает, правильные ли ответ генерируется: - ΔS (drift) - не уходит ли смысл слишком далеко от шага к шагу - λ (convergence) - сходится ли рассуждение к решению или крутится в цикле - Coverage — достаточно ли фактов и аргументов учтено Если все три условия выполнены, ответ считается «качественным». 🟢В тестах стабильность вывода выросла до 90–95% против обычных 70–85% у традиционных подходов. ▪Github: https://github.com/onestardao/WFGY @ai_machinelearning_big_data #ai#llm#opensource#reasoning#hallucinations#promptengineering