TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #396 · 22.06

Попробовал Github Copilot. Это проект, в рамках которого Гитхаб обучил нейросеть на миллионах строк программного кода, загруженного людьми, и теперь она вроде как способна предлагать автоматическое дополнение к тому, что вы пишете. В теории, если вы напишете название функции, например public int Fibonacci(int n), то она сразу предложит вам автоматически подставить всё остальное. Конкретно с этим примером система действительно справляется, но в целом впечатления у меня от неё смешанные, и на мой взгляд она пока что не стоит тех $10 в месяц, которые за неё просят после тестового двухмесячного периода. Я уже писал ранее о своём отношении к нейросетям. В задачах дополнения данных они работают средненько: значимый процент решений будет с ошибками. Вот и здесь — сначала я подумал, что Copilot сможет за меня копипастить популярные однотипные куски кода из интернета. Например, я не помню алгоритм Вагнера-Фишера, постоянно его копирую из своих других проектов, часть из которых выложена на Github и наверняка была передана в обучение Copilot. Я предложил нейросетям мне этот алгоритм написать, они написали что-то отдалённо похожее. Внешне выглядело убедительно и даже компилировалось, но работало неправильно, и при ближайшем рассмотрении оказалось, что там просто случайно надёрганные строчки из настоящего алгоритма. Некоторые проверки по 2 раза, а часть нужной логики упущено совсем. Об оформлении кода вообще говорить не стоит: пока всё, что мне выдавалось, оформлено плохо, и на ревью я бы написал разработчику несколько замечаний. Однако, в других местах работает, как задумано. Если у вас есть дуальные функции, оно умеет предлагать дописать остаток (пример на скриншоте ниже). Но из того, что я попробовал, только процентов 20 случаев реально были полезны. Остальные 80% или вообще неверный код, или правильный, но такой неаккуратный, что лучше самому написать. Есть ещё проблема: массовый копипаст довольно опасен, потому что легко пропустить какую-то мелочь. В идеале нужно весь вставленный код проверять построчно, но по когнитивной нагрузке это близко к тому, чтобы создать его самостоятельно. И человеческое внимание совершенно точно будет расслабляться и размываться при работе с такими средствами автодополнения, а, значит, неизбежны ошибки. На месте чувствительной к багам энтерпрайз-разработки я бы вообще запрещал бы своим сотрудникам применять Copilot. С другой стороны, возможно, подобная утилита хорошо зайдёт для прототипирования, на хакатонах, на стримах с демонстрацией разработки чего-нибудь. У меня будет возможность проверить на соревновании через месяц, но в работе скорее всего отключу. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #hallucinations

当前筛选 #hallucinations清除筛选
AI & Law

@ai_and_law · Post #512 · 24.02.2025 г., 08:04

🇨🇦Canadian Tribunal Rejects Fabricated Case Law In Canada a family couple relied on Microsoft Copilot to generate legal precedents in a condo dispute—only to discover that nine out of ten cited rulings didn’t exist. The Civil Resolution Tribunal found the cases to be AI “hallucinations,” raising serious concerns about the reliability of AI-generated legal research. While AI can streamline legal work, this case underscores a fundamental risk: without proper verification, reliance on AI-generated case law can undermine legal arguments and credibility. . #AI#LegalTech#AIEthics#Hallucinations

AI & Law

@ai_and_law · Post #819 · 04.05.2026 г., 07:04

🇿🇦South Africa Withdraws AI Policy Over Hallucinated Sources South Africa has withdrawn its draft national AI policy after discovering that at least 6 of its 67 academic citations were AI-generated and referred to non-existent journal articles. Communications Minister Solly Malatsi stated that the most plausible explanation is the inclusion of unverified AI-generated references, calling the lapse a failure that “compromised the integrity and credibility” of the policy. The draft policy had proposed establishing a national AI commission, an AI ethics board, and a regulatory authority, alongside incentives such as tax breaks and grants to support AI infrastructure. The issue was identified after News24 found fabricated citations, later confirmed by journal editors. The policy will be revised before being reissued, and the minister indicated there would be consequences for those responsible. The case highlights risks of using generative AI in policy drafting without verification. A Nature study cited in the report found that over 2.5% of academic papers in 2025 contained at least one potentially hallucinated reference, up from 0.3% in 2024, amounting to more than 110,000 papers. #AIRegulation#AIethics#Hallucinations#PublicPolicy#AIGovernance

People who eat the mushroom Lanmaoa asiatica raw or undercooked have reported seeing tiny human-like figures moving around them. These are called lilliputian hallucinations. Reports from people across different cultures and backgrounds describe similar details, including small figures walking on floors and furniture. The effects can begin 12–24 hours after eating and may last 1–3 days. Some cases are serious and require hospital care. Don't try this yourself.. 🍄😵‍💫🧚‍♀🦄🍄‍🟫 [Read more 1] [Read more 2] [Read more 3] @googlefactss #Mushrooms#ScienceFacts#Hallucinations#Nature#DidYouKnow If you have ideas or feedback contact us: @Googlefactss_Feedback_bot

Machinelearning

@ai_machinelearning_big_data · Post #8518 · 11.09.2025 г., 17:11

🔥WFGY 2.0 — Semantic Reasoning Engine for LLMs (MIT) Это движок с открытым исходным кодом, цель которого — уменьшить галлюцинации и логические сбои в системах типа RAG / LLM, особенно когда: - источники OCR-текста плохо распознаются, - происходит «semantic drift» (когда ответ уходит от вопроса), - «ghost matches», когда извлечённый фрагмент кажется релевантным, но на самом деле нет. Обычно ошибки ловят уже в готовом сгенерированном тексте, из-за чего они часто повторяются. В Semantic Reasoning Engine всё наоборот: если система видит, что рассуждения «кривые» или сбились с курса, она останавливается, сбрасывается или ищет другой путь и отвечает только когда состояние стабильно. 🛡Авторы называют это semantic firewall - семантический «файрвол». Проверки встроены прямо в процесс мышления модели, а не поверх ответа с фильтрами или регексами. Это помогает избегать ошибок до того, как они попадут в вывод. 📌 Проект включает карту из 16 типичных ошибок LLM: - неверный поиск данных, - сбившаяся логика, - «провалы памяти», - путаница ролей агентов и другие. Для каждой есть простое текстовое исправление. Никаких SDK — достаточно вставить инструкции прямо в промпт. 🟢Как модель решает, правильные ли ответ генерируется: - ΔS (drift) - не уходит ли смысл слишком далеко от шага к шагу - λ (convergence) - сходится ли рассуждение к решению или крутится в цикле - Coverage — достаточно ли фактов и аргументов учтено Если все три условия выполнены, ответ считается «качественным». 🟢В тестах стабильность вывода выросла до 90–95% против обычных 70–85% у традиционных подходов. ▪Github: https://github.com/onestardao/WFGY @ai_machinelearning_big_data #ai#llm#opensource#reasoning#hallucinations#promptengineering