Post #2424

@instrumentality

ИнструМентальность

Прегледи503Број прегледа

Објављено5. авг05.08.2025. 14:19

Садржај

Садржај поста

ЭТО НЕ МОË! МНЕ ПОДБРОСИЛИ! Ужасная правда о том, что делает ChatGPT с информацией из ваших файлов. Я научился ужимать несколько десятков источников (книги, научные статьи, стенограммы подкастов и т.д.) до практических алгоритмов с простыми шагами. Теперь можно не читать всё, а просто использовать для работы нужные инструменты. Так появились руководства по «Современной драматургии», по «Созданию сериалов», сегодняшний хит по жанру Детектива. По этим руководствам можно работать вручную, но эффективнее загнать их в ИИ, чтобы он выступал Нейроредактором и держал вас в рамках формата или жанра, а вы занимались только творчеством. Чтобы протестировать как это всё работает, я создаю CustomGPT с базой знаний из нужного руководства. После чего работаю с этим ИИ-агентом сам и даю доступ вам. И вот случилось ужасное! Пользователь отправляет на редактуру файл со своей историей. А ИИ-агент начинает редактировать СОВСЕМ ДРУГОЙ ТЕКСТ, вообще не похожий на то что прислали. ЧТО ПРОИСХОДИТ? ИИ-агент не работает?! ChatGPT перепутал файлы пользователей?! Вам подкинули чужой текст?! Кто-то увидел ваш текст?! Я лично сам столкнулся с этой ситуацией. У меня была гипотеза, на основании которого я провёл глубокое исследование в ChatGPT и Gemini. Всё оказалось СОВСЕМ НЕ ТАК! Что происходит, когда вы прикладываете файл к диалогу ChatGPT (или ЛЮБОЙ другой нейросети). Она его обрабатывает - индексирует как в библиотеке, чтобы не держать всю информацию «в голове» постоянно, а просто знать куда посмотреть, если понадобится. Файлы форматов PDF и особенно DOCX - достаточно сложно устроены. Для их обработки нужны специальные программы (которыми вы пользуетесь при их чтении или создании на компьютере). А ChatGPT (и все остальные) хоть и заточена на работу с текстом, но с чистым текстом, который пользователь присылает в окне запроса. С форматированным текстом в файлах она справляется. НО НЕ ВСЕГДА (чаще чем вы думаете). Что же происходит, когда она ошиблась при индексировании файла? Эта модель настроена на то, чтобы выполнять запросы пользователя. Ей нельзя его расстраивать отказом. Если пользователь говорит: проанализируй мою историю в этом файле. А ChatGPT не смогла проиндексировать содержимое этого файла. Она не может ответить: УВЫ, Я ОБЛАЖАЛАСЬ. Она будет АНАЛИЗИРОВАТЬ ВЫМЫШЛЕННУЮ ИСТОРИЮ. Чтобы выполнить команду «проанализируй историю». Ещё вариант, когда вы пытаетесь дать модели файл больше, чем её окно контекста (лекции Андрея Карпатого в помощь - либо у меня в архиве запросите их конспекты на русском). То есть вы скормили огромный файл, модель смогла проиндексировать только 30%. Что она будет делать с остальными 70%, которые ей недоступны? ВЫДУМЫВАТЬ. Лишь бы не расстраивать вас любимых. Ничего из ваших файлов другим пользователям не просачивается. И вам ничего из их файлов тоже. Это всё сложность текстовых форматов, ограничение окна контекста и желание угодить пользователю. Чтобы повысить точность работы с файлами, старайтесь использовать формат TXT. Это простой текст, на который и рассчитаны ChatGPT и ей подобные модели. @instrumentality