Содержимое
📎Автоматизируем подготовку промтов для GPT: Python-функция для детального описания DataFrame 🕵♂️Следствие установило, что для получения качественного ответа (без загрузки базы в чат) часто приходится потратить довольно много времени на описание таблицы, где какой тип данных, примеры, формат, количество nan значений, диапазон дат и прочие нюансы. Будто при допросе вместо описания преступника, следователь внимательно изучает все родинки у допрашиваемого лица. И у адвоката. ⏰В качестве жертвы у нас рабочее время, которое можно потратить на описание задачи. В какой то момент я подумал, а почему бы не сделать универсальную функцию которая будет собирать эту информацию за меня, и до кучи сразу писать какой-нибудь усредненный промт (обычно писать мне его лень, и вы можете его подкорректировать под себя) ⬇️ В общем вашему вниманию представляю эту функцию. Всё что нужно, это вставить код в ячейку, и в следующей команде указать ваш датафрейм. Принт выведет вам готовый промт с описанием вашей таблицы, расскажет тип данных каждого столбца, покажет примеры значений, диапазоны и количество пропусков, а заодно проверит датафрейм на дубликаты. Простой пример на основе календаря, но в функции учитываются и числа с точкой. prompt = generate_df_prompt(calend, "calend") # Второй аргумент имя таблицы print(prompt) Сама функция в первом комментарии к посту ✏️ А как вы готовите промты для анализа данных? Делитесь вашими лайфхаками в комментариях. И ставьте 🐳 если используете ИИ.