TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #239 · 3 мај

Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML. Из плюсов такого подхода стоит отметить вот что: 🔸 готовый, повсеместно используемый и поддерживаемый формат 🔸 простой и понятный файл, удобочитаемый для человека 🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек Но есть и минусы 🔹 затраты времени при записи файла (кодирование данных в нужный формат строки) 🔹 затраты времени при чтении файла (декодирование данных в Python объекты) 🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...) 🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда) 🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи. Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳. 🔸 очень быстрая запись 🔸 чтение значительно быстрей чем JSON, YAML итд 🔸 размер файла значительно меньше, так как нет разметки 🔸 можно записывать данные по мере поступления не загружая всё в память 🔸 можно извлечь любую часть данных независимо Из минусов 🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата) 🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию. 🔹 не так-то просто создать такой файл без специальной библиотеки В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии. (Это не означает что нельзя записать данные разного типа, просто это будет не так удобно) Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого f15d cd29 a564 4578 ... 09e2 9bc4 a696 1253 ... 84e9 4de1 3b23 c24a ... 2534 5161 28e0 709d ... ... Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла. К чему это я? Читайте в следующем посте... #tricks#basic

Резултати

Пронајдени 1 слични објави

Пребарај: #uzh

当前筛选 #uzh清除筛选
蛋挞报

@Pincongessence · Post #2678 · 04.05.2025 г., 13:34

经过大学伦理委员会批准,UZH 研究人员在 Reddit 研究 LLM 生成内容的观点操纵能力。 - UZH 即苏黎世大学 (Universität Zürich),是位于瑞士苏黎世的一所综合大学。 - /r/ChangeMyView 管理员发布贴文,称 UZH 研究人员在事后告知其使用 GenAI 机器人账户在 /r/ChangeMyView 发文,以研究 LLM 说服人类的能力。 - 研究者称实验已经过大学伦理委员会同意;由于提前告知会使实验失去意义,即使违反了社群规则,也并未在实验开始前告知管理员。研究者也提到其在评论发布之前人工检查了每条评论,确保其无害。 - /r/ChangeMyView 的管理团队向 UZH 伦理委员会表示担忧,要求终止发布实验成果。委员会称其没有终止实验成果发布的权力,并且认为实验引发的负面影响与其意义相比十分微小,不致终止其成果发布。 - 研究者要求不具名;Reddit 已经移除了这些机器人账户和相关发布内容。 old.reddit.com/~ linksrc: blog.gslin.org/~ #GenAI#Reddit#UZH