Содержимое
🙂 На этой неделе много, бурно и глубоко обсуждали правила гуманитарных наук. ❗️ Раз так, то самое время понять, почему цифровые гуманитарии не любят и одновременно любят правила. #DeepSeekшутит: 🙂1.Цифровые гуманитарии НЕ любят правила: 1.1. Потому что они слишком хорошо знают, что любое правило — это просто датасет, который еще не дождался своего выброса. Как только появляется инструкция «все поля должны быть заполнены», тут же находится средневековый манускрипт с полем «Имя автора: неизвестен, но, судя по почерку, он был левшой и ел квашеную капусту». 1.2. Правила требуют четкой структуры, а если привести данные к идеальному виду, они потеряют всю свою постмодернистскую сущность. Попытка заставить цифрового гуманитария работать по строгому регламенту заканчивается так же, как попытка заставить поэта Серебряного века заполнить налоговую декларацию графой «источник дохода: вдохновение». 1.3. Потому что их жизнь — это вечный спор с валидатором: «Это поле не может быть пустым». — «Но это же артефакт! Пустота — это значимая категория в данном контексте!» После десяти таких споров они начинают ненавидеть любые правила априори, даже правило «не выходить из здания с горящим чайником». 1.4. Цифровые гуманитарии не любят правила, потому что правила обычно пишут люди, которые думают, что «TOML — это сленг тиктокеров», а «XML» — это имя португальского футболиста. Любое правило для них — это попытка засунуть античную трагедию в Excel-таблицу, где столбец «Пафос» имеет формат «целое число». 1.5. Они перестали верить в правила в тот момент, когда поняли: если следовать всем инструкциям по работе с данными буквально, «Войну и мир» придется публиковать как scatter plot, а цифровой аватар Толстого будет очень недоволен результатом. С тех пор их любимое правило — «правила созданы, чтобы их дата-майнить». 😉2.Цифровые гуманитарии любят правила: 2.1. Потому что правила — это единственное, что мешает филологу-классику на полном серьёзе ответить на вопрос «какой у тебя тип данных?» фразой «сложный, метафорический, с элементами постмодернистской тоски». Благодаря правилам в их жизни появляется чёткость: если в графе «год издания» стоит «примерно 1640 год или 2392 год, если считать от основания Рима», то это просто NaN, и с этим можно жить дальше. 2.2. Правила они любят ровно до тех пор, пока могут эти правила написать сами. В Digital Humanities главный кайф — сесть и создать собственную схему TEI (XML), где будет ровно 347 обязательных тегов, включая <marginalia> и <ink_blot_reason_melancholy>. Чужие правила — это насилие, свои правила — это «тонкая научная рефлексия». 2.3. Правила позволяют наконец-то закончить спор, который в обычной гуманитарной среде длится примерно с 19ХХ года. Вместо «вы не учитываете дискурс власти!» — «У нас в корпусе правило лемматизации: все существительные приводятся к именительному падежу, даже если это Фуко». И оппонент бессилен, потому что это правило записано в гитхабе, и там есть значок CI/CD. 2.4. Потому что без правил их работа превращается в «каждый размечивает по-своему». А это означает, что один исследователь называет «автором» того, кто написал текст, второй — того, кто его вёл и сохранил в GitHub, а третий просто ставит тег <person> на слово «он». Любовь к правилам у них — это любовь к возможности сесть с коллегой выпить кофе, а не разбираться три часа, почему у вас разнятся результаты на 300%. 2.5. Они полюбили правила в тот момент, когда осознали: только следуя строгим правилам обработки данных, можно законно заставить компьютер сделать всю скучную работу. «Правило гласит: если в тексте встречается более трёх прилагательных подряд — автоматически добавлять сноску “вероятно, влияние Гофмана”». Это не бюрократия, это автоматизация научного подвига. 🎁 Такие вот #шуткИИ, а на иллюстрации не пра́вило, а прави́ло.