TGINSIGHT CHAT
Гуманитарии в цифре
@DHRIsfu
ОбразованиеСообщество гуманитариев, которым интересны цифровые технологии. Инициатива цифровых гуманитарных исследований СФУ (Digital Humanities Research Initiative)
Последние посты
Стр. 2 из 61 · 725 постов
Опубликован 10 апр.
Опрос: ИИ-аннотирование исторических текстов Наш коллега Илья Галушко проводит любопытный опрос: он позволит оценить, насколько мы способны отличить краткие описания исторических документов, сделанные человеком, от аннотаций, подготовленных искусственным интеллектом. В чем суть: • Вам покажут 4 пары «аннотация – исторический источник». • Задача – оценить, насколько удачно аннотация передает содержание конкретного документа. В опросе используются реальные архивные аннотации (которые, как оказалось, не так просто найти) и их аналоги, сгенерированные LLM. 🔜Пройти опрос и внести вклад в исследование работы ИИ с историческими источниками
15 апреля – новое заседаниенаучного семинара «Цифровая среда» ИЦГИ СФУ. С докладом выступит технический директор Центра изучения эго-документов «Прожито» Европейского университета в Санкт-Петербурге Андрей Муждаба. Постмортем – это разбор проекта «после»: честный и подробный анализ того, что получилось, что пошло не так и какие решения к этому привели. На практике в жанре «постмортема» полезно говорить и о «живых» проектах – особенно когда они переживают серьезные изменения. «Прожито» прошел путь от «социальной сети прошлого» с дневниковыми записями до крупного корпуса эго-документов, исследовательского центра и попытки стать платформой для общественной архивистики. Сегодня проект находится в процессе переборки – одновременно на уровне идей, методов и технологий. В докладе «Постмортем “Прожито”» речь пойдет о том, как трансформируется цифровой гуманитарный проект изнутри: как инфраструктура (сайт, база данных, инструменты) влияет на логику работы с материалом и как технические решения могут направлять развитие смыслов. 🕓Встречаемся онлайн 15 апреля 2026 в 15:00 (Москва)/ 19:00 (Красноярск) 🔜Зарегистрироваться #цифроваясреда#смотреть#прожито#дневники#проекты
Опубликован 8 апр.
🕓 Уже сегодня в 9:30 (msk)/13:30 (krsk) конференция по анализу данных и технологиям ИИ “Data Fusion’26” откроется визионерским докладом Константина Воронцова. 🎁 Будущее можно прогнозировать или конструировать. И прогнозы, и проекты полезны – как ориентиры или предупреждения. Технологии ИИ развиваются так быстро, что возникает ожидание чуда. ИИ представляется «волшебной палочкой», способной исполнить все желания человека и человечества. Так ли это? Даже если так, нужно точно и осторожно формулировать свои желания именно потому, что они могут исполниться. В то же время, если у нас есть образ желаемого будущего, стоит сфокусировать усилия на его реализации. 🕓 Подключиться к трансляции можно на сайте конференции: зал Атом, доклад Science note. 🔜 Подробная программа конференции “Data Fusion*” в этом году. * Интеграция данных 🙂 Пока суть да дело, можно посмотреть запись доклада Константина Вячеславовича на семинаре «Цифровая среда» — «Машинное обучение и семантический анализ».
Опубликован 7 апр.
Как ИИ меняет саму суть «умения работать с информацией» Недавняя статья на платформе ScienceDirect демонстрирует: за последние пять лет понятие «информационной грамотности» радикально изменилось. Если раньше речь шла о поиске информации и оценке источников, то сегодня этого явно недостаточно. Исследователи проанализировали сотни научных публикаций за 2020-2025-е годы через базу Scopus и пришли к выводу о том, что мы находимся в точке перелома. Информация все чаще не находится, а создается, ответы приходят «готовыми», без видимого источника, алгоритмы становятся посредниками между человеком и знанием. В новой реальности формируется новый навык – AI literacy – не просто «умение пользоваться искусственным интеллектом», а способность понимать, как он устроен, видеть его ограничения и критически оценивать ИИ-ответы. Ключевые тренды, которые выделяют авторы: 🔜 Резкий рост исследований на стыке ИИ и образования 🔜 Смещение фокуса с «поиска информации» на «понимание ИИ» 🔜 Усиление работы библиотек как образовательных пространств 🔜 Рост внимания к этическим проблемам: bias, фейки, прозрачность. ❗️ Сегодня университетские библиотеки становятся не просто хранилищами знаний, а центрами обучения работе с ИИ – местами, где учат ориентироваться в мире, где знание все чаще генерируется машинами. 🔜Читать «Как искусственный интеллект меняет информационную грамотность в научных библиотеках: глобальный наукометрический анализ (2020–2025)»
Опубликован 4 апр.
4 апреля – день интернета и день памяти святого Исидора Севильского. Именно его из всех вариантов святых Ватикан в 2003 году назвал патроном пользователей Всемирной паутины. Исидор Севильский, живший в VI-VII веках, создал 20-томную энциклопедию «Этимологии». По сути, он был одним из первых «гуманитариев в цифре» (в масштабах своего времени), который поставил задачу собрать и классифировать огромное количество информации о смысле и происхождении слов. 🖥 …А еще дата 04.04 как раз созвучна знаменитому обозначению сетевой ошибки.
Опубликован 1 апр.
Изучаем подробный материал Брендана Рорера о трансформерах – той самой архитектуре, на которой построены современные языковые модели. Он объясняет простую (и в то же время фундаментальную) вещь: как текст превращается в числа – и обратно в связную последовательность высказываний. Слова кодируются, превращаются в векторы, затем модель с помощью механизма внимания определяет, какие части текста важны, и на этой основе предсказывает следующее слово. Шаг за шагом – получается осмысленный текст. Никакой магии и «эмпатии» – только математика, вероятности и огромные массивы данных. 🙂Что еще почитать: • Статьи «Как работают трансформеры» и «Что такое рассуждающая языковая модель и как она работает» в «Системном Блоке» • Книга «Практическое руководство по большим языковым моделям» Джея Аламмара и Маартена Гроотендорста.
🙂 Сегодня не выходной, но кажется, что 1 апреля самый подходящий повод для хорошей #шуткИИ. 😉 Тем более, для искусственного интеллекта нету выходных, в есть только перебои электричества. Пока энергия есть, #DeepSeekшутит про то, как может пошутить цифровой гуманитарий в ответ на белую спину. 🔜Оцифровка реальности С утра надо заменить все бумажные книги в кабинете на планшеты, запустив на них скрипт, который каждые 15 минут меняет шрифт с Times New Roman на Comic Sans и обратно. Коллегам объяснять: «Это эксперимент по вариативности восприятия текста в цифровой среде. Просто читайте, не сопротивляйтесь». 🔜Лемматизация коммуникации Объявить, что сегодня в рамках корпоративной этики все переходят на структурированное общение. Каждое слово, сказанное в рабочем чате, должно быть приведено к начальной форме. Вместо «Я сходил на пару» писать: «Я пойти на пара». Вместо «Скиньте статью» — «Статья. Скинуть. Пожалуйста». 🔜Генеративная лингвистика Нейросеть, которую вы обучали весь год, наконец-то «запущена» в прод. Но 1 апреля она начинает писать все научные аннотации в стиле «Вий» Гоголя или рэпа 2000-х. Показываете испуганному завкафедрой дашборд с надписью: «Алгоритм выбрал постмодернистскую стратегию повествования. Багов нет, одни фичи». 🔜Гуманитарный взлом (Humanities Hack) Поменять местами названия файлов в общей папке. «Диплом_Петров_исправленный_окончательный_ВЕРСИЯ_2.doc» переименовать в «Стихи_для_мамы_черновик.txt». А в папку «Архив_ВКР» положить звуковой файл с записью собственного пения на мотив «Битвы экстрасенсов». Главное правило: версионирование должно быть разрушено к полудню. 🙂 Главная шутка дня: сделать вид, что вы перестали быть гуманитарием и превратились в «чистого технаря», а на самом деле начать анализировать рабочие процессы через призму структурализма Леви-Строса. ❗️ Если вдруг то, о чем так долго говорили, окажется не шуткой по случаю дня дурака, то у нас есть 📱https://vk.ru/dhrisfu
Hashtags
Опубликован 31 мар.
🙂 На конференции «Актуальные правила гуманитарных наук» состоялась дискуссия о журнале «Цифровые гуманитарные исследования». 🔜Опубликована видеозапись беседы, в которой приняли участие главный редактор Борис Орехов и члены редколлегии Полина Колозариди и Андрей Володин. 🎁 Можно познакомиться с презентацией с итогами деятельности журнала за два прошедших года. 🧙 И главное — не забывайте читать и цитировать журнал ЦГИ, а также писать в журнал интересные статьи, рецензии и хроники! ❗️Даже в мире, в котором не видно ни зги, Всегда можно придумать статью для ЦГИ!
🙂 На этой неделе много, бурно и глубоко обсуждали правила гуманитарных наук. ❗️ Раз так, то самое время понять, почему цифровые гуманитарии не любят и одновременно любят правила. #DeepSeekшутит: 🙂1.Цифровые гуманитарии НЕ любят правила: 1.1. Потому что они слишком хорошо знают, что любое правило — это просто датасет, который еще не дождался своего выброса. Как только появляется инструкция «все поля должны быть заполнены», тут же находится средневековый манускрипт с полем «Имя автора: неизвестен, но, судя по почерку, он был левшой и ел квашеную капусту». 1.2. Правила требуют четкой структуры, а если привести данные к идеальному виду, они потеряют всю свою постмодернистскую сущность. Попытка заставить цифрового гуманитария работать по строгому регламенту заканчивается так же, как попытка заставить поэта Серебряного века заполнить налоговую декларацию графой «источник дохода: вдохновение». 1.3. Потому что их жизнь — это вечный спор с валидатором: «Это поле не может быть пустым». — «Но это же артефакт! Пустота — это значимая категория в данном контексте!» После десяти таких споров они начинают ненавидеть любые правила априори, даже правило «не выходить из здания с горящим чайником». 1.4. Цифровые гуманитарии не любят правила, потому что правила обычно пишут люди, которые думают, что «TOML — это сленг тиктокеров», а «XML» — это имя португальского футболиста. Любое правило для них — это попытка засунуть античную трагедию в Excel-таблицу, где столбец «Пафос» имеет формат «целое число». 1.5. Они перестали верить в правила в тот момент, когда поняли: если следовать всем инструкциям по работе с данными буквально, «Войну и мир» придется публиковать как scatter plot, а цифровой аватар Толстого будет очень недоволен результатом. С тех пор их любимое правило — «правила созданы, чтобы их дата-майнить». 😉2.Цифровые гуманитарии любят правила: 2.1. Потому что правила — это единственное, что мешает филологу-классику на полном серьёзе ответить на вопрос «какой у тебя тип данных?» фразой «сложный, метафорический, с элементами постмодернистской тоски». Благодаря правилам в их жизни появляется чёткость: если в графе «год издания» стоит «примерно 1640 год или 2392 год, если считать от основания Рима», то это просто NaN, и с этим можно жить дальше. 2.2. Правила они любят ровно до тех пор, пока могут эти правила написать сами. В Digital Humanities главный кайф — сесть и создать собственную схему TEI (XML), где будет ровно 347 обязательных тегов, включая <marginalia> и <ink_blot_reason_melancholy>. Чужие правила — это насилие, свои правила — это «тонкая научная рефлексия». 2.3. Правила позволяют наконец-то закончить спор, который в обычной гуманитарной среде длится примерно с 19ХХ года. Вместо «вы не учитываете дискурс власти!» — «У нас в корпусе правило лемматизации: все существительные приводятся к именительному падежу, даже если это Фуко». И оппонент бессилен, потому что это правило записано в гитхабе, и там есть значок CI/CD. 2.4. Потому что без правил их работа превращается в «каждый размечивает по-своему». А это означает, что один исследователь называет «автором» того, кто написал текст, второй — того, кто его вёл и сохранил в GitHub, а третий просто ставит тег <person> на слово «он». Любовь к правилам у них — это любовь к возможности сесть с коллегой выпить кофе, а не разбираться три часа, почему у вас разнятся результаты на 300%. 2.5. Они полюбили правила в тот момент, когда осознали: только следуя строгим правилам обработки данных, можно законно заставить компьютер сделать всю скучную работу. «Правило гласит: если в тексте встречается более трёх прилагательных подряд — автоматически добавлять сноску “вероятно, влияние Гофмана”». Это не бюрократия, это автоматизация научного подвига. 🎁 Такие вот #шуткИИ, а на иллюстрации не пра́вило, а прави́ло.
Hashtags
Опубликован 27 мар.
🙂 Как может выглядеть цифровой архив будущего Если вы с детства мечтали нырнуть в хранилище с золотыми монетами подобно Скруджу Макдаку – настало время сделать это – без травм и с вполне благородным академическим интересом. Проект COINS – исследовательская разработка лаборатории Urban Complexity Lab при FH Potsdam в сотрудничестве с Münzkabinett Berlin – предлагает новый взгляд на то, как можно демонстрировать и изучать музейные коллекции в цифровой среде. Сам Münzkabinett – одна из крупнейших нумизматических коллекций в мире, объединяющая более 500 000 монет, медалей, инструментов чеканки и многое другое. На платформе COINS можно сортировать коллекцию по стране, периоду, месту чеканки, материалу, весу, размеру и прочим параметрам. При смене параметров происходит магия: объекты не просто фильтруются, а перетекают, группируются, выстраиваются в визуальные паттерны. Платформа стала победителем престижной премии Digital Humanities Award 2018 в номинации "Лучшая визуализация данных DH" и получила награду Information is Beautiful Award. 🔜Загляните на свой страх и риск – оторваться действительно сложно.
Опубликован 26 мар.
🙂Как провести сегодняшний день правильно? 😉 Конечно, присоединиться к конференции «Актуальные правила гуманитарных наук». 🖥Регистрация для онлайн-участников есть на странице конференции. 🕓 Программа там же чуть ниже (см. п. 4), скроллим уверенно. 🎁 Пленарное открытие начнется с дискуссии Полины Колозариди (ИТМО, ЕУ СПб) и Андрея Володина (МГУ, СФУ) о правилах, их природе и роли в жизни исследователей, возможно, получится найти ответ на вопрос: насколько правильными готовы быть гуманитарные науки? ❗️ Критическая литература на тему правил — см. п. 6. 🙂 Если сообщение показалось недостаточно понятным, можно попробовать перечитать его в 💬: https://vk.ru/dhrisfu
Опубликован 25 мар.
Открыто голосование за номинантов международной премии DH Awards 2025 В этом году на профессиональную общественную премию в Digital Humanities вновь номинированы проекты Сибирского федерального университета + работы единомышленников сообщества. 🙂 Наши проекты: Номинация DH RESOURCE Можно отдать голос за коллективную монографию «Парад цифровых гуманитарных проектов», среди авторов которой наши сотрудники Андрей Володин, Марина Лаптева, Полина Сенотрусова, Мария Романюк, Илья Гурьянов, Ирина Владимирова, Анатолий Арефьев. • A parade of Digital Humanities projects Номинация DH TRAINING MATERIALS Поддержим научно-методический онлайн-семинар «Цифровая среда»: • Digital Sreda 🔜Проголосовать можно в специальной форме. Спасибо большое за поддержку!