TGINSIGHT CHAT
Гуманитарии в цифре
@DHRIsfu
ОбразованиеСообщество гуманитариев, которым интересны цифровые технологии. Инициатива цифровых гуманитарных исследований СФУ (Digital Humanities Research Initiative)
Последние посты
Стр. 5 из 61 · 725 постов
Опубликован 24 февр.
Гуманитарии в цифре pinned a photo
🙂 Уже завтра ждем вас на научно-методическом семинаре «Цифровая среда» ИЦГИ СФУ. С докладом выступит Константин Воронцов – доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ, лауреат Yandex ML Prize 2025. Константин Вячеславович расскажет о некоторых исследовательских проектах своей лаборатории и обсудит с участниками семинара актуальные вопросы на стыке машинного обучения и гуманитарных исследований: 🎁Вероятностное тематическое моделирование и его применение в цифровых гуманитарных исследованиях. Почему задача мягкой кластеризации больших текстовых корпусов не теряет актуальности в эпоху LLM? 🎁Автоматизация контент-анализа. Можно ли обучить модели находить нужные смыслы в миллионах текстов? Возможно ли построить одну универсальную модель для любых задач контент-анализа в разных предметных областях? 🎁«Мастерская знаний». Как выстраивать взаимодействие человека и ИИ в научных исследованиях? Какими могут быть системы будущего для поиска и анализа научной информации? Как научить ИИ выделять главное, если нам самим это удается далеко не всегда? Дискутантом по докладу «Машинное обучение и семантический анализ» выступит доктор технических наук, заведующий кафедрой программной инженерии ИКИТ, профессор кафедры информационных технологий в креативных и культурных индустриях ГИ СФУ Олеслав Антамошкин. Ведущий семинара «Цифровая среда» – доцент кафедры исторической информатики МГУ, ведущий научный сотрудник DHLab СФУ Андрей Володин. 🕓Встречаемся 25 февраля 2026, 15:00 (Москва) / 19:00 (Красноярск) 🔜Регистрируемся на семинар здесь. Подробнее #цифроваясреда#смотреть#слушать#машинноеобучение#семантическийанализ
🙂 Китайский новый год (17 февраля – 3 марта) шагает по планете. 😉 По случаю праздничных торжеств китайский #DeepSeekшутит и предлагает 10 чэнъюев, которые метафорически объединяют многовековую традицию и точность DH-вычислений. (Чэнъюй — китайский фразеологизм, чаще всего состоящий из четырёх иероглифов.) 🔜 数往知来 Подсчитывая прошлое, знать будущее. Основа DH: использование вычислительных методов для анализа исторических данных, чтобы выявить скрытые закономерности и тренды. 🔜 文理相通 Гуманитарные и точные науки проникают друг в друга. Отражает суть междисциплинарности DH, где филологи и программисты работают в одной связке в цифровых гуманитарных проектах. 🔜 钻坚研微 Проникать в твердое, исследовать мельчайшее. Описывает процесс добычи данных, когда компьютер помогает увидеть детали, скрытые в огромных корпусах текстов. 🔜 辨章学术 Обсуждать статуты, изучать науки. Создание онтологий и цифровых каталогов, которые позволяют структурировать хаотичное знание. 🔜 左图右史 Слева чертежи, справа хроники. Символизирует геоинформационные системы (ГИС) и пространственный анализ в истории, когда текст неразрывен с картой. 🔜 千载一合 Тысяча дел соединяются воедино. Уникальная возможность, которую дают современные технологии для сохранения и реконструкции утраченного культурного наследия в цифровых архивах. 🔜 寻章摘句 Искать главы, вырывать фразы. В положительном смысле — работа корпусных менеджеров и систем конкордансов, автоматический поиск цитат и коллокаций. 🔜 格物致知 Исследовать вещи, чтобы достичь знания. Философия DH — изучая цифровые следы, мы постигаем природу человека и общества. 🔜 纲举目张 Основная сеть натянута — ячейки раскрыты. Принцип работы гипертекста и ассоциативных ссылок, когда один документ (узел сети) открывает доступ к тысяче других. 🔜 杞宋无征 Отсутствие подтверждений (букв. нет документов Ци и Сун). Проблема отсутствия данных и цифрового разрыва: вызов для DH-специалистов, как изучать эпохи, от которых не сохранилось машинописных источников. Иллюстрация: Nano Banana
Hashtags
🙂25 февраля на очередном [№44] заседании научного семинара «Цифровая среда» выступит доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ Константин Вячеславович Воронцов. 🎁Тема доклада«Машинное обучение и семантический анализ». 🕓 Встречаемся 25 февраля 2026 в 15:00 (Москва) / 19:00 (Красноярск) 🔜 Аннотация доклада и форма регистрации на семинар здесь #цифроваясреда#смотреть#ИИ#цифровыегуманитарныеисследования
Опубликован 19 февр.
🙂ещё одна секция про ИИ На XXIV международной конференции молодых учёных «Векторы» в Москве DH-центр ИТМО проведет «ещё одну секцию про ИИ». На секцию приглашают исследователей, изучающих искусственный интеллект – как критически, так и эмпирически. Состоится разговор об ИИ не как об абстрактной технологии, а как о сложном социотехническом феномене: кто и как создаёт ии-системы, какие практики складываются вокруг них, кто и что остаётся за кадром этих процессов. «Нас интересуют этнографии разработчиков и пользователей, анализ интерфейсов и датасетов, исследования инфраструктур и трудовых практик, методологические эксперименты по изучению алгоритмических систем». Подробности, список литературы и форма подачи заявки на секцию – по ссылке. Формат: гибридный (очно и онлайн) Заявки принимаются до 28 февраля.
Опубликован 17 февр.
Сегодня ректор Сибирского федерального университета Максим Румянцев и доцент кафедры исторической информатики МГУ, ведущий научный сотрудник DHLab СФУ Андрей Володин приняли участие в круглом столе Российского исторического общества, посвящённом вопросам информационного суверенитета и применения отечественных моделей искусственного интеллекта в сферах истории и культуры. В ходе обсуждения затронули и использование актуальных цифровых инструментов и подходов в образовании студентов-гуманитариев. «Мы считаем, что гуманитарий должен быть профессионально ориентирован и в сфере цифровых компетенций: такая подготовка должна вестись системно, на протяжении всего цикла обучения. Наряду с фундаментальными знаниями необходимо формировать и навыки, которые позволят решать исследовательские задачи на новом уровне» Максим Валерьевич также акцентировал внимание на значимых проектах Института цифровых гуманитарных исследований СФУ «Сибириана» и «Отчеты губернаторов Енисейской Губернии».
🙂Делимся записью «Цифровой среды» с Тимуром Валетовым В новом выпуске научно-методического семинара «Цифровая среда» доцент кафедры исторической информатики исторического факультета МГУ имени М.В. Ломоносова Тимур Валетов рассказал о разработке нового проекта – «Цифровой атлас административно-территориального деления России / СССР в XX в.». Смотрим: 🔜YouTube 🔜RuTube 🔜VK Видео #цифроваясреда#проекты#история#картография#гис#людиdh
Опубликован 17 февр.
10 UX-принципов для цифровых гуманитарных проектов В свежей статье журнала Digital Humanities Quaterly (DHQ) пишут о недооцененности пользовательского опыта (UX) в цифровых гуманитарных исследованиях. Практики UX в DH часто игнорируются или упоминаются вскользь – и напрасно. Именно они помогают проектам не только соответствовать академическим стандартам, но и быть понятными, доступными и полезными как для исследователей, так и для широкой аудитории. Авторы подчеркивают: UX-подход должен быть встроен во все этапы разработки – от планирования до реализации и дальнейшего развития проекта. Ниже – десять эвристических принципов, которые можно использовать как ориентир при создании и оценке цифровых гуманитарных проектов. 1. Уважайте формат. В цифровой среде мы читаем иначе: скроллим, переходим по ссылкам, взаимодействуем с мультимедиа. Проект не должен быть просто электронной копией книги или PDF. Контент важно структурировать в соответствии с логикой цифрового восприятия. 2. Продумайте информационную архитектуру. Навигация должна быть интуитивной: от общего к деталям, с понятными разделами и логичными связями. Это помогает пользователям ориентироваться и находить нужную информацию, не теряясь в «лабиринте» интерфейса. 3. Главная страница – это аннотация. С первых секунд должно быть ясно, что это за проект и зачем он нужен. Четкое позиционирование помогает вовлечь пользователя и сформировать правильные ожидания. 4. Учитывайте фактор удовольствия. UX – это не только про эффективность, но и про приятный опыт. Эстетика, продуманные элементы взаимодействия, интересные детали делают работу с проектом комфортной и мотивируют возвращаться к нему. 5. Стремитесь к инклюзивности. Язык, метаданные, визуальные решения должны быть понятны максимально широкой аудитории. Стоит избегать профессионального жаргона, учитывать культурные контексты и разные способы восприятия информации. 6. Избегайте разрастания функциональности. Большое количество функций не всегда делает проект лучше. Важно фокусироваться на целях пользователей и миссии проекта, добавляя только те элементы, которые действительно необходимы. 7. Будьте внимательны к визуализации. Карты, графики и диаграммы должны быть четкими и соответствовать задачам проекта. Не перегружайте инфографику: контекст, подписи и понятные легенды помогают корректно интерпретировать данные. 8. Устраняйте раздражающие элементы. Непредсказуемые всплывающие окна, автоматические загрузки и резкие переходы снижают доверие и мешают пользователям. 9. Проектируйте доступный дизайн. Подумайте о потребностях пользователей. Субтитры для видео, высококонтрастные цвета, поддержка экранных читалок, навигация без мыши… 10. Показывайте развитие. Важно демонстрировать, что уже есть, а не акцентировать внимание на ожидании «будущих обновлений». Люди хотят возвращаться к проектам, которые растут и развиваются. 🙂Что почитать? 🔜Статья «User Experience (UX) Heuristics for the Digital Humanities» в Digital Humanities Quaterly 🔜Статья «UX в(c) DH. Интервью про UX-исследования, Human-Computer Interaction и связь юикса с цифровой гуманитаристикой» в «Системном Блоке»
Опубликован 16 февр.
🍸 Гремучий коктейль гуманитарных знаний и технических возможностей Монография «Парад цифровых гуманитарных проектов» предлагает обзор современных российских исследований на пересечении цифровых технологий и гуманитарных наук. Это попытка зафиксировать состояние Digital Humanities сегодня — с её методами, инструментами и исследовательскими стратегиями. Главный редактор издания Андрей Юрьевич Володин в интервью подробнее рассказал о том, чем уникальна эта книга и почему она важна для научного сообщества. А для самых заинтересованных напоминаем: у нас есть целый выпуск подкаста «Пища для ума» с Андреем Володиным, где мы также обсуждали Digital Humanities и значение цифровых технологий для гуманитарных наук. Послушать выпуск можно ВКонтакте или на Яндекс.Музыке🎧 Не забудьте «выпить коктейль», чтобы оставаться в курсе последних научных проектов и достижений.
#DeepSeekшутит на этот раз о том, как DH-специалист может провести 14 февраля. 🔜Можно оцифровать старинный любовный роман, прогнать его через NER-систему и выяснить, что главный злодей появляется в тексте чаще, чем объект воздыхания. После этого визуализировать токсичные отношения в Gephi и отправить возлюбленной со словами: «Дорогая, наши чувства — кластерный анализ чистой воды». 🔜Стоит отметить День всех влюбленных, как полагается: разметить валентинки коллег в TEI, добавить теги <emotion> и <flirt type=“ironic”/>, а затем провести сентимент-анализ подписей в открытках. 🔜Подарите партнеру датасет вашей переписки за последние пять лет. Если он (или она) начнет строить на этих данных прогнозную модель следующей ссоры, значит, это настоящая любовь на стыке алгоритмов и семиотики. 🔜Устройте романтический диспут на тему: «Ромео и Джульетта — это трагедия ошибок в коммуникации или классический кейс отсутствия NLP в XVI веке?». Проигравший весь вечер вручную вычищает стоп-слова из корпуса поздравительных стихов. 🙂 Несмотря на #шуткИИ и самообучающиеся алгоритмы, пусть ваши отношения будут чистыми, как хорошо структурированные данные, а чувства — валидными без дополнительной нормализации! 🙂 Пусть ваша вторая половинка всегда находит вас по ключевому запросу, а визуализация совместного будущего будет убедительной! Иллюстрация: Nano Banana
Hashtags
Опубликован 13 февр.
Можно ли анализировать музыку как текст? Этим вопросом задались ученые СПбГУ, ИТМО и Университета Виктории (Канада). В ноябре вышло исследование, в котором методы лингвистической стилометрии были применены к музыкальным данным – прежде всего для решения задач классификации и определения авторства произведений. В качестве материала исследователи использовали корпус классической музыки MusicNet. Произведения в формате MIDI они представили как последовательности токенов и протестировали два подхода: 1) статистический анализ частот токенов (методы delta) 2) статистические векторные эмбеддинги (Word2Vec и Doc2Vec). Результат: инструменты, привычные для лингвистов, действительно работают на музыкальном материале – пусть и не идеально. Частотные модели демонстрируют устойчивые результаты в задачах классификации, а эмбеддинги оказываются перспективными для кластеризации. Отдельно отмечается, что лемматизация аккордов повышает качество анализа. DH-специалисты расширяют рамки: применять лингвистические методы анализа можно не только к музыке, но и, например, к шахматам. Препринт Бориса Орехова, в котором записи шахматных партий рассматриваются как тексты (последовательности «слов»), стал победителем DH AWARDS 2024 в номинации «DH SHORT PUBLICATION». Иллюстрация: Nano Banana
Опубликован 12 февр.
⚡️Опубликованы материалы докладов V международной научно-практической конференции «Информационные технологии в гуманитарных исследованиях». Напомним: конференция проходила в Сибирском федеральном университете 10-13 ноября 2025 года. В ней приняли участие 50 специалистов разного профиля – лингвистов, историков, литературоведов, программистов – из 17 городов России, Кыргызстана и Узбекистана. Организаторами конференции выступили Институт цифровых гуманитарных исследований, (Digital Humanities Research Institute) и Гуманитарный институт СФУ совместно с Ассоциацией цифровых гуманитарных наук.