TGINSIGHT CHAT
Ali Kuzhuget (AI, NLP, keyboards, Dev)
@AliKuzhuget
TechnologiesБлог математика-разработчика. Сейчас развиваю кириллические клавиатуры на iOS! @agilight
Recent posts
Page 1 of 24 · 288 posts
Posted Apr 19
Посоветуйте, как лучше достучаться до носителей языков, которым нужна системная клавиатура в iOS? Уже много месяцев делаем open-source проект клавиатур (iOS / macOS / Android), более 10 языков подключили. Один из главных затыков — не технология, а выход на реальные языковые сообщества. Нужны контакты активных носителей: – чаты / каналы / сообщества – люди (активисты, переводчики, админы) – организации / проекты – любые точки входа На первом этапе от носителей нужно совсем немного — перевести базовые команды (~14 слов) и проверить раскладку. Если у вас есть выход на какой-то язык или сообщество — напишите, куда идти или с кем связаться. Можно в комментарии или личку. Даже один контакт может запустить целый язык 🙌
Posted Apr 17
⚡️ Новая раскладка: Телеутский язык для iOS! Добавил Телеутскую клавиатуру (39 букв) для iOS и macOS. Макос версию можете уже сегодня использовать, и нам важен ваш опыт – также и на iOS (пока как демо)! 🧐 Нужен ваш взгляд: Поскольку Телеутский алфавит богаче стандартного кириллического, мы ищем «золотую середину» в расположении клавиш. Посмотрите текущую версию по ссылке ниже и напишите в комментариях: удобна ли она? Может быть, стоит вынести другие буквы в основной ряд или изменить привязки долгого нажатия? 🌏 Что дальше? Поддержка других языков России, в том числе языков Дальнего Востока (нанайский, ульчский, нивхский и др.). Если вы хотите увидеть свой родной язык из заводских настроек Айфона — пишите! 🔗 Посмотреть и протестировать Телеутскую раскладку: https://agisight.github.io/ios-system-keyboard/ #Teleut#Телеуттар#Keyboard#Сибирь#ДальнийВосток#СохранениеЯзыков
Posted Apr 10
ГигаЧат общается теперь на языках народов Российской Федерации. Важный шаг для цифровой поддержки языкового многообразия страны. Хорошо, что и в самом Сбере, и в профильных министерствах и организациях нашлось внимание к этой теме. Такие результаты не появляются сами собой: за ними стоит большая совместная работа команд, исследователей, образовательных и культурных институций. Спасибо! Важно и другое: качество поддержки языков напрямую связано с тем, сколько в интернете есть открытых текстов, словарей, переводов, записей речи и других материалов. Особенно большую роль играют данные со свободными лицензиями — именно они помогают языкам стать заметнее в цифровой среде и попасть в современные ИИ-системы. Теперь хороший момент потестить свой язык в ГигаЧате — в вебе, мобильных приложениях и чат-ботах. Посмотреть, как он понимает запросы, как отвечает, что уже получается хорошо, а что еще стоит улучшать. Все ваши живые отзывы напрямую будут подпитывать ИИ в правильном направлении. Это как раз самая проблемная часть обучения ИИ – живые отзывы и оценки (см. Эвалюация ИИ). На картинке пример общения на Тувинском языке. https://giga.chat/
Posted Apr 7
Википедии в этом году 25 лет! А это маскот в честь дня рождения – Малыш Глобус (Глобусёнок?) – Baby Globe! Спасибо, Википедия и все её авторы и редакторы, без которых это было бы невозможно! https://wikimediafoundation.org/wikipedia25/wikipedia-mascot/
Posted Apr 6
Нанайский язык (На̄ни хэсэни) — gld Раскладка клавиатуры для нанайского языка (ISO 639-3: gld), тунгусо-маньчжурская семья. Ещё не готова клавиатура, необходимо перевести нужные команды и проверить доступность букв и удобство. Ссылка на папку Нанайского языка: https://github.com/Agisight/ios-system-keyboard/tree/main/layout/gld Просмотр всех клавиатур тут: https://agisight.github.io/ios-system-keyboard/
Posted Apr 6
Чего только не предпринимал, чтобы цифровизовать свой язык, в последствии, и другие языки Российской Федерации. Вспомнил статью 2024 года "Как технологии помогают сохранять исчезающие языки России: опыт Али Кужугета": ...убежден, что только сохраняя национальные языки можно поддерживать и развивать культуры народов, а значит укреплять один из главных признаков силы государства (РФ) — его многонациональность. Угадайте с кем мое фото?) Можете поделиться дальше с этой статьей, приглашайте всех в нашу группу. Надеюсь, у нас все получится как с клавиатурами, так и другими технологиями. https://www.eg.ru/society/4241032-kak-tehnologii-pomogayut-sohranyat-ischezayushchie-yazyki-rossii-opyt-ali-kujugeta/
Posted Apr 6
✅ Закрыл скилл-бейдж Google Cloud — Create ML Models with BigQuery ML Если коротко — BigQuery ML позволяет строить ML-модели прямо SQL-запросами, без Python и отдельной инфры. Данные уже в таблице → тренируешь модель → получаешь предикт. Всё в одном месте. Что можно делать: — прогнозировать выручку, спрос, нагрузку — предсказывать отток клиентов — сегментировать пользователей — ловить аномалии и фрод — строить рекомендации Для текста, картинок и генерации не подходит — тут нужны другие инструменты. Но для аналитики на табличных данных — супер.
Posted Apr 4
Вот это сюрприз! Набор данных SMOL (Set of Maximal Over-all Leverage) представляет собой корпус объемом 6 100 000 слов от компании Google, содержащий профессионально переведенные параллельные данные на английском языке и 115 языках с недостаточным объемом ресурсов. Этот набор данных, находящийся в свободном доступе, включает переведенные предложения и документы; его можно скачать с платформы HuggingFace. Изучаю курсы по ИИ и МЛ от Google, и вижу ссылку на статью. Открываю – а там мое имя в статье! 🔬🚀🦾 Урок: https://www.skills.google/paths/3135/course_templates/1452/html_bundles/597277
Posted Apr 4
Использование потенциала языков с ограниченными ресурсами (в мире ИИ и машинного обучения). Посмотрите с субтитрами. https://youtu.be/mQseeeXxY5Y
Posted Apr 1
Как вы думаете, есть ли смысл в этих буквах из Сербского и Македонского языков в наших клавиатурах на МакОС? Даже для русской расскладки? Возможно, это хорошо для тех, кто живет на Балканах. Без них Русский язык может легко жить. Этой русской расскладкой даже нельзя полностью набрать буквы Церковнославянского языка. И главный вопрос: а нам это надо? Возможно, туда есть смысл вставить много чего из мира науки, типографии, музыки, экономики и т.д. Например: § ± π ∑ ∏ ∂ ₿ ₸ ‰ ♪ † ♫ ∫ ¢ α β · ∇ ↓ ↑ и т.д. Думаю предложить более необходимый вариант символов для стандартной "Русской клавиатуры". https://github.com/Agisight/ios-system-keyboard/blob/main/layout/rus/rus-macos.yaml
Posted Mar 30
Как же круто наблюдать за тем, что стык лингвистики и программирования стал одной из самых горячих и узких ниш в IT. Мировым компаниям сейчас критически важно понимать мышление человека, его бэкграунд и язык. В 2013 году, когда я занимался цифровизацией Тыва Википедии, я предлагал лингвистам из РФ (в Новосибирске, Кызыле, Москве) прокачивать навыки в коде или хотя бы системно оцифровывать данные (в таблицах или БД). Многие смотрели на меня как на сумасшедшего. А сегодня машинное обучение, работа с уникальной письменностью и понимание контекста — это то, за чем охотятся корпорации. Сейчас интернет полон мультиязычных текстов и только полный разбор всех языков поможет корпорациям быть точными для тех же популярных языков. Время расставило всё по местам. 💻📖
Posted Mar 29
По этой стабильной ссылке перейдите и оцените дизайн ваших клавиатур для МакОС. Клавиатуры МакОС можете даже сейчас взять и установить. Скидывайте лого ваших языков, чтобы на настройках легче было найти ваш язык по картинке. Ваши мнения? https://agisight.github.io/ios-system-keyboard/