Assalomu alaykum, hurmatli "Kompyuter bilimlari" kanali obunachilari!
Yaxshi yangiliklar bilan qaytdik! ✅
Turli sabablarga ko‘ra biroz tanaffus bo‘lgan edi. Endi esa jamoamiz yana birlashib, har kuni sizga eng so‘nggi IT yangiliklari, foydali dasturlar va texnologik maslahatlarni yetkazishni boshladik.
📌 Bugundan boshlab har kuni ajoyib postlarni kuting!
Biz bilan qoling — zamonaviy texnologiyalarni birga o‘rganamiz! 💻🔐⚡️
#IT#kompyuterbilimlari#texnologiya#yangiliklar#AI#dastur
⚡ Google представила Gemma 3 270M — свою новую компактную модель
Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки».
🔹Особенности
- 256k токенов
- Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов.
- Доступны предобученные и instruction-tuned чекпойнты.
- Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества.
💼Когда использовать
- Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки.
- Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве.
- Быстрые эксперименты с fine-tuning.
- Полная приватность данных благодаря on-device работе.
- Создание «флота» узкоспециализированных моделей.
В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели.
Gemma 3 270M — отличная небольшая модель, быстрая и дешёвая в работе.
🟠Подробности: https://developers.googleblog.com/en/introducing-gemma-3-270m/
🟠HF: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
@ai_machinelearning_big_data
#news#ai#ml#Gemma#google
🌟Google LangExtract: библиотека извлечения структуры из любого текста.
LangExtract - опенсорсная python-библиотека с функцией легковесного интерфейса к LLM, которая превращает большие объемы текста в структурированные данные.
🟡Ключевая особенность LangExtract на фоне других инструментов - точный фокус на источник.
Каждая извлеченная сущность, будь то имя, дата или дозировка лекарства, привязывается к точным символьным смещениям в исходном тексте. Это дает полную прослеживаемость и верифицируемость результата, просто подсветив найденные данные в оригинальном документе. Больше никаких «откуда модель это взяла?».
🟡Вторая сильная сторона - надежность выходных данных.
Вы определяете желаемый формат вывода с помощью специального представления данных и даете модели несколько примеров . Используя эти примеры, LangExtract следует заданной схеме, задействуя механизм контролируемой генерации, который поддерживается в моделях Gemini. Это гарантирует, что на выходе вы всегда будете получать данные в консистентном, предсказуемом формате.
🟡LangExtract умеет работать с действительно большими объемами.
Библиотека умеет бить текст на чанки, которые обрабатываются параллельно в несколько проходов, каждый из которых фокусируется на более узком контексте.
Для наглядности библиотека умеет генерировать интерактивную и полностью автономную HTML-визуализацию. Это позволяет за считаные минуты перейти от сырого текста к визуальному представлению, где можно исследовать тысячи извлеченных аннотаций.
При этом LangExtract не замыкается на экосистеме Google: он поддерживает гибкую смену LLM-бэкендов, позволяя работать как с облачными моделями, так и с опенсорсными решениями, развернутыми локально.
🟡LangExtract может задействовать "мировые знания" LLM для обогащения данных.
Информация может быть как явной (извлеченной из текста), так и основанной на внутренних знаниях модели. Разумеется, точность таких выведенных данных сильно зависит от возможностей конкретной LLM и качества предоставленных примеров в промпте.
Изначально идеи, заложенные в LangExtract, были применены для извлечения информации из медицинских текстов. Библиотека отлично справляется с идентификацией лекарств, их дозировок и других атрибутов в клинических записях.
Чтобы продемонстрировать возможности инструмента в узкоспециализированной области, Google создал на Hugging Face интерактивное демо RadExtract. В нем показано, как LangExtract может обработать радиологический отчет, написанный свободным текстом, и автоматически преобразовать его ключевые выводы в структурированный формат, подсвечивая важные находки.
📌Лицензирование: Apache 2.0 License.
🟡Статья
🖥Github
@ai_machinelearning_big_data
#AI#ML#LangExtract#Google
⚡️ 5Gemma: новая коллекция энкодер-декодер моделей от Google.
Инженеры Google DeepMind решили вдохнуть новую жизнь в классический подход «энкодер-декодер» выпустив семейство моделей T5Gemma.
Главная интрига заключается не в том, что они сделали, а в том, как. Вместо того чтобы обучать модели с нуля, они разработали метод «адаптации»: взяли уже готовую и предобученную модель-декодер Gemma 2 и, по сути, пересобрали ее в двухкомпонентную энкодер-декодерную архитектуру.
Метод открыл дорогу для интересных экспериментов. Например, стало возможно создавать «несбалансированные» модели, комбинируя большой энкодер с маленьким декодером, скажем, 9-миллиардный энкодер и 2-миллиардный декодер.
Такая конфигурация идеальна для задач суммаризации, где глубокое понимание исходного текста (работа энкодера) гораздо важнее, чем генерация сложного и витиеватого ответа (работа декодера). Это дает инженерам гибкий инструмент для тонкой настройки баланса между качеством и скоростью работы.
🟡Но самое важное - прирост в производительности.
На тестах T5Gemma показывает результаты на уровне или даже лучше своих «однокомпонентных» аналогов. Асимметричная модель T5Gemma 9B-2B демонстрирует значительно более высокую точность, чем базовая Gemma 2 2B, но при этом скорость инференса у них почти идентична.
Даже сбалансированная T5Gemma 9B-9B оказывается точнее, чем Gemma 2 9B, при сопоставимой задержке. Это прямое доказательство того, что двухкомпонентная архитектура может быть и умнее, и эффективнее.
T5Gemma показывает впечатляющий рост в задачах, требующих логических рассуждений. Например, на математическом тесте GSM8K модель T5Gemma 9B-9B набирает на 9 баллов больше, чем Gemma 2 9B.
Эффект становится еще более выраженным после инструктивной донастройки. Здесь разрыв в производительности резко увеличивается: на бенчмарке MMLU модель T5Gemma 2B-2B IT опережает аналог Gemma 2 2B IT почти на 12 баллов.
🟡Google выложила в открытый доступ целую линейку чекпойнтов:
🟢T5 (Small, Base, Large, XL) на базе Gemma (2B, 9B);
🟢«Несбалансированную» версию 9B-2B для экспериментов;
🟢Модели с разными целями обучения (PrefixLM для генерации, UL2 для качества представлений).
🔜 Попробовать возможности T5Gemma или настроить их под свои нужды можно с помощью блокнота Colab. Модели также доступны в Vertex AI.
📌Лицензирование: Gemma License.
🟡T5gemma: https://developers.googleblog.com/en/t5gemma/
🟡Статья: https://arxiv.org/abs/2504.06225
🟡Скачать модель: https://huggingface.co/collections/google/t5gemma-686ba262fe290b881d21ec86
@ai_machinelearning_big_data
#AI#ML#T5Gemma#Google
🧑💻Dasturchilar kasbi bir yil ichida yo‘q bo‘ladimi?
Anthropic kompaniyasi rahbari Dario Amodei dasturchilar kelajagi haqida keskin bayonot berdi. Uning fikricha, 3–6 oy ichida kodning 90 foizini sun’iy intellekt yaratadi, bir yildan so‘ng esa bu ko‘rsatkich 100 foizga yetadi (x.com).
Lekin mutaxassislar fikricha, dasturchilar umuman yo‘qolmaydi. Ularning vazifasi o‘zgarib, kod yozishdan ko‘ra, sun’iy intellekt ishini nazorat qilish va strategiya belgilashga aylanadi.
#AI#Dasturlash#Kelajak
⚡️ ChatGPT’ning kuchli raqibi — Le Chat yangilandi!
Mistral sun’iy intellekti asosida ishlovchi Le Chat endi yanada kuchliroq bo‘ldi va quyidagi imkoniyatlarga ega:
🎨Rasm yaratish – eng yuqori darajadagi Flux Ultra modeli qo‘shildi
🖌Le Canevas – xuddi ChatGPT’dagi Canvas kabi vizual ish maydoni
🔎Qidiruv – o’zbek ham tilida ishlaydi
📄PDF o‘qish – hujjatlarni tezkor tahlil qilish va qisqacha mazmun chiqarish
💻Kod yozish va testlash – dasturlarni yaratish va murakkab masalalarni yechish
⚡Tezkor yozish – sekundiga 1000 ta so‘z ishlab chiqadi
💰Eng muhimi – bularning barchasi BEPUL!
DeepSeek lag bo‘layotgan paytda Le Chat sinab ko‘rishga arziydi! 🚀
#AI#Mistral#LeChat
🚀NAMANGANDA AI HACKATHON VA STARTUP SPOTLIGHT
Kelajakni kimdir yozadi. Nega siz emas?
🟢23-apreldan Namangan global harakatga qo‘shiladi: viloyatda ilk bor yirik AI Hackathon o‘tkaziladi.
Bu — shunchaki tadbir emas, balki 72 soatlik g‘oyalar, texnologiyalar va eng kuchlilar saralanadigan maydon. Jamoa tuzing, real muammoni tanlang, sun’iy intellekt yordamida yechim yarating va uni hakamlar oldida taqdim eting.
🗓Boshlanish: 2026-yil 23-aprel
📌Manzil: IT Park Namangan viloyati filiali binosi
⌛️Davomiyligi: 3 kun (72 soat nonstop) — g‘oyadan jonli demogacha
🔗Hackathon ro‘yxati
🟢Hackathon bilan bir vaqtda, allaqachon g‘oyasi yoki MVPsi mavjud startaplar uchun alohida tadbir ham o‘tkaziladi. Eng yaxshi 3 ta loyiha tanlab olinadi va alohida sovg‘alar bilan taqdirlanadi.
➡️Ariza muddati: 23-aprel
⚠️Muhim: faqat bitta formatda qatnashish mumkin — yoki Hackathon, yoki Startup Spotlight. Ikkalasiga bir vaqtda ariza topshirilgan taqdirda, jamoa ogohlantirishsiz diskvalifikatsiya qilinadi.
➡️Har kim qatnashishi mumkin: tajriba shart emas — g‘oya, jamoaviy ishlash va 72 soat faol ishlashga tayyorlik muhim.
➡️Joylar cheklangan. 3 kun ichida Namangan IT tarixida yangi sahifa ochiladi — unda sizning ismingiz bo‘ladimi?
🔗Ro‘yxatdan o‘tish
#NamanganAIHackathon#AIHackathon#Namangan#ITParkNamangan#StartupSpotlight#SuniyIntellekt#AI#Hackathon#Yoshlar#Innovatsiya#Startup