Заметка начинающим, которые часто сталкиваются с подобной непоняткой.
Ситуация следующая, есть список файлов:
names = [
'image.bmp',
'second.txt.bkp',
'data.db',
'.config.cfg',
'file.ext.bkp'
]
И мы хотим убрать у них окончание ".bkp".
Не знаю зачем, пример довольно надуманный) Но суть он показывает, а это главное.
Те, кто еще не очень знаком с библиотекой os.path или pathlib, вероятно решат обработать имена как строки. И тут вполне подойдет метод строки strip().
Что делает этот метод? Он отрезает указанные символы по обеим сторонам строки. Если ничего не указать, то убирает невидимые символы (пробелы, табуляции и переносы строк).
В нашем случае будет выглядеть вот так:
>>> name.strip('.bkp')
То есть просим удалить строку '.bkp' по краям имени файла, если таковая есть.
Можно применить аналогичный метод rstrip(), чтобы отрезать только справа, но для этого примера используем обычный.
>>> for name in names:
>>> print(name.strip('.bkp'))
image.bm
second.txt
data.d
config.cfg
file.ext
Хм, что-то не то с нашими именами! Что случилось??? Видим нежелательное переименование в именах, где и близко не было указанной строки '.bkp'
А дело всё в том, что данный метод ищет не указанную строку, а указанные символы, и не важно в каком порядке.
Для метода strip() строка '.bkp' это не паттерн для поискаа список символов. Потому он отрезал симовол 'p' от '.bmp' и удалил точку из файла '.config.cfg'.
Как тогда правильно заменить именно паттерн? Для начинающего можно посоветовать метод строки replace(), который как раз использует для замены указанную строку целиком. В нашем примере заменим её на пустую строку.
>>> for name in names:
>>> print(name.replace('.bkp', ''))
image.bmp
second.txt
data.db
.config.cfg
file.ext
Уже лучше, но помните, это лишь пример про strip(). Для работы с именами файлов есть способы и более "правильные", дающие однозначно верный результат. Я взял файлы только в качестве примера. Даже replase() тут может сделать не то что ожидаем.
Просто впредь будьте внимательны с этим strip().
#basic
🚀Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе.
Модели заточены для сложного reasoning и агентных задач.
🔵Доступны в четырёх вариантах:
• 31B Dense и 26B MoE
Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только.
• E4B и E2B (Edge)
Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио.
🤖Что можно делать:
• строить автономных ИИ-агентов
• планировать и выполнять многошаговые задачи
• взаимодействовать с приложениями
• искать данные и вызывать API
👉 Встроенная работа с инструментами (tool use) из коробки.
🧠Контекст до 256K токенов:
• анализ целых кодовых баз
• длинные цепочки действий без потери контекста
• стабильная работа в сложных сценариях
⚡️ Начать можно уже сейчас через Google AI Studio
Также веса моделей доступны на Hugging Face, Kaggle и Ollama.
Лицензия: Apache 2.0!
Blog: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
GGUFs: https://huggingface.co/collections/unsloth/gemma-4
Guide: https://unsloth.ai/docs/models/gemma-4
@ai_machinelearning_big_data
#Gemma
📛Google представила Gemma 3 270M — ультракомпактную LLM
Google выпустила Gemma 3 270M — одну из самых маленьких моделей в индустрии (270 млн параметров, а не миллиардов). Её можно запускать даже на слабых устройствах, а в INT4-квантизации на Pixel 9 Pro она расходует всего 0,75% батареи за 25 диалогов.
Несмотря на размер, модель показывает достойные результаты: на IF-Eval её показатель следования инструкциям — 51,2%, что выше, чем у Qwen 2.5 0.5B, который почти вдвое больше.
📂 Веса: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
📄 Блог Google: https://developers.googleblog.com/en/introducing-gemma-3-270m/
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#нейросети#gemma
Корпорация Google выпустила три новые модели генеративного искусственного интеллекта c открытым исходным кодом, позиционируя их как более «безопасные, компактные и прозрачные» по сравнению с другими.
▫️ Gemma 2 2B — версия модели с 2 млрд параметров, отличается улучшениями в области безопасности, предлагает «баланс производительности и эффективности»;
▫️ ShieldGemma — созданный на основе Gemma 2 комплект нейросетей для классификации безопасного контента;
▫️ Gemma Scope — новый инструмент для интерпретации моделей, который позволяет получить представление об их внутреннем устройстве.
#Google#Gemma
✴️Google выпустила MTP-drafters для Gemma 4 — ускорение до 3x без потери качества
Google представила Multi-Token Prediction drafters для семейства Gemma 4. Это небольшие вспомогательные модели для speculative decoding, которые заранее предлагают несколько следующих токенов, а основная модель затем проверяет их за один проход. По заявлению Google, такой подход дает ускорение инференса до 3 раз и при этом не ухудшает качество, точность и логику рассуждений.
Практически это значит, что Gemma 4 становится заметно быстрее в локальном запуске, агентных сценариях и on-device задачах. Google отдельно пишет про поддержку разных стеков и платформ: Transformers, MLX, vLLM, SGLang, Ollama, а сами MTP-drafters уже доступны под той же Apache 2.0 лицензией, что и Gemma 4, с загрузкой через Hugging Face и Kaggle.
Источник: блог Google | Документация | Hugging Face
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#llm#gemma
GPT-4 стоил $30 за миллион токенов.
Gemma 4 сейчас стоит — $0.14. Разница в 214 раз. Падение цен на интеллект на два с лишним порядка всего за два года.
Google выпустил Gemma 4 — open-source, 31 млрд параметров, 256K контекст. Бенчмарки в лоб с GPT-4o:
— MMLU: Gemma 4 92.4% vs GPT-4o 88.7%
— HumanEval (код): 94.1% vs 90.2%
— GSM8K (математика): 96.2% vs 95.0%
Два года назад GPT-4 был фронтиром за $30. Сейчас open-source бьёт его по бенчмаркам за $0.14. Падение в 214 раз — больше, чем закон Мура даёт за десятилетие. А можно развернуть локально — и не платить вообще. Обойдётся ещё раз в пять дешевле.
Но парадокс: цена за токен падает в сотни раз, а мой счёт за AI растёт. $200/мес подписки раньше хватало с избытком. Сейчас заканчивается быстрее чем за неделю, потому что через AI идёт всё — код, тексты, анализ, контент.
Инференс дешевеет быстро. Но аппетит к нему растёт быстрее.
tokencost.app/blog/gemma-4-pricing-benchmarks
#инференс#gemma
⚡ Google представила Gemma 3 270M — свою новую компактную модель
Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки».
🔹Особенности
- 256k токенов
- Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов.
- Доступны предобученные и instruction-tuned чекпойнты.
- Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества.
💼Когда использовать
- Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки.
- Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве.
- Быстрые эксперименты с fine-tuning.
- Полная приватность данных благодаря on-device работе.
- Создание «флота» узкоспециализированных моделей.
В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели.
Gemma 3 270M — отличная небольшая модель, быстрая и дешёвая в работе.
🟠Подробности: https://developers.googleblog.com/en/introducing-gemma-3-270m/
🟠HF: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
@ai_machinelearning_big_data
#news#ai#ml#Gemma#google
#Italia
Europarlamento, continua l'esodo a 5 stelle: #Rondinelli e #Gemma passano con Di Maio. Dei 14 eletti nel 2019, solamente in 5 sono attualmente nel #M5S.
@UltimoraPolitics