Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
#GOOGL
🤯Google сообщила, что её ИИ-сервисы обработали почти квадриллион токенов в июне!
👉Рост объёма обрабатываемых токенов требует расширения инфраструктуры центров обработки данных. В этом месяце Google сообщила, что ожидает увеличения капитальных затрат на ЦОДы на $10 млрд — до $85 млрд в год.
❓ Как думаете - как быстро окупятся эти вложения? 🤔👇
#GOOGL
⚡️Google объявила о приобретении израильского стартапа в сфере кибербезопасности Wiz за $32 млрд. Эта сумма делает сделку крупнейшей в истории компании и всей израильской хай-тек индустрии.
👉 Wiz была основана в 2020 году и за короткий срок стала лидером в области облачной безопасности, предлагая решения для выявления и устранения рисков в облачных инфраструктурах. Среди её клиентов — почти половина крупнейших компаний США.
👉 Интересно, что ранее, летом 2024 года, Wiz отклонила предложение Alphabet о покупке за $23 млрд, предпочтя сосредоточиться на росте и планах по выходу на IPO. Однако, в марте 2025 года стороны всё же пришли к соглашению о приобретении.
👉 Сделка ещё подлежит одобрению регулирующих органов и, как ожидается, будет завершена в 2026 году. В случае срыва сделки Alphabet согласилась выплатить Wiz компенсацию в размере $3,2 млрд, что составляет 10% от общей стоимости сделки и является одной из крупнейших компенсаций в истории.
👉 После завершения сделки Wiz сохранит свою независимость и продолжит предоставлять свои услуги на всех основных облачных платформах, включая Amazon Web Services и Microsoft Azure. Это позволит Google укрепить свои позиции в сфере облачных услуг и конкурировать с другими технологическими гигантами.
👉 Для Израиля эта сделка имеет особое значение, поскольку она не только подтверждает статус страны как ведущего игрока в сфере кибербезопасности, но и принесёт значительные налоговые поступления в бюджет. По оценкам экспертов, основатели Wiz, являющиеся налоговыми резидентами Израиля, заплатят налоги с прибыли от сделки, что принесёт государству несколько миллиардов долларов.
#GOOGL
🔴 Акции снизились на 5% после того, как Министерство юстиции США попросило федерального судью обязать Google продать браузер Chrome и запретить предоставлять привилегированный доступ к своей поисковой системе на устройствах с операционной системой Android.
👉 Это следует за решением суда в августе, признавшим Google виновным в незаконной монополизации интернет-поиска.
❓ Верите в успел Google без браузера? 🤣👇
🇺🇸#NVDA#GOOGL
👉 Google обратилась к небольшим облачным провайдерам, обычно сдающим в аренду чипы NVIDIA, с необычным предложением — сдавать в аренду её собственные ИИ-ускорители TPU, ранее доступные только в облаке самой Google, сообщает Trendforce.
👉 Это может привести к прямой конкуренции с NVIDIA.
👉 Как утверждается в отчёте, Google ориентируется на молодые компании, в основном на поставщиков облачных услуг, активных пользователей ускорителей NVIDIA.
👉 По оценкам Morningstar, совокупную стоимость бизнеса TPU и подразделения DeepMind составляет приблизительно $900 млрд.
🤔 А я говорил - монополия Nvidia не вечная...
#sell#GOOGL
Потихоньку фиксируем прибыльные позиции в нашем портфеле. Очередь пришла и за Google, грядет пора финансовых отчетностей и может триггернуть локальную коррекцию если рынки совсем с ума не сошли. Вообще, ситуация такая, что нужно быть на измене в любой момент. Итог: профит +10,1% или $138.
@kazakh_trader
#GOOG#GOOGL
Акции Google обновили исторический максимум
👉 Сегодня Google представила новый инструмент искусственного интеллекта - Gemini 2.0, которую генеральный директор Alphabeth Сундар Пичаи называет «самой мощной моделью» технологического гиганта.
🟢 Акции Google выросли почти на 5% в ходе дневных торгов, достигнув рекордного максимума.
👉 Gemini 2.0, по словам создателей, обладает более мощными возможностями обработки изображений и звука. Google представила этот инструмент через год после выпуска Gemini 1.0, что является признаком усиления конкуренции в области ИИ.
📢 «Если Gemini 1.0 был направлен на организацию и понимание информации, то Gemini 2.0 призван сделать её гораздо более полезной», — написал Пичаи в своём блоге.
🤔 Я, как вы помните, держу Google от 158 долл. И, конечно, радуюсь таким новостям. Но жаба уже 😂
❓ А вы держите Google? Как думаете, пришло уже время фиксировать прибыль? Или выше 200 пойдём? Кто что думает по этому поводу? 👇
Я закрываю на этих уровнях уже...
#сша#meta#googl
Meta и YouTube проиграли знаковый судебный процесс по делу о зависимости от социальных сетей
⚡️20-летняя женщина одержала победу в знаменательном судебном процессе против компании Meta а также YouTube от Google, в связи с чем компании были обвинены в разработке своих приложений, вызывающих привыкание и представляющих опасность для подростков.
Жюри признало владельца Instagram, компанию Meta, и YouTube виновными в халатности за использование продукта, представляющего опасность для детей и подростков, и за неспособность предупредить об этих опасностях. Это решение нанесло удар по компаниям, которые исторически были защищены статьей 230 Закона о пристойности в сфере коммуникаций.
👉 Жюри обязало компании выплатить 3 миллиона долларов истцу, Кейли GM, которая заявила, что использование социальных сетей, начавшееся еще до подросткового возраста, на протяжении многих лет доминировало в ее жизни и способствовало возникновению проблем с психическим здоровьем, включая тревожность, депрессию и дисморфофобию. Жюри также постановило, что Meta и YouTube должны выплатить еще 3 миллиона долларов в качестве штрафных санкций.
👉 Этот суд стал уже вторым случаем на этой неделе, когда суды признали компании ответственными за ущерб, причиненный их платформами. Более 3000 других аналогичных исков против Meta, YouTube, Snapchat и TikTok находятся на рассмотрении в судах Калифорнии.
🤔 Не знаю, какие у вас мысли, а мне так выпить три миллиона хочеться, что аж переночевать негде зависимость от соц сетей развилась и тревожность 🥹. Тревожность в основном, от того, что не в Калифорнии живу, а значит и в выиграть в суде против Гугла или Меты у меня нет никакой возможности 😭.
#AAPL#GOOGL#META
⚡️Согласно отчета Proton, технологические гиганты, такие как Google, Meta и Apple, стали ключевыми инструментами для американских спецслужб и правоохранительных органов.
👉 С 2014 по 2024 годы количество аккаунтов, данные которых передавались правоохранителям, увеличилось на сотни процентов: у Google – на 530%, у Meta – на 675%, у Apple – на 621%.
👉 Всего за этот период американские власти получили сведения о 3,16 миллиона пользователей. Эти данные не включают запросы по Закону о наблюдении за иностранной разведкой (FISA), который позволяет запрашивать информацию в тайном порядке.
👉 За последние 12 месяцев, по доступным данным, американские ведомства сделали почти 500 тысяч запросов к Google и Meta — больше, чем все остальные страны альянса «14 глаз» вместе взятые.
👉 Это подтверждает, что США используют крупнейшие IT-компании как глобальную систему слежки.
👉 В 2024 году журналистка The Times запросила свои данные у Meta и получила 20 тысяч страниц информации, включая действия на сайтах и в приложениях, не связанных с соцсетью.
🤷♂️ Пользователи теряют контроль над своими данными, как только попадают в экосистему Big Tech. Apple, Google и Meta отслеживают практически все онлайн-действия человека и могут передавать эти сведения третьим сторонам или государственным структурам.
#AAPL#GOOGL#META
⚡️Согласно отчета Proton, технологические гиганты, такие как Google, Meta и Apple, стали ключевыми инструментами для американских спецслужб и правоохранительных органов.
👉 С 2014 по 2024 годы количество аккаунтов, данные которых передавались правоохранителям, увеличилось на сотни процентов: у Google – на 530%, у Meta – на 675%, у Apple – на 621%.
👉 Всего за этот период американские власти получили сведения о 3,16 миллиона пользователей. Эти данные не включают запросы по Закону о наблюдении за иностранной разведкой (FISA), который позволяет запрашивать информацию в тайном порядке.
👉 За последние 12 месяцев, по доступным данным, американские ведомства сделали почти 500 тысяч запросов к Google и Meta — больше, чем все остальные страны альянса «14 глаз» вместе взятые.
👉 Это подтверждает, что США используют крупнейшие IT-компании как глобальную систему слежки.
👉 В 2024 году журналистка The Times запросила свои данные у Meta и получила 20 тысяч страниц информации, включая действия на сайтах и в приложениях, не связанных с соцсетью.
🤷♂️ Пользователи теряют контроль над своими данными, как только попадают в экосистему Big Tech. Apple, Google и Meta отслеживают практически все онлайн-действия человека и могут передавать эти сведения третьим сторонам или государственным структурам.