TGTGInsighttelegram intelligenceLIVE / telegram public index

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Hashtags

#libs #tricks #django

Резултати

Пронајдени 69 слични објави

Пребарај: #search

当前筛选 #search清除筛选

阡陌之中向阳生长 🏳️‍⚧️🇺🇳

@field_sunflower_Aoino · Post #8597 · 27.03.2026 г., 11:04

Најди слично Погледај

Telegram 现在支持模糊搜索中文内容部分用户发现，在 Telegram 中进行搜索时，现在可以模糊匹配消息文本的一部分。例如，搜索“反馈”时，所有包含“反馈”两个字的消息现在都显示在搜索结果中。该功能在全局搜索和对话搜索中均可使用。除了完全包含搜索内容的消息外，与搜索内容近似的消息也会在结果中显示，例如搜索“大家好”也会显示包含“你好大家”的消息；您也可以用引号包裹搜索内容来进行更精确的搜索。以前，在使用中文进行搜索时，您只能输入完整的句子进行搜索。目前，仅部分对话或消息支持模糊搜索。@tginfo 编辑尚不清楚该功能在什么条件下可用。 #search

Hashtags

#search

BotsGram®

@botsgram_cu · Post #3769 · 03.04.2021 г., 14:19

Најди слично Погледај

@siftrBot Qué puede hacer este bot? Este bot te ayuda a encontrar Bots, Canales y Grupos para explorar. Comienza tocando 'Categorías'. Idioma: Inglés (visto en @BotsGram_cu) #search

Hashtags

#search

404 KIDS SEE GHOSTS (生产力之王版

@Isaiahsystem · Post #1128 · 16.01.2024 г., 06:53

Најди слично Погледај

给「搜索引擎终极索引」所有内容一个交代，三级搜索系统，整体拉起来了。#search

Hashtags

#search

月

@TsukaTsuki · Post #328 · 07.07.2022 г., 15:29

Најди слично Погледај

Hello Coginition 的两位开发者在 Hacker News 发布了 Hello 搜索引擎。此搜索引擎可以针对用户的搜索要求直接找出相应的代码片段。 https://beta.sayhello.so/ https://news.ycombinator.com/item?id=32003215 #Search

Hashtags

#search

cult of details #нетВойне

@cultofdetails · Post #12 · 21.09.2018 г., 16:11

Најди слично Погледај

Интересное решение для поиска. #search автор: https://dribbble.com/shots/4605344-Search-icon-interaction

Hashtags

#search

Tomoko RD

@tomoko_channel · Post #808 · 21.11.2024 г., 01:06

Најди слично Погледај

🔖 Understanding the BM25 full text search algorithm | Hacker News #pinboard#search https://news.ycombinator.com/item?id=42190650

Hashtags

#pinboard #search

The Telegram Times

@TheTGTimes · Post #449 · 31.07.2025 г., 08:22

Најди слично Погледај

📰 Global Keyword Post Search In the latest version of Telegram Beta for Android, searching posts using keywords is now subject to a daily cap. To find posts, go to Search, select Posts and enter your keyword. Users receive 10 free keyword searches each day. After that, you must spend 10 stars to unlock two more searches or wait for the next reset. This limit applies to all users including Premium. Non Premium users cannot access keyword searches at all. This feature is currently available in the test backend. #Search | #beta v11.14.0 👉The TG Times

Hashtags

#search #beta

The Telegram Times

@TheTGTimes · Post #435 · 28.12.2024 г., 14:38

Најди слично Погледај

📰New Search Bar option In the latest version of Telegram Beta for Android, you will be able to manage your search bar better than before and find the information that you are looking for easily #Search | #beta v11.6 👉The TG Times

Hashtags

#search #beta

404 KIDS SEE GHOSTS (生产力之王版

@Isaiahsystem · Post #1048 · 13.11.2023 г., 05:24

Најди слично Погледај

谷歌直接搜索 GPTs 爆了，发现谷歌可以直接用高级语法过滤搜索各种 GPTs，之前推荐的 GPTs 网站聚合直接裂了。（今天发现 V2EX 论坛还一大批 Store 出现） site:https://chat.openai.com/g + 关键词 Reference GPTs Explore丨推荐与发现网站/思考谷歌高级搜索使用指南谷歌侧边栏自定义搜索/小舒同学 #search#ai

Hashtags

#search #ai

404 KIDS SEE GHOSTS (生产力之王版

@Isaiahsystem · Post #1027 · 03.10.2023 г., 06:28

Најди слично Погледај

Synthesis Engines丨Perplexity 作为我的整合搜索引擎图为我询问 Perplexity 生产力/ TfT/ PKM 相关的资源和内容（还推送了本频道），经过简单内容测试和评估，Perplexity 目前爬取以及回答的效果都算符合预期，体验舒适，现已作为我的 AI 整合搜索引擎。搜索系 AI/ 生成式整合搜索引擎（Synthesis Engines）评估重点就两部分，「前置爬取」和「生成整合」。而 Perplexity 在前置数据爬取部分（Sources）效果不错，陈列以及内容爬取比较新和完善，用于搜索相关领域的资源很舒服。「生成整合」方面，Perplexity 反应迅速（感觉和目前 Bard 速度类似），生成的内容也比较丰富（毕竟搭载 GPT4 和 Claude2 模型），作为搜索系 AI，Perplexity 目前确实大放异彩。搜索系 AI 我一般用作简单问答、总结链接和搜索资源。之前一直用 Bing，反应慢/总结内容有时出现幻觉/打开方式不稳定；目前 ChatGPT 联网使用后体验效果也不佳，堕怠和笨拙，搜索资源的效果也极差。至于 Bard 和谷歌的 SGE 都还粗糙。从去年 12 月份 ChatGPT 释出，Perplexity 就以重新发明搜索的 AI 表达出现，今年 5 月一波大更新并融资 2600 万美元，现在搭载 GPT4 和 Claude2 已更加丝滑，可以用起来。（某宝有 PRO 体验）目前 AI 整合搜索感觉都还没特别惊艳和强大的功能表现（比如包含谷歌搜索 query 后处理），有能力处理搜索引擎的巨头都在专注模型本身，而谷歌兼顾模型和数据的优势，囿于自己传统搜索的收益根基和内部臃肿，也很难做出强大的 Synthesis Engines. Reference 搜索引擎终极索引 Perplexity.AI 搜索引擎大更新 ChatGPT 重新发明搜索引擎 #AI#search

Hashtags

#ai #search

404 KIDS SEE GHOSTS (生产力之王版

@Isaiahsystem · Post #996 · 28.08.2023 г., 11:16

Најди слично Погледај

谷歌现在直接开放了生成式 AI 整合搜索 Search Generative Experience (SGE)，无需等待。（美国节点）体验很舒服，还可以像 NewBing 一样转到对话框 Ask a follow up。 Reference 谷歌其它活儿 #search#ai

Hashtags

#search #ai

djangoproject

@djangoproject · Post #487 · 31.10.2017 г., 19:53

Најди слично Погледај

https://www.slideshare.net/jmoc25/discovering-python-search-engines/1 Discovering #python#search engines

Hashtags

#python #search

12 3•••5 6

← ПретходнаСтраница 1 од 6Следна →