Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Hashtags

#libs #tricks #django

Резултати

Пронајдени 6 слични објави

Пребарај: #playwright

当前筛选 #playwright清除筛选

GitHub Trends

@githubtrending · Post #15450 · 29.01.2026 г., 18:00

Најди слично Погледај

#other#playwright Playwright CLI is a simple command-line tool for browser automation that works best with coding agents like Claude or GitHub Copilot. Install it globally with `npm install -g @playwright/cli@latest`, then use commands like `open`, `type`, `click`, `screenshot` to control browsers efficiently without loading heavy page data. It saves tokens for faster AI tasks on large codebases. You benefit by automating web tests, taking screenshots, and managing sessions quickly, making your coding and testing workflows smoother and more reliable. https://github.com/microsoft/playwright-cli

Hashtags

#other #playwright

AppPie

@AppPie · Post #2291 · 31.12.2024 г., 04:02

Најди слично Погледај

#Developers Shortest: AI 驱动的自然语言测试框架 🔗GitHub Shortest 是一个基于 Playwright 的端到端测试框架，允许你用自然语言编写测试用例，由 AI 处理具体实现。主要特点 • 自然语言测试：用日常语言描述测试场景 • AI 驱动执行：使用 Claude API 处理测试实现 • Playwright 基础：稳定可靠的测试执行 • GitHub 集成：支持双因素认证 • 邮件验证：集成 Mailosaur 开源许可证 MIT license。 #GitHub#OpenSource#Testing#AutomatedTesting#AI#Playwright 📮 频道 @AppPie

Hashtags

#developers #github #opensource #testing #automatedtesting #ai #playwright

GitHub Trends

@githubtrending · Post #15527 · 28.02.2026 г., 11:30

Најди слично Погледај

#typescript#fingerprinting#playwright#puppeteer#scraping#typescript Fingerprint-suite is a toolkit that generates and injects realistic browser fingerprints into automated browsers like Playwright and Puppeteer. It includes four modular packages: header-generator for HTTP headers, fingerprint-generator for browser fingerprints, fingerprint-injector for injection, and a Bayesian network for realistic fingerprint creation. Since websites increasingly use fingerprinting to track and identify users, this tool helps your web scrapers avoid detection by mimicking real browser behavior. You can customize fingerprints by device type and operating system, making your automated browsing appear completely legitimate to anti-bot systems. https://github.com/apify/fingerprint-suite

Hashtags

#typescript #fingerprinting #playwright #puppeteer #scraping

秀儿の科技软件|资源分享社🎀

@JianjiaoPD · Post #10692 · 25.03.2026 г., 13:43

Најди слично Погледај

✈️ OpenCLI | 让 AI 直接调用网站和桌面应用，这个 CLI 野心有点大 🏷 检索标签：#OpenCLI#AIAgent#CLI#Playwright#Electron#AI#openclaw ⭐️ 详情介绍：OpenCLI 是个 AI Native 的命令行项目，把原本只能手点的网站、本地工具、Electron 应用，统统改造成 AI 能直接调用的 CLI。它复用你自己的 Chrome 登录状态去操作网站，避免风控像 B站、知乎、小红书、X、Reddit、YouTube 这些站点，还有 gh、docker 这类本地工具都支持；再加上 explore 自动摸功能、synthesize 生成适配器、动态注册命令，很多原本得自己慢慢弄得东西接，它先帮你干起来 📖GitHub · OpenCLI 😌频道 |🙂群聊 |😋中文包 |☺️搜索

Hashtags

#opencli #aiagent #cli #playwright #electron #ai #openclaw

GitHub Trends

@githubtrending · Post #15152 · 17.09.2025 г., 13:30

Најди слично Погледај

#typescript#agent#ai#ai_agents#ai_tools#automation#browser#browser_automation#browser_use#chrome_extension#comet#dia#extension#manus#mariner#multi_agent#n8n#nano#opensource#playwright#web_automation Nanobrowser is a free, open-source Chrome extension that uses multiple AI agents to automate complex web tasks directly in your browser, keeping your data private since everything runs locally. It supports many AI language models, lets you customize which models handle different tasks, and offers an easy chat interface to control and track automation. You can automate repetitive tasks, ask follow-up questions, and review past interactions without coding. It works best on Chrome and Edge and is a cost-effective alternative to expensive AI automation tools, giving you powerful, flexible web automation with full control and privacy. https://github.com/nanobrowser/nanobrowser

GitHub Trends

@githubtrending · Post #15520 · 24.02.2026 г., 14:30

Најди слично Погледај

#python#ai#ai_scraping#automation#crawler#crawling#crawling_python#data#data_extraction#mcp#mcp_server#playwright#python#scraping#selectors#stealth#web_scraper#web_scraping#web_scraping_python#webscraping#xpath Scrapling is a fast Python web scraping tool that fetches pages, bypasses anti-bot blocks like Cloudflare, and adapts to site changes by auto-finding elements. Use simple CSS/XPath selectors, spiders for big crawls with pause/resume, proxy rotation, and CLI—no code needed sometimes. Install via pip; it's memory-light and beats others in speed. You save time fixing broken scrapers, scrape reliably at scale, cut costs with AI tools, and focus on using data for leads, prices, or research. https://github.com/D4Vinci/Scrapling