TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #ytdlp

当前筛选 #ytdlp清除筛选
VPS自留地

@zx_vps · Post #1983 · 29.09.2025 г., 16:25

#ytdlp#视频下载#Github 📱yt-dlp:公认全网最强视频下载工具 yt-dlp 是一款命令行视频下载神器,起源于经典项目 youtube-dl 的分支,因维护更积极、功能更丰富而迅速成为社区主流。它不仅继承了十多年的技术积累,还在不断更新迭代,几乎可以应对所有视频网站的下载需求。 亮点包括: • GitHub 热度:超过 10万Star🌟,社区活跃度极高,更新频繁,Fork 数量庞大,证明其稳定与广泛应用。 • 平台支持广泛:支持上千个网站,包括 YouTube、Bilibili、抖音、TikTok、X(Twitter)、Instagram、Facebook、Vimeo、Dailymotion、PornHub 等主流平台,同时还能解析播放列表、直播流与小众站点。 • 功能全面:支持音视频分离与合并、自动选择最佳画质音质、断点续传、批量处理、字幕与封面嵌入、代理与 Cookie 登录等高级功能。 • 历史传承:源自 2006 年的 youtube-dl 项目,在社区驱动下不断优化,现已被多个 Linux 发行版和用户群体作为官方推荐替代方案。 凭借强大的兼容性与持续迭代,yt-dlp 已成为视频下载领域无可替代的存在。 🔘@TossLab🔘@TossLabChannel

折腾实验室频道

@TossLabChannel · Post #795 · 28.09.2025 г., 03:28

#ytdlp#视频下载#Github 📱yt-dlp:公认全网最强视频下载工具 yt-dlp 是一款命令行视频下载神器,起源于经典项目 youtube-dl 的分支,因维护更积极、功能更丰富而迅速成为社区主流。它不仅继承了十多年的技术积累,还在不断更新迭代,几乎可以应对所有视频网站的下载需求。 亮点包括: • GitHub 热度:超过 10万Star🌟,社区活跃度极高,更新频繁,Fork 数量庞大,证明其稳定与广泛应用。 • 平台支持广泛:支持上千个网站,包括 YouTube、Bilibili、抖音、TikTok、X(Twitter)、Instagram、Facebook、Vimeo、Dailymotion、PornHub 等主流平台,同时还能解析播放列表、直播流与小众站点。 • 功能全面:支持音视频分离与合并、自动选择最佳画质音质、断点续传、批量处理、字幕与封面嵌入、代理与 Cookie 登录等高级功能。 • 历史传承:源自 2006 年的 youtube-dl 项目,在社区驱动下不断优化,现已被多个 Linux 发行版和用户群体作为官方推荐替代方案。 凭借强大的兼容性与持续迭代,yt-dlp 已成为视频下载领域无可替代的存在。 🔘@TossLab🔘@TossLabChannel

👥 Media Downloader | 多功能全能视频下载器 Media Downloader 是一款开源的 多功能视频下载管理工具,将 yt-dlp、lux、aria2c 等强大的命令行下载引擎整合到一个直观的图形界面中,让视频下载变得更简单。用户只需 复制粘贴视频链接,选择下载工具,即可一键下载视频至本地,无需命令行操作。 该工具支持 无限制并发下载,可同时批量处理多个视频任务,并内置 中文、英文等多语言界面。无论是 Windows、macOS 还是 Linux 系统,安装后即可开箱即用,是追求高效与易用兼备的理想选择 😎小编有话说:命令行太麻烦?这才是视频党该有的姿势 👩‍💻GitHub · 🚀Releases下载 标签:#MediaDownloader#视频下载#ytdlp#aria2c#lux#视频 🗓@xiuerSearch 搜索历史资源 ✈️频道 | 💬群聊 | 📱中文包

✈️ M3U8 VIDEO SNIFFER | 带内置浏览器的流媒体嗅探下载工具 🏷 检索标签:#M3U8VIDEOSNIFFER#M3U8#流媒体下载#视频嗅探#PyQt6#ytdlp ⭐️ 详情介绍:这是个面向经常抓流媒体资源的人做的桌面工具,网页直接在程序里开,视频开始播放后,m3u8 / mpd / mp4 地址会被捕获出来,支持登录态复用与 Cookie 持久化,有些站你不先进账号,后面那条真实地址根本看不到 后面要下资源也不用再把链接复制到别的工具里折腾,N_m3u8DL-RE、yt-dlp、ffmpeg、aria2c、streamlink都给你备好了,直播流、HLS、DASH、普通直链各有各的去处;再加上任务队列、历史记录、失败日志这些东西也都齐 📖GitHub · 🪟Releases 下载 😌频道 |🙂群聊 |😋中文包 |☺️搜索