TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #researchtools

当前筛选 #researchtools清除筛选
Repositorio data science

@repo_science · Post #3171 · 11.05.2023 г., 14:22

#Researchtools#science#AITools#GPT#DataScience#science#chatGPT#research#ML#AI 🚀 ¡Prepárate para potenciar tus investigaciones con las mejores herramientas de #IA ! 💪🔥 La búsqueda y resúmen bibliográfico basados en GPT-4 representa un avance emocionante en el acceso a la información de investigación. Con su capacidad para proporcionar resúmenes concisos y relevantes, respaldados por fuentes revisadas por pares, estas herramientas de IA pueden ahorrarte tiempo y brindarte una visión general rápida de los resultados más importantes. 👉Consejos: recuerda refinar tus preguntas, explorar diferentes enfoques y utilizar los resúmenes solo como punto de partida en tus investigaciones. ✅Consensus Motor de búsqueda que utiliza IA para extraer y resumir hallazgos directamente de trabajos de investigación científica Incluye una lista con links a los papers revisados por pares ✅Scite Analiza artículos científicos y extrae info relevante Identifica los papers +relevantes en tu dominio Conoce los últimos desarrollos y tendencias Accede a "citas inteligentes" para explorar el contexto en el que se cita un artículo. De pago ✅ResearchRabbit Busca papers, crea alertas Mantente actualizado, visualiza papers, descubre redes de artículos y autores, accede a recomendaciones según tus gustos, resúmenes personalizados, crea y comparte tus colecciones El Spotify de la investigación! ✅ChatPDF Sube el PDF del paper y comienza a hacerle preguntas Resume el documento y da ejemplos de preguntas que podría responder basándose en el artículo completo Facilita la lectura y el análisis de artículos de revistas científica ✅ Extensión Chrome @scispace_ https://buff.ly/3gz7LhQ https://buff.ly/40sBMRe #AI académica para consultar cualquier web o paper. Gratis, sin cargar el PDF, elige qué preguntar, consulta su relevancia, cambia el idioma, crea tu colección ✅Humata ¡Pregúntale cualquier cosa sobre tus PDF! Escribe artículos 10 veces más rápido Resume documentos largos Pregunta y respuesta instantánea Similares: Paperbrain, Explain Paper ✅ Habla con los libros https://buff.ly/2qtr7Xm Conectada a la biblioteca de Google Books. Saca a la luz hechos, citas y pasajes de la literatura, por categorías de libros. ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----

Crypto M - Crypto News

@CryptoM · Post #64744 · 09.04.2026 г., 17:34

🚀 AI TRENDS | Google Cloud AI's PaperOrchestra Enhances Manuscript Quality Google Cloud AI researchers have introduced PaperOrchestra, a system designed to improve the quality of literature reviews and manuscript formatting. According to NS3.AI, human evaluations revealed that PaperOrchestra achieved a 50%-68% win-rate margin in literature review quality compared to autonomous baselines. The system employs five specialized agents to manage tasks such as organizing raw materials, generating figures, reviewing literature, and formatting manuscripts. To evaluate the effectiveness of PaperOrchestra, researchers developed PaperWritingBench, a framework built from 200 top-tier AI conference papers. This framework demonstrated a 14%-38% improvement in overall manuscript quality, showcasing the potential of PaperOrchestra in enhancing academic writing processes. #AI#GoogleCloudAI#PaperOrchestra#ManuscriptQuality#LiteratureReview#AcademicWriting#AIAgents#ResearchTools#PaperWritingBench

Crypto M - Crypto News

@CryptoM · Post #65295 · 12.04.2026 г., 15:15

🚀 Crypto Analyst Manya Releases Research Tool Rankings Crypto analyst manya has released a ranking of personal research tools. According to ChainCatcher, the rankings categorize tools into different levels based on their effectiveness. The S-tier includes Dune and frontrun.pro, while the A-tier features Coinglass, RootData, Drop, MetaSleuth, and DefiLlama. B-tier tools comprise Arkham, Bubblemaps, Dexscreener, Surf, Nansen, and CoinMarketCap. C-tier tools include Cryptorank and others. #CryptoAnalyst#ResearchTools#CryptoRanking#Dune#frontrunpro#Coinglass#RootData#Drop#MetaSleuth#DefiLlama#Arkham#Bubblemaps#Dexscreener#Surf#Nansen#CoinMarketCap#Cryptorank