TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #ymtc

当前筛选 #ymtc清除筛选
Ryu일무이

@ryu1moo2 · Post #3447 · 03.03.2026 г., 11:36

[미국 정부가 YMTC·CXMT·SMIC 등 중국 메모리 업체의 반도체를 정부용 상용 제품에서 배제하는 새로운 규정을 추진하고 있다](https://wccftech.com/the-u-s-moves-once-again-to-ban-chinese-memory/) ◦ 미국, 중국 메모리 업체 대상 추가 규제 추진 • 연방조달규정위원회(FAR Council), 새로운 ‘rulemaking’ 발표 • 대상 기업: YMTC, CXMT, SMIC 및 계열사·자회사 • 정부용 상용 제품에서 해당 기업 반도체 사용 금지 목적 ◦ 규제 범위 확대 → 저가 상용 제품까지 포함 • “Covered semiconductor product or service” 정의 확대 - 해당 기업이 설계·생산·제공한 반도체 - 해당 반도체가 포함된 제품 - 해당 반도체를 활용하는 서비스 • 1만5천달러 이하 제품에도 적용 - 기성(off-the-shelf) 제품 - 상용 IT·통신 서비스 포함 ◦ 법적 근거 및 시행 구조 • 2023 회계연도 국방수권법(NDAA) 5949조 개정안 • 기존 중국 칩 기업 제한 조치의 연장선 • 2027년 12월 23일 이전 구매 제품은 예외 적용 • 4월 20일까지 공개 의견 수렴 단계 → 아직 최종 확정 아님 ◦ DRAM 공급난과 맞물린 산업 영향 • 현재 ‘빅3’ 메모리 업체는 기업용 수요 대응에 집중 → 소비자용 공급 여력 부족 • 이에 따라 CXMT 등 중국 업체의 대안 공급 가능성 부각 • 그러나 미국 규제로 인해 주류 제조사 채택에 구조적 제약 발생 ◦ 소비자 시장 파급 효과 • 정부 사용이 금지될 경우, 노트북·모바일·PC 제조사들의 중국산 메모리 채택 부담 증가 • 일부 주요 PC 제조사들이 CXMT와 DRAM 협력 논의 중이라는 보도 존재 • 다만 실제 상용 통합으로 이어질지는 불확실 ◦ 정책 의도 • 행정부, 정부 최종 제품에서 중국 기술 영향력 축소 의지 명확 • 상업용 제품까지 규제 범위 확장 → 공급망 분리 가속 가능성 원문 발췌: - “Covered semiconductor product or service” is defined to include semiconductors, products that incorporate a semiconductor product, or services that utilize a semiconductor product, that are designed, produced, or provided by SMIC, CXMT, YMTC, or any of their affiliates, subsidiaries, or successors. #CXMT#YMTC#중국#미국

겁나빠른 경제 전문 - 뉴스 드리고

@dreago_news_ch · Post #263361 · 14.05.2026 г., 07:50

🔔 "미·중 정상회담 기대감에..." 중국 AI 반도체 ETF 질주 📈#하이곤#캠브리콘#기가디바이스#SMIC#YMTC 📝#AI반도체#중국반도체#첨단제조#기술자립#대형IPO 미중 정상회담 기대와 중국 정부의 AI 반도체 자립화 전략, 대형 IPO 기대감 등이 투자 심리에 긍정적으로 작용하며 관련주에 관심이 몰리고 있음. ⬜⬜⬜⬜⬜│🟥🟥🟥🟥⬜ 【 겁나빠른 #드리고봇 뉴스 】 https://n.news.naver.com/article/014/0005521675