TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #83 · 11 мај

У строки в Python есть два очень похожих метода. На столько похожих что кажется они делают одно и тоже. Это метод isdigit() и isnumeric() Давайте посмотрим зачем нам два одинаковых метода? И так ли они одинаковы? Очевидно что isdigit() говорит нам, состоит ли строка только из чисел 0-9 >>> '12'.isdigit() True >>> '12x'.isdigit() False >>> '-12'.isdigit() False >>> '12.5'.isdigit() False Можно предположить что isnumeric() делает более глубокий анализ и распознаёт в строке float или отрицательное число. >>> '15'.isnumeric() True >>> '-15'.isnumeric() False >>> '15.2'.isnumeric() False Нет, всё так же как и с другим методом. В чем же тогда разница? Для начала посмотрим следующие примеры: >>> '5'.isdigit(), '5'.isnumeric() # Обычная цифра 5 # True, True >>> '꧕'.isdigit(), '꧕'.isnumeric() # Яванская 5 # True, True >>> '෩'.isdigit(), '෩'.isnumeric() # Синхала 3 # True, True >>> '৩'.isdigit(), '৩'.isnumeric() # Бенгальская 3 # True, True >>> '༣'.isdigit(), '༣'.isnumeric() # Тибетская 3 # True, True >>> '³'.isdigit(), '³'.isnumeric() # 3 верхний индекс (степень) # True, True >>> '𝟝'.isdigit(), '𝟝'.isnumeric() # Математическая двойная 5 # True, True >>> '๔'.isdigit(), '๔'.isnumeric() # Тайская 4 # True, True >>> '➑'.isdigit(), '➑'.isnumeric() # 8 в круге # True, True А теперь примеры в которых, по мнению Python, результаты не равны >>> '¾'.isdigit(), '¾'.isnumeric() # дробь три четверти # False, True >>> '⅕'.isdigit(), '⅕'.isnumeric() # дробь одна пятая # False, True >>> '𒐶'.isdigit(), '𒐶'.isnumeric() # клинопись 3 # False, True >>> '三'.isdigit(), '三'.isnumeric() # 3 из унифицированной идеограммы # False, True >>> '⑩'.isdigit(), '⑩'.isnumeric() # цифра 10 в круге # False, True >>> 'Ⅳ'.isdigit(), 'Ⅳ'.isnumeric() # Римская 4 # False, True >>> '𑇪'.isdigit(), '𑇪'.isnumeric() # Сенегальская архаическая 10 # False, True >>> '𐌢'.isdigit(), '𐌢'.isnumeric() # Этрусская цифра 10 # False, True >>> 'ↂ'.isdigit(), 'ↂ'.isnumeric() # Римская цифра 10000 # False, True >>> '〇'.isdigit(), '〇'.isnumeric() # Символ ККЯ ноль # False, True Получается, что isdigit() говорит нам, является ли символ десятичной цифрой или спецсимволом, имеющим цифирное значение после преобразования. В свою очередь isnumeric() включает все дополнительные символы юникода которые имеют отношения к числовым и цифровым представлениям. Ну и пара примеров в которых в обоих случаях символ не является числом, это эмодзи. >>> '🕙'.isdigit(), '🕙'.isnumeric() # эмодзи 10 часов # False, False >>> '7️⃣'.isdigit(), '7️⃣'.isnumeric() # эмодзи 7 # False, False Также есть еще один дополнительный и весьма полезный метод isdecimal(). Он нам сообщает, можно ли из указанного символа сделать простую десятичную цифру. То есть сработает ли метод int(x) >>> '෩'.isdecimal(), int('෩') # Синхала 3 # True, 3 >>> '➑'.isdecimal(), int('➑') # 8 в круге # False, ValueError Какие выводы? 🔸 При определении цифры в строке isdigit() подходит лучше чем isnumeric(), но оба не гарантируют успешную конвертацию в int 🔸 Для однозначного определения возможности преобразования строки в int лучше подходит метод isdecimal() 🔸 Для однозначного определения символов 0...9 лучше использовать regex Полный список символов юникода которые определяются как numeric #basic

Hashtags

Резултати

Пронајдени 3 слични објави

Пребарај: #aiandmedia

当前筛选 #aiandmedia清除筛选
AI & Law

@ai_and_law · Post #509 · 19.02.2025 г., 08:04

🇺🇸Major Publishers Sue AI Company Cohere Over Copyright Violations Vox Media, Condé Nast, Forbes Media, and Politico have filed a lawsuit against AI company Cohere, alleging copyright and trademark infringement. According to the complaint, Cohere used unlicensed copies of their content to train its models and directly compete with news publishers. The lawsuit points to 4,000 instances where Cohere allegedly reproduced news content verbatim or provided AI-generated summaries that closely mirrored original reporting. This case adds to the growing legal battle between media companies and AI firms over the unauthorized use of copyrighted materials. #AIRegulation#Copyright#AIandMedia

AI & Law

@ai_and_law · Post #87 · 18.08.2023 г., 07:04

US: News Outlets Call for Transparency in AI Data Usage Hello everyone! A collective of news organizations has issued an open letter advocating for stricter regulations to safeguard copyright and ensure transparency in the use of training data for generative AI models. The open letter urges global lawmakers to enforce rules demanding data transparency, rights holders' consent for training data usage, and provisions for media companies to negotiate with AI model operators. It also calls for AI firms to tackle bias and misinformation and identify AI-generated content. Signatories include Agence France-Presse, Getty Images, The Associated Press, and more. They argue that foundation models using media content without proper consideration undermine media diversity and financial viability. The call comes in light of Google's AI news writing tool and concerns over AI training on copyrighted content. The US Senate and legal cases have addressed these issues, emphasizing the need to protect creators' rights. #AIandMedia#AIRegulation#DataTransparency#CopyrightProtection

AI & Law

@ai_and_law · Post #189 · 14.12.2023 г., 08:04

Axel Springer Partners with OpenAI for AI-Empowered Journalism Hello everyone! Global news giant Axel Springer has joined forces with OpenAI, the creators of the ChatGPT chatbot, in a landmark deal. This collaboration pioneers a novel approach to news delivery by integrating summaries of Axel Springer's content directly into ChatGPT's responses. When ChatGPT users inquire, the chatbot will provide concise summaries of pertinent news stories from Axel Springer's renowned publications, including Politico, Business Insider, Bild, and Welt. These summaries will encompass material that would typically require a subscription, enhancing user access to premium content. The summaries will promptly accompany the article's publication, ensuring real-time integration of breaking news into the user experience starting from the first quarter of 2024. The Axel Springer content will enjoy a prominent position in ChatGPT search results, aiming to drive increased traffic and subscription revenue to Axel Springer brands. While specific financial terms remain undisclosed, OpenAI commits to paying for the Axel Springer content utilized in training its large language models, covering both current and archived materials. The multi-year, non-exclusive agreement underscores the mutual exploration of AI's opportunities in advancing journalism's quality, societal relevance, and business models. This partnership marks OpenAI's second collaboration with a major news publisher, following the agreement with the Associated Press. As the media landscape navigates copyright concerns, these partnerships illustrate a cooperative approach between AI innovators and publishers to address content usage, access, and AI training data concerns. #AIandMedia#AxelSpringer#OpenAI#ChatGPT#AIJournalism#NewsCollaboration