@repo_science · Post #3243 · 29.05.2023 г., 20:51
#MachineLearning 📚 Machine Learning for Advanced Functional Materials (2023) 🔗 Link ----- Main channel:@repo_science Coupons:@freecoupons_reposcience -----
Hashtags
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #machinelearning
@repo_science · Post #3243 · 29.05.2023 г., 20:51
#MachineLearning 📚 Machine Learning for Advanced Functional Materials (2023) 🔗 Link ----- Main channel:@repo_science Coupons:@freecoupons_reposcience -----
Hashtags
@amneumarkt · Post #139 · 08.01.2021 г., 07:36
#machinelearning A nice colloquium paper: The unreasonable effectiveness of deep learning in artificial intelligence | PNAS https://www.pnas.org/content/117/48/30033
Hashtags
@amneumarkt · Post #121 · 20.12.2020 г., 12:47
#machinelearning
Hashtags
@amneumarkt · Post #117 · 12.12.2020 г., 08:26
#machinelearning https://arxiv.org/abs/2007.04504 Learning Differential Equations that are Easy to Solve Jacob Kelly, Jesse Bettencourt, Matthew James Johnson, David Duvenaud Differential equations parameterized by neural networks become expensive to solve numerically as training progresses. We propose a remedy that encourages learned dynamics to be easier to solve. Specifically, we introduce a differentiable surrogate for the time cost of standard numerical solvers, using higher-order derivatives of solution trajectories. These derivatives are efficient to compute with Taylor-mode automatic differentiation. Optimizing this additional objective trades model performance against the time cost of solving the learned dynamics. We demonstrate our approach by training substantially faster, while nearly as accurate, models in supervised classification, density estimation, and time-series modelling tasks.
Hashtags
@globalcio · Post #12 · 13.07.2022 г., 10:12
When Andrey Fillimonov started the research in the field of complex analytics of the mental and physiological state of drivers, potential customers were сonfused. His team was often looked at as people doing who knows what. Now, this technology based on machine learning is becoming the industry standard. Global CIO spoke to Andrey Fillimonov about the development of AI products and his expectations for this technology in the future. #AI#MachineLearning
Hashtags
@nn_for_science · Post #1464 · 10.05.2023 г., 17:42
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр. Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия). На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы. #machinelearning#Geo
Hashtags
@earth_climate_tech · Post #286 · 10.05.2023 г., 16:00
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр. Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия). На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы. #machinelearning#Geo
Hashtags
@amneumarkt · Post #135 · 07.01.2021 г., 09:30
https://github.com/volotat/DiffMorph #machinelearning#opensource Differentiable Morphing > Image morphing without reference points by applying warp maps and optimizing over them.
Hashtags
@repo_science · Post #3315 · 17.06.2023 г., 23:01
#machineLearning#intermediate Building a Machine Learning Model This course will demonstrate how to build and train your own custom machine learning model from scratch. We cover all steps, including how to set up the environment, how to import and prepare your ... ✍️Daniel Mease ⏰57m 👥139 ⭐️4.7 🔗LinK ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----
Hashtags
@datasciencejobs · Post #2410 · 08.11.2024 г., 11:01
#вакансия#remote#fulltime#ML#machinelearning Позиция: Senior ML Engineer Локация: remote Формат: full-time Проект: NDA Вилка: 6,000-12,000$ net Привет! Очень внимательно и тщательно ищем в наш проект SeniorMachine Learning Engineer. Мы динамично развивающийся стартап, решаем различные ML/DL задачи от внешних заказчиков: генерация текста, аудио и видео, распознавание объектов на видео, так же применяем AI-моделей в клинических прогнозах, проводим идентификацию контента, созданного LLM и т.д.. Мы сфокусированы на применении SOTA-решений для этих проектов, а также поддержке и мониторинге работающих решений. На данный момент наименование проекта находится под NDA, детали будут доступны на дальнейших этапах общения. Чем предстоит заниматься: • Разработка и внедрение моделей машинного обучения для решения задач NLP, LLM и генеративных моделей. • Tuning существующих решений: дообучение NN, улучшение используемых алгоритмов, оптимизация производительности; • Проводить анализ данных и оценку эффективности моделей машинного обучения. • Участвовать в обсуждении новых технологий и разработке новых решений совместно с project-менеджером. Стек проекта: Python, Tensorflow, PyTorch, Hugging Face, Github workflow, Docker, asyncio, multiprocessing, Tensorflow, FastAPI, pandas, CI/CD, Opensearch, Elasticsearch, MongoDB, PostgresQL. Так же, опишу портрет, кого мы ищем: • Высшее образование в области компьютерных технологий / прикладной математики и (или) прикладной информатики. • Опыт работы в сфере ML-инжиниринга от 3 лет, общий коммерческий опыт в области DS от 5 лет. • Опыт работы с моделями машинного обучения в области NLP, LLM, генеративных моделей, временных рядов, рекомендательных систем. • Опыт работы с классическими алгоритмами машинного обучения. • Опыт нахождения в проектах с нуля до продакшна. Что особенно нас интересует: • Опыт участия в хакатонах и соревнованиях (Kaggle, например). • Выпускники Yandex Data School. Самая приятная часть данного предложения: • Фиксированный оклад, выплачиваемый дважды в месяц (двумя равными частями). • Заработная плата по верхней границе рынка (от 6,000 до 12,000$) на старте. • При достижении результатов премии и бонусы. • Возможность работать над интересными проектами с применением современных технологий. • Все необходимое для профессионального развития и роста. • Оформление в партнерскую компанию. • Полностью удаленная работа, гибкий full-time. Контакты: Алина @tetrisgirl Готова ответить на ваши вопросы ☺️
@datasciencejobs · Post #2359 · 10.10.2024 г., 07:00
#вакансия#remote#fulltime#ML#machinelearning Позиция: ML Engineer Локация: remote Формат: full-time Проект: NDA Вилка: 6,000-15,000$ net Друзья, дата-гении, добрый вечер! Мое предложение будет весьма нестандартным, я нахожусь в поиске Machine Learning Engineer. На данный момент наименование проекта находится под NDA, детали будут доступны на дальнейших этапах общения. Проект подразумевает собой платформу, построенную по принципу Kaggle, где размещаются научно-практические проекты с использованием ИИ. Ваша задача - создавать и оптимизировать решения для этих проектов, конкурируя за лидерство в рейтинге. Чем предстоит заниматься: • Разрабатывать и внедрение моделей машинного обучения для решения задач NLP, LLM и генеративных моделей. • Осуществлять оптимизацию и deploy рекомендательных систем, систем анализа временных рядов. • Проводить анализ данных и оценку эффективности моделей машинного обучения. • Участвовать в обсуждении новых технологий и разработке новых решений совместно с project-менеджером. Стек проекта: Python, Tensorflow, PyTorch, Hugging Face, Github workflow, Docker, asyncio, multiprocessing, Tensorflow, FastAPI, pandas, CI/CD, Opensearch, Elasticsearch, MongoDB, PostgresQL. Так же, опишу портрет, кого мы ищем: • Высшее образование в области компьютерных технологий / прикладной математики и (или) прикладной информатики. • Опыт работы в сфере ML-инжиниринга от 3 лет, общий коммерческий опыт от 5 лет. • Опыт работы с моделями машинного обучения в области NLP, LLM, генеративных моделей, временных рядов, рекомендательных систем. • Опыт работы с классическими алгоритмами машинного обучения. • Опыт нахождения в проектах с нуля до продакшна. Что особенно нас интересует: • Опыт участия в хакатонах и соревнованиях (Kaggle, например). • Диплом об окончании Yandex Data School. Самая приятная часть данного предложения: • Фиксированный оклад, выплачиваемый дважды в месяц (двумя равными частями). • Заработная плата по верхней границе рынка (от 6,000 до15,000$) на старте. • Возможность работать над интересными проектами с применением современных технологий. • Все необходимое для профессионального развития и роста. • Оформление в партнерскую компанию (ИП). • Полностью удаленная работа, гибкий full-time. Контакты: Алина @tetrisgirl Готова ответить на ваши вопросы ☺️
@awesomeopensource · Post #147 · 25.07.2018 г., 14:38
dvc 为机器学习实验设计的版本控制,可以兼容任何git存储库。用于管理实验数据和代码,可以重现实验过程和结果。(视频很有意思) Tags:#machinelearning#versioncontrol#tools Languages:#python