#python#agent#llm#llm_agent#llm_reasoning#machine_learning_systems#mlsys#reinforcement_learning#rl
AReaL is a free, open-source system for fast asynchronous reinforcement learning to train large AI models in math, coding, search, and agents. It decouples generation and training for up to 2.77x speedup, stable performance, and easy setup on single or 1000+ GPUs with algorithms like GRPO/PPO. Install via git/pip, run examples like GSM8K math instantly. You benefit by building top AI agents affordably and quickly, reproducing results with shared data/models, saving time/money vs. slow synchronous tools.
https://github.com/inclusionAI/AReaL
http://www.kdnuggets.com/2017/09/essential-data-science-machine-learning-deep-learning-cheat-sheets.html
#Cheat_Sheet, #Data_Science, #Deep_Learning, #Machine_Learning, #Neural_Networks, #Probability, #Python, R, #SQL, #Statistics
This collection of data science cheat sheets is not a cheat sheet dump, but a curated list of reference materials spanning a number of disciplines and tools
#python#agent#ai#ai_coding#claude#claude_code#language_server#llms#mcp_server#programming#vibe_coding
Serena is a free, open-source toolkit that turns large language models (LLMs) into powerful coding agents able to work directly on your codebase with IDE-like precision. It uses semantic code analysis to understand code structure and symbols, enabling efficient code search and editing without reading entire files. Serena supports many programming languages and integrates flexibly with various LLMs and development environments via the Model Context Protocol (MCP). This means you can automate complex coding tasks, improve productivity, and reduce costs without subscriptions, making your coding workflow faster and smarter.
https://github.com/oraios/serena
#python#comfyui#diffusion_models#dit#image_to_video#image_to_video_generation#text_to_image#text_to_image_generation
ComfyUI-LTXVideo is a tool that helps create high-quality videos from images using AI. It offers features like key frame control, improved video quality, and faster generation speeds. This means you can make smooth videos with fewer errors and more control over how they look. It also supports commercial use, so you can use the videos for business projects. The tool is designed to work well with consumer-grade GPUs, making it accessible to more users. Overall, it helps you create professional-looking videos quickly and easily.
https://github.com/Lightricks/ComfyUI-LTXVideo
#вакансия#nlp#llm#senior
Senior QA Automation (LLM, NLP)
Требуемый опыт работы: 3–6 лет
Полная занятость, полный рабочий день
Мы — АТОМ. Разрабатываем электромобиль-гаджет и его версии для семьи, такси, каршеринга и службы доставки, а также собственный маркетплейс приложений и другие сервисы.
Ищем Senior QA Automation в команду AI, LLM-Lab, которая работает над рядом проектов:
Голосовой ассистент для заказа товаров и услуг, в котором используются передовые технологии распознавания и синтеза речи, понимания естественного языка на основе нейросетевых моделей.
Разработка умных чат-ботов и других проектов в домене LLM/NLP.
Ваши задачи:
- налаживать процесс автоматизации тестирования;
- проводить тестирование - регрессионное, интеграционное и функциональное;
- тестировать ML-системы;
- анализировать функциональные требования и результаты тестирования на соответствие этим требованиям;
- исследовать проблемы, возникающих в работе сервисов;
- анализировать проблемы и запросы пользователей, ставить задачи разработчикам;
- вести тест-кейсы в системе управления тестами (Allure TestOps).
Стек: Python, PostgreSQL, PyTorch, Ray/Triton Inference Server, k8s, redis
Наши ожидания:
- опыт построения систем автоматизированного тестирования;
- умение читать и писать код на Python;
- опыт работы/тестирования ML-систем (NLP/LLM-моделей);
- опыт работы с CI/CD инструментами;
- опыт работы с Allure TestOps;
- Fiddler, Swagger, Postman;
- опыт оценки задач на тестирование с учетом ресурсов и рисков;
- знание английского языка на уровне, необходимом для чтения технической литературы.
Будет плюсом:
- опыт работы с системами оркестрации контейнеров - OS/K8s на уровне пользователя;
- опыт работы с GraphQL;
- опыт работы с брокерами сообщений Kafka/Rabbit;
- опыт работы auto-QA в команде GigaChat, YaLM , YandexGPT;
- опыт работы auto-QA в голосовых ассистентах Маруся, Алиса, Салют.
Мы предлагаем:
- высокотехнологичный, интересный продукт, возможность создавать новые процессы и влиять на развитие;
- работа в команде высококвалифицированных профессионалов из России, Китая, Европы;
- корпоративная культура, выстраиваемая в духе инноваций, открытые горизонтальные коммуникации;
- конкурентная официальная белая заработная плата;
- годовой бонус;
- кафетерий льгот (“плюшки”) - ДМС со стоматологией, питание, транспорт, страхование жизни и имущества, фитнес, обучение и многое другое;
- бесплатный доступ к платформе с обучающими курсами iSpring, корпоративное обучение китайскому языку, спортивные командные игры и другие приятные мелочи;
корпоративное оборудование;
- гибридный или удаленный формат работы;
- трудоустройство в аккредитованной ИТ-компании.
Пройди вместе с нами крутой кейс по созданию электромобиля с нуля!
✍️По всем вопросам, а также для отправки резюме/cv обращайтесь: @tanya_yuu
#CI#CD#Allure#TestOps#SQL#Fiddler#Swagger#Postman#QA#Python#LLM#NLP#ML#DataScience#AutomationQA#NaturalLanguageProcessing
#вакансия#vacancy#удаленка#remote#AI#мидл#Middle#синьор#Senior#ai#ии#ml#мл#llm#RAG#fullstack#finetuning#NLP#langchain#DataScientist#DataEngineer#MLengineer#api#aideveloper#python
❇️Вакансия: «AI Developer / ИИ Разработчик» Middle/Senior
Формат: удаленно по всему миру
Наш часовой пояс: UTC+3
Занятость: проектная с переходом в полную
Оплата: до 350.000₽ за проект или почасовая
Мы мультибренд занимающийся разработкой и внедрением AI и ML технологий во всех коммерческих отраслях
В связи с расширением мы ищем новых специалистов в нашу команду, а именно: AI Developer, Data Scientist, Data Engineer, ML Engineer
🔸Направления нашей работы:
- Внедрение ИИ/ML для автоматизации процессов
- Внедрение ИИ/ML в web сервисы, браузерные расширения и приложения(mobile)
- Создание продвинутых функциональных AI-Ассистентов
- Обучение/дообучение моделей
- Разработка AI/ML SaaS
🔸Какие задачи вам предстоит решать:
- Работа с LLM(Anthropic, Gemini, OpenAI, Llama, Mistral и др)
- Взаимодействие с API различных сервисов/приложений
- Решение задач по автоматизации бизнес-процессов и написанию скриптов на языке Python
- RAG моделей (с использованием Langchain или др.)
- Fine-tuning open-source моделей
- Text-to-text, text-to-speech, speech-to-text NLP
- Работа с облачными платформами(Google Cloud, Yandex Cloud и др.)
- Использование no-code/low-code инструментов для сокращения издержек (Flowise, Make, Zapier Central, Relevance и др.)
🔸Важный навык:
- Свободное владение Английским языком
🔸Мы предлагаем:
- Интересные проекты с возможностью творческой реализации
- Возможность принять участие в выводе продуктов и сервисов бренда на международный рынок
- Возможность профессионального роста и нетворкинга с экспертами в сфере AI и ML со всего мира
- Карьерный рост до Team Lead или CTO одной из компаний
- Отсутствие привязки к месту и возможности легальной оплаты труда в любую точку мира
- Свобода мысли и принятия решений при реализации проектов
🔸Кого мы хотим видеть:
- амбициозных, инициативных и талантливых разработчиков, желающих достигать новых высот в сфере AI и ML, которые легко вольются в нашу молодую команду
(P.s. вам необязательно быть молодым, но обязательно быть с нами близким по духу)
💬Отправляйте резюме/CV/портфолио:@subscale_ai
#вакансия
Data analyst / Data scientist, Москва
VK Реклама — одно из ключевых подразделений в VK. Ежедневно наши сервисы охватывают более 140 млн пользователей в России и странах СНГ. Более 100 тыс. рекламодателей каждый день запускают рекламные кампании у нас и находят своих клиентов. Мы — команда ML внутри VK Рекламы, отвечаем за её качество, чтобы пользователи могли увидеть наиболее подходящую им рекламу, а рекламодатели потратить свои бюджеты наиболее эффективно.
Основная задача нашего направления — проверять гипотезы, искать инсайты и точки роста эффективности и впоследствии внедрять их в прод. У нас идёт полный ML-цикл от проработки гипотезы до проведения экспериментов и внедрения фич в продакшен. Результаты нашей работы напрямую влияют на эффективность такого большого продукта, как VK Реклама.
Команда ad hoc аналитики занимается проверкой гипотез и поиском точек роста. Тестирует гипотезы в реальных экспериментах и оценивает изменения. Мы ищем в команду сильных аналитиков, совместными усилиями будем проводить различные аналитические исследования для повышения эффективности нашего продукта.
Задачи:
• Анализ больших данных для поиска потенциальных точек роста и выдвижения гипотез;
• ad hoc аналитика, поиски зависимостей в данных;
• проверка гипотез, поиск узких мест, донесение результатов до прода;
• оптимизация моделей рекламного аукциона и моделей ранжирования пользователей;
• проведение и статоценка экспериментов;
• разработка и автоматизация отчётности;
• сбор, обработка и дальнейшее использование больших данных.
Требования:
• Хорошее знание SQL (сложные запросы, порядок выполнения операций) — нужно написать не просто запрос, а оптимальный запрос, который сможет отработать на действительно больших данных;
• знание Python для анализа данных; библиотеки Pandas, Numpy — нужно будет сделать анализ данных, проработать гипотезы и правильно их визуализировать. Недостаточно просто найти какой-то паттерн — нужно его правильно представить наружу;
• работа с системами больших данных будет большим плюсом (Hadoop, PySpark);
• хорошее понимание матстатистики;
• анализ данных с учётом сезонности, поиски аномалий и выбросов в данных.
Будет плюсом:
• Опыт работы с ClickHouse, Hadoop, Git, Jenkins;
• работа с инструментами BI-отчётности, понимание ETL-инструментов (делаем автоматические отчёты, готовим для них данные, настраиваем выгрузки и другое).
✍️ Отправить CV и по всем вопросам: https://t.me/olkony
#ds#adhoc#analytics#ml#mailru#vk#adtech#sql#python#pandas#numpy#pysprak#hadoop#mathstat#clickhouse#гибрид#remote#middle#senior
#python#gym#gym_environment#reinforcement_learning#reinforcement_learning_agent#reinforcement_learning_environments#rl_environment#rl_training
NeMo Gym helps you build and run reinforcement‑learning training environments for large language models, letting you develop, test, and collect verified rollouts separately from the training loop and integrate with your preferred RL framework and model endpoints (OpenAI, vLLM, etc.). It includes ready resource servers, datasets, and patterns for multi‑step, multi‑turn, and tool‑using scenarios, runs on a typical dev machine (no GPU required), and is early-stage with evolving APIs and docs. Benefit: you can generate high‑quality, verifiable training data faster and plug it into existing training pipelines to improve model behavior.
https://github.com/NVIDIA-NeMo/Gym
#python#chatbi#deepseek#llm#nl2sql#rag#sqlbot#text_to_sql#text2sql
SQLBot is an easy-to-use intelligent system that turns natural language questions into SQL queries using advanced AI models and retrieval-augmented generation (RAG). You just need to set up your AI model and data source to start asking questions about your data. It integrates smoothly with other business systems and AI platforms, making it simple to add smart data querying to your apps. It also ensures data security with workspace-based resource isolation and fine-grained access control. You can quickly deploy it on a Linux server using Docker, enabling fast, secure, and intelligent data interaction without needing deep SQL knowledge. This saves you time and improves data accessibility.
https://github.com/dataease/SQLBot
#python#ai_tool#darkweb#darkweb_osint#investigation_tool#llm_powered#osint#osint_tool
Robin is an AI tool that searches and scrapes the dark web, refines queries with large language models, filters results, and produces a concise investigation summary you can save or export, with Docker and CLI options and support for multiple LLMs (OpenAI, Anthropic, Gemini, local models) to fit your workflow. This helps you save hours of manual searching by automating multi-engine dark-web searches, scraping Onion sites via Tor, filtering noise with AI, and producing ready-to-use reports for faster, more focused OSINT investigations.
https://github.com/apurvsinghgautam/robin
#python#4k#aac#apple_music#apple_music_downloader#downloader#m4a#m4v
Gamdl is a free command-line tool to download Apple Music songs in high-quality AAC 256kbps, music videos up to 4K, albums, playlists, and artist content, with synced lyrics (LRC/SRT), rich metadata, and cover art. Install via `pip install gamdl`, add your browser cookies from an active subscription, and run `gamdl [URL]`. It benefits you by letting you enjoy offline playback anywhere without streaming data costs, on any device, with organized files ready for your library.
https://github.com/glomatico/gamdl
#python#allowlist#blocklist#disposable#domain#email#filter#hacktoberfest#pypi
This resource provides a comprehensive, regularly updated list of disposable email domains used to block fake or temporary email addresses that people often use to spam or abuse online services. By using this list, you can prevent users from registering with throwaway emails, improving the quality and security of your user base. It offers easy integration examples in many programming languages, helping you quickly check if an email is disposable and reject it if needed. This keeps your system cleaner, reduces spam, and ensures users provide real, permanent emails for better communication and trust. The list is free to use and open for contributions, making it reliable and community-supported.
https://github.com/disposable-email-domains/disposable-email-domains