#вакансия#nlp#llm#senior
Senior QA Automation (LLM, NLP)
Требуемый опыт работы: 3–6 лет
Полная занятость, полный рабочий день
Мы — АТОМ. Разрабатываем электромобиль-гаджет и его версии для семьи, такси, каршеринга и службы доставки, а также собственный маркетплейс приложений и другие сервисы.
Ищем Senior QA Automation в команду AI, LLM-Lab, которая работает над рядом проектов:
Голосовой ассистент для заказа товаров и услуг, в котором используются передовые технологии распознавания и синтеза речи, понимания естественного языка на основе нейросетевых моделей.
Разработка умных чат-ботов и других проектов в домене LLM/NLP.
Ваши задачи:
- налаживать процесс автоматизации тестирования;
- проводить тестирование - регрессионное, интеграционное и функциональное;
- тестировать ML-системы;
- анализировать функциональные требования и результаты тестирования на соответствие этим требованиям;
- исследовать проблемы, возникающих в работе сервисов;
- анализировать проблемы и запросы пользователей, ставить задачи разработчикам;
- вести тест-кейсы в системе управления тестами (Allure TestOps).
Стек: Python, PostgreSQL, PyTorch, Ray/Triton Inference Server, k8s, redis
Наши ожидания:
- опыт построения систем автоматизированного тестирования;
- умение читать и писать код на Python;
- опыт работы/тестирования ML-систем (NLP/LLM-моделей);
- опыт работы с CI/CD инструментами;
- опыт работы с Allure TestOps;
- Fiddler, Swagger, Postman;
- опыт оценки задач на тестирование с учетом ресурсов и рисков;
- знание английского языка на уровне, необходимом для чтения технической литературы.
Будет плюсом:
- опыт работы с системами оркестрации контейнеров - OS/K8s на уровне пользователя;
- опыт работы с GraphQL;
- опыт работы с брокерами сообщений Kafka/Rabbit;
- опыт работы auto-QA в команде GigaChat, YaLM , YandexGPT;
- опыт работы auto-QA в голосовых ассистентах Маруся, Алиса, Салют.
Мы предлагаем:
- высокотехнологичный, интересный продукт, возможность создавать новые процессы и влиять на развитие;
- работа в команде высококвалифицированных профессионалов из России, Китая, Европы;
- корпоративная культура, выстраиваемая в духе инноваций, открытые горизонтальные коммуникации;
- конкурентная официальная белая заработная плата;
- годовой бонус;
- кафетерий льгот (“плюшки”) - ДМС со стоматологией, питание, транспорт, страхование жизни и имущества, фитнес, обучение и многое другое;
- бесплатный доступ к платформе с обучающими курсами iSpring, корпоративное обучение китайскому языку, спортивные командные игры и другие приятные мелочи;
корпоративное оборудование;
- гибридный или удаленный формат работы;
- трудоустройство в аккредитованной ИТ-компании.
Пройди вместе с нами крутой кейс по созданию электромобиля с нуля!
✍️По всем вопросам, а также для отправки резюме/cv обращайтесь: @tanya_yuu
#CI#CD#Allure#TestOps#SQL#Fiddler#Swagger#Postman#QA#Python#LLM#NLP#ML#DataScience#AutomationQA#NaturalLanguageProcessing
#вакансия#vacancy#удаленка#remote#AI#мидл#Middle#синьор#Senior#ai#ии#ml#мл#llm#RAG#fullstack#finetuning#NLP#langchain#DataScientist#DataEngineer#MLengineer#api#aideveloper#python
❇️Вакансия: «AI Developer / ИИ Разработчик» Middle/Senior
Формат: удаленно по всему миру
Наш часовой пояс: UTC+3
Занятость: проектная с переходом в полную
Оплата: до 350.000₽ за проект или почасовая
Мы мультибренд занимающийся разработкой и внедрением AI и ML технологий во всех коммерческих отраслях
В связи с расширением мы ищем новых специалистов в нашу команду, а именно: AI Developer, Data Scientist, Data Engineer, ML Engineer
🔸Направления нашей работы:
- Внедрение ИИ/ML для автоматизации процессов
- Внедрение ИИ/ML в web сервисы, браузерные расширения и приложения(mobile)
- Создание продвинутых функциональных AI-Ассистентов
- Обучение/дообучение моделей
- Разработка AI/ML SaaS
🔸Какие задачи вам предстоит решать:
- Работа с LLM(Anthropic, Gemini, OpenAI, Llama, Mistral и др)
- Взаимодействие с API различных сервисов/приложений
- Решение задач по автоматизации бизнес-процессов и написанию скриптов на языке Python
- RAG моделей (с использованием Langchain или др.)
- Fine-tuning open-source моделей
- Text-to-text, text-to-speech, speech-to-text NLP
- Работа с облачными платформами(Google Cloud, Yandex Cloud и др.)
- Использование no-code/low-code инструментов для сокращения издержек (Flowise, Make, Zapier Central, Relevance и др.)
🔸Важный навык:
- Свободное владение Английским языком
🔸Мы предлагаем:
- Интересные проекты с возможностью творческой реализации
- Возможность принять участие в выводе продуктов и сервисов бренда на международный рынок
- Возможность профессионального роста и нетворкинга с экспертами в сфере AI и ML со всего мира
- Карьерный рост до Team Lead или CTO одной из компаний
- Отсутствие привязки к месту и возможности легальной оплаты труда в любую точку мира
- Свобода мысли и принятия решений при реализации проектов
🔸Кого мы хотим видеть:
- амбициозных, инициативных и талантливых разработчиков, желающих достигать новых высот в сфере AI и ML, которые легко вольются в нашу молодую команду
(P.s. вам необязательно быть молодым, но обязательно быть с нами близким по духу)
💬Отправляйте резюме/CV/портфолио:@subscale_ai
#вакансия
Data analyst / Data scientist, Москва
VK Реклама — одно из ключевых подразделений в VK. Ежедневно наши сервисы охватывают более 140 млн пользователей в России и странах СНГ. Более 100 тыс. рекламодателей каждый день запускают рекламные кампании у нас и находят своих клиентов. Мы — команда ML внутри VK Рекламы, отвечаем за её качество, чтобы пользователи могли увидеть наиболее подходящую им рекламу, а рекламодатели потратить свои бюджеты наиболее эффективно.
Основная задача нашего направления — проверять гипотезы, искать инсайты и точки роста эффективности и впоследствии внедрять их в прод. У нас идёт полный ML-цикл от проработки гипотезы до проведения экспериментов и внедрения фич в продакшен. Результаты нашей работы напрямую влияют на эффективность такого большого продукта, как VK Реклама.
Команда ad hoc аналитики занимается проверкой гипотез и поиском точек роста. Тестирует гипотезы в реальных экспериментах и оценивает изменения. Мы ищем в команду сильных аналитиков, совместными усилиями будем проводить различные аналитические исследования для повышения эффективности нашего продукта.
Задачи:
• Анализ больших данных для поиска потенциальных точек роста и выдвижения гипотез;
• ad hoc аналитика, поиски зависимостей в данных;
• проверка гипотез, поиск узких мест, донесение результатов до прода;
• оптимизация моделей рекламного аукциона и моделей ранжирования пользователей;
• проведение и статоценка экспериментов;
• разработка и автоматизация отчётности;
• сбор, обработка и дальнейшее использование больших данных.
Требования:
• Хорошее знание SQL (сложные запросы, порядок выполнения операций) — нужно написать не просто запрос, а оптимальный запрос, который сможет отработать на действительно больших данных;
• знание Python для анализа данных; библиотеки Pandas, Numpy — нужно будет сделать анализ данных, проработать гипотезы и правильно их визуализировать. Недостаточно просто найти какой-то паттерн — нужно его правильно представить наружу;
• работа с системами больших данных будет большим плюсом (Hadoop, PySpark);
• хорошее понимание матстатистики;
• анализ данных с учётом сезонности, поиски аномалий и выбросов в данных.
Будет плюсом:
• Опыт работы с ClickHouse, Hadoop, Git, Jenkins;
• работа с инструментами BI-отчётности, понимание ETL-инструментов (делаем автоматические отчёты, готовим для них данные, настраиваем выгрузки и другое).
✍️ Отправить CV и по всем вопросам: https://t.me/olkony
#ds#adhoc#analytics#ml#mailru#vk#adtech#sql#python#pandas#numpy#pysprak#hadoop#mathstat#clickhouse#гибрид#remote#middle#senior
#python#gym#gym_environment#reinforcement_learning#reinforcement_learning_agent#reinforcement_learning_environments#rl_environment#rl_training
NeMo Gym helps you build and run reinforcement‑learning training environments for large language models, letting you develop, test, and collect verified rollouts separately from the training loop and integrate with your preferred RL framework and model endpoints (OpenAI, vLLM, etc.). It includes ready resource servers, datasets, and patterns for multi‑step, multi‑turn, and tool‑using scenarios, runs on a typical dev machine (no GPU required), and is early-stage with evolving APIs and docs. Benefit: you can generate high‑quality, verifiable training data faster and plug it into existing training pipelines to improve model behavior.
https://github.com/NVIDIA-NeMo/Gym
#python#chatbi#deepseek#llm#nl2sql#rag#sqlbot#text_to_sql#text2sql
SQLBot is an easy-to-use intelligent system that turns natural language questions into SQL queries using advanced AI models and retrieval-augmented generation (RAG). You just need to set up your AI model and data source to start asking questions about your data. It integrates smoothly with other business systems and AI platforms, making it simple to add smart data querying to your apps. It also ensures data security with workspace-based resource isolation and fine-grained access control. You can quickly deploy it on a Linux server using Docker, enabling fast, secure, and intelligent data interaction without needing deep SQL knowledge. This saves you time and improves data accessibility.
https://github.com/dataease/SQLBot
#python#ai_tool#darkweb#darkweb_osint#investigation_tool#llm_powered#osint#osint_tool
Robin is an AI tool that searches and scrapes the dark web, refines queries with large language models, filters results, and produces a concise investigation summary you can save or export, with Docker and CLI options and support for multiple LLMs (OpenAI, Anthropic, Gemini, local models) to fit your workflow. This helps you save hours of manual searching by automating multi-engine dark-web searches, scraping Onion sites via Tor, filtering noise with AI, and producing ready-to-use reports for faster, more focused OSINT investigations.
https://github.com/apurvsinghgautam/robin
#python#4k#aac#apple_music#apple_music_downloader#downloader#m4a#m4v
Gamdl is a free command-line tool to download Apple Music songs in high-quality AAC 256kbps, music videos up to 4K, albums, playlists, and artist content, with synced lyrics (LRC/SRT), rich metadata, and cover art. Install via `pip install gamdl`, add your browser cookies from an active subscription, and run `gamdl [URL]`. It benefits you by letting you enjoy offline playback anywhere without streaming data costs, on any device, with organized files ready for your library.
https://github.com/glomatico/gamdl
#python#allowlist#blocklist#disposable#domain#email#filter#hacktoberfest#pypi
This resource provides a comprehensive, regularly updated list of disposable email domains used to block fake or temporary email addresses that people often use to spam or abuse online services. By using this list, you can prevent users from registering with throwaway emails, improving the quality and security of your user base. It offers easy integration examples in many programming languages, helping you quickly check if an email is disposable and reject it if needed. This keeps your system cleaner, reduces spam, and ensures users provide real, permanent emails for better communication and trust. The list is free to use and open for contributions, making it reliable and community-supported.
https://github.com/disposable-email-domains/disposable-email-domains
#python#document_analysis#layout_analysis#ocr#parser#pdf#pdf_converter#pdf_parser#python#vlm_ocr
Dolphin is a smart AI tool that can analyze and understand complex document images, like pages with text, tables, formulas, and pictures. It works in two steps: first, it figures out the layout and reading order of the page; then, it quickly parses each element using special prompts. This makes it fast and accurate for turning document images into structured data like JSON or Markdown. You can use pre-trained models and easy code to process single pages, PDFs, or specific elements. This helps you save time and effort when extracting information from complicated documents efficiently.
https://github.com/bytedance/Dolphin
#python#adblock#adblock_list#adblock_plus#adguard#adguard_list#adguardhome#quantumult_x
GOODBYEADS offers powerful, regularly updated rules (over 215,000 ad blocks, 102,000 DNS blocks) in formats like AdGuard, Quantumult X, and SmartDNS, with GitHub and fast domestic links. It blocks ads, trackers, and malware from top sources for clean browsing. You gain faster page loads, better privacy, less data use, and fewer distractions on any device.
https://github.com/8680/GOODBYEADS
#python#ai#ai_chat#chatgpt#enterprise_search#gen_ai#information_retrieval#llm#llm_ui#nextjs#python#rag
Onyx is an open-source AI platform that lets you easily create and use custom AI chat agents with any large language model (LLM). It supports advanced features like web search, document search, code execution, and connecting to over 40 apps, all while keeping your data secure and private. You can deploy it quickly on your own servers or cloud, making it great for individuals or large teams. Onyx helps you get accurate, reliable answers from your own knowledge and automates tasks, improving productivity and collaboration in your work. It’s flexible, secure, and free to start with.
https://github.com/onyx-dot-app/onyx
#python#arxiv#automation#e_mail#github_action#paper#recommendation#research#zotero
You can get daily emails recommending new arXiv research papers that match your interests by linking your Zotero library with the Zotero-arXiv-Daily tool. It automatically finds relevant papers based on what you have saved in Zotero, summarizes them with AI-generated short descriptions, and sends you links to PDFs and code if available. This service is free, easy to set up on GitHub with minimal configuration, and runs automatically every day, saving you time and effort in keeping up with new scientific papers tailored to your research areas. It helps you stay updated without manually searching arXiv[1].
https://github.com/TideDra/zotero-arxiv-daily