Удаление страниц PDF-файла
Библиотека PyMuPDF включает в себя довольно много сложных методов, которые упрощают удаление страниц из файла PDF. Он позволяет указать либо одну страницу (используя метод deletePage()), либо диапазон номеров страниц (используя метод deletePageRange()), либо список с номерами страниц (используя метод select()).
В следующем примере показано, как использовать список для выбора страниц, которые нужно сохранить в исходном документе. Имейте в виду, что страницы, которые не указаны, не будут частью выходного документа. В нашем случае выходной документ содержит только первую, вторую и четвертую страницы.
#python
#вакансия#аналитика#productanalytics#SQL#Tableau#PowerBI#Python#dataanalyst#datascience#удалёнка
✨ Позиция:Продуктовый аналитик
💸 Вилка:250 000 – 320 000 ₽ net
📍 Локация:РФ + дружественные страны
⏱️Занятость:Полная (100%)
🏠 Формат работы:Удалённо
📑 Оформление:ТК РФ или ИП
👨💻 Компания:КА Start Industries
В команду продукта ищем сильного аналитика, который будет не просто строить дашборды, а помогать принимать продуктовые решения на основе данных🧠📊
🔍 Чем предстоит заниматься:
– Организация и автоматизация системы сбора данных для отчётности
– Объединение данных из разных источников и создание регулярной отчётности 📈
– Участие в аналитике путей пользователя, коммуникаций и гипотез
– Погружение в продукт, помощь в выборе и расчёте метрик
– Контроль качества данных, сопоставление онлайн/оффлайн событий
– Разметка пользовательских действий, участие в ТЗ и тестировании
– Проведение A/B тестов и анализ их результатов 🎯
📌 Что важно:
– Уверенный SQL
– Опыт с БД: Oracle, Postgres, MySQL, BigQuery и др.
– Знание BI-инструментов: Tableau, Power BI, Datalens, Superset и пр.
– Навыки построения автоматизированной аналитики от данных до дашборда
– Опыт с аналитическими системами: Amplitude, Appsflyer, GA, Я.Метрика и т.п.
– Python или R — в арсенале будет плюсом 🐍
– Понимание продуктовых метрик и A/B тестирования
📩Контакт для связи:https://t.me/Julia_Start_Industries
#webDevelopment#Python#Django#REST_API
🌐
Build a Backend REST API with Python & Django - Advanced
Create an advanced REST API with Python, Django REST Framework and Docker using Test Driven Development (TDD)
🗣 Mark Winterbottom, Brooke Rutherford
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----
#вакансия#hadoop#sql#java#hive#spark#python#scrum#agile
🚀 Вакансия: Старший разработчик Hadoop🚀
Локация: Санкт-Петербург/Москва (гибридный формат)
Вилка: 250 - 350К
✈️ Готовы обсудить релокационный пакет для кандидата не из Санкт-Петербурга и Москвы.
О нас:
Мы — ведущий банк России, активно развивающий свои цифровые продукты и услуги. Сейчас мы ищем опытного и амбициозного Старшего разработчика Hadoop, который присоединится к нашей команде для работы над инновационными проектами в области данных и аналитики.
Что вам предстоит делать:
- 🤝 Взаимодействовать с бизнес-заказчиками, понимать и структурировать их требования.
- ✍️ Разрабатывать функциональные требования для построения витрин данных.
- 🛠 Создавать прототипы витрин с использованием SQL, Java, Python, Spark.
- 🧪 Разрабатывать алгоритмы тестирования.
- 📑 Документировать разрабатываемые компоненты ПО.
- 🔧 Устранять дефекты, анализировать и исправлять инциденты в рамках 3-й линии поддержки.
- 🏃♂️ Работать в SCRUM спринтах.
Наши ожидания:
- ✅ Знание SQL (подтверждается прохождением теста).
- 📈 Опыт в бизнес и системном анализе не менее 2 лет: выявление, фиксация, согласование требований, постановка задач разработке, разработка проектной и сопроводительной системной документации.
- 👥 Опыт командной разработки с использованием Jira и Confluence; знание BitBucket будет плюсом.
- 🧩 Умение формализовывать задачи в виде четких и понятных алгоритмов.
- 🎓 Высшее образование.
- 💬 Отличные коммуникативные навыки, самостоятельность, внимательность к деталям, обязательность, ответственность.
Будет преимуществом:
- 📚 Опыт работы с Hadoop и знания его архитектуры.
- 🖥 Знание Hive, Java, Python, Spark.
- 🏃 Опыт работы в Agile.
- 📜 Знание и умение работы с wiki-системой Confluence и трекинговыми системами (Jira, Redmine и т.д.).
- 🏦 Знание банковской предметной области.
Мы предлагаем:
- 📄 Официальное оформление и стабильный, прозрачный доход.
- 🏆 Все льготы и преимущества работы в аккредитованной ИТ-компании.
- 🎁 Партнерские программы и скидки для сотрудников.
- 🏢 Гибридный формат работы.
Если вы хотите развиваться в динамичной компании и работать над интересными проектами в сфере больших данных, мы будем рады видеть вас в нашей команде!
🙋🏼♀️По всем вопросам к @BekhterevaElena
#Senior#ML#Engineer#Research#remote#Python#PyTorch#HuggingFace#Transformers#LoRA
Senior ML Engineer
About the Company
ARQ is a studio specializing in the development of AI video and tools for video generation using artificial intelligence. We create solutions that allow users to generate videos of any format — from short clips to production-level content — powered by our own models and multimodal pipelines.
What You’ll Do:
- Develop and optimize models using LoRA, RLHF, LangChain, LangGraph, Qdrant, and RAG.
- Integrate ML components into video generation pipelines.
- Conduct experiments with fine-tuning and model adaptation for specific ARQ tasks.
- Optimize inference and model performance in production environments.
- Automate ML pipelines, set up CI/CD, and monitor model stability.
- Work with multimodal solutions combining text, video, and image data.
What We Expect:
- 3+ years of experience as an ML Engineer or Research Engineer.
- Strong proficiency in Python, PyTorch, Hugging Face, and Transformers.
- Hands-on experience with LoRA, RLHF, LangChain, LangGraph, Qdrant, and RAG.
- Understanding of generative models for video and multimodal systems.
- English proficiency at C1 level or higher.
Nice to Have:
- Experience in data processing and preparation for multimodal tasks.
- Experience integrating LLM models into production systems.
- Experience with retrieval systems and vector databases.
- Experience optimizing large models for real-world performance.
What We Offer:
- Fully remote work format.
- Payment in cryptocurrency (with future possibility to switch to fiat).
- Stock options — share in the company’s growth.
- Minimum bureaucracy, maximum technology and speed.
contact @michael_terner
#typescript#investigation#osint#python#recon
Flowsint is a free, open-source tool for OSINT investigations that visualizes data like domains, IPs, emails, phones, crypto wallets, and websites as interactive graphs to spot hidden links fast. Install easily with Docker and Make via git clone and "make prod," then run locally at localhost:5173 for full privacy—all data stays on your machine. With 30+ auto-enrichers (e.g., subdomain scans, WHOIS, breach checks), it chains tasks to automate deep recon, saving hours on manual work and revealing patterns for cybersecurity, journalism, or fraud probes ethically.
https://github.com/reconurge/flowsint
#python#datascience#formula1#motorsport
FastF1 is a Python package that lets you easily access and analyze Formula 1 data like results, schedules, timing, telemetry, and more. It uses Pandas DataFrames with custom F1 tools, Matplotlib for charts, and caching for fast scripts—install via pip install fastf1. You benefit by quickly pulling historical and live F1 stats to build insights, visualizations, or apps without hassle.
https://github.com/theOehrly/Fast-F1
http://www.enlistq.com/10-python-idioms-to-help-you-improve-your-code/
If you have ever tried to learn a new language (not a programming language), you know that we always think in our native language before we translate it to the new language. This can lead to you forming some sentences that don’t make sense in the new language but are perfectly normal in your native language. For example, in a lot of languages, you ‘open’ an electronic gadget such as fan, AC or cell phone. When you say that in English, it means to literally open the gadget instead of turning it on.
The same is true for programming languages. As we pick up new languages, such as #python, we are using our prior knowledge of programming in another language (q, java, c++ etc) and translating that to python. Many times, your code will work but it won’t be ‘#pretty’ or #fast. In python terms, your code won’t be ‘#pythonic’.
#python#artificial_intelligence#cybersecurity#generative_ai#llm#pentesting
Cybersecurity AI (CAI) is an open-source, lightweight framework that helps you build AI agents to find and fix security vulnerabilities efficiently. It supports many AI models and tools, works on multiple operating systems, and allows human control during tasks. CAI automates complex security testing steps like scanning, exploiting, and validating bugs, making bug bounty hunting easier and faster. It also logs detailed traces for better analysis and supports teamwork among AI agents. Using CAI can boost your cybersecurity skills, save time, and improve your ability to protect systems from attacks by combining AI power with your expertise.
https://github.com/aliasrobotics/cai
#DataScience#CausalInference#Econometrics#Python#BigData#Remote#Jobs#Senior#Middle#Ваканасия
Позиция: Data Scientist (Causal Inference & Econometrics)
Компания: X5 Group (Пятерочка, Перекресток, Чижик)
Локация: Удаленно (РФ) или офисы в Москве (БЦ Оазис)
Доход: Оклад 300 000 – 600 000 ₽ gross + годовой бонус до 40%
🚀 О команде и задачах
Команда ad-hoc аналитики ищет сильного DS-специалиста с фокусом на Causal Inference. Мы работаем с петабайтами данных (29к+ магазинов, 50 млн клиентов), но при этом у нас нет легаси.
Мы строим новый стрим, где работа — это настоящий Research: разбор бизнес-механик, чтение свежих статей (arXiv, top-tier confs), имплементация SOTA-методов и создание собственных библиотек.
Чем предстоит заниматься:
Вам предстоит end-to-end разработка методологий для оценки эффектов там, где классические A/B-тесты бессильны (например, оценка федеральных промо или влияния подписок).
• Бизнес-анализ. Встречи с заказчиками, формализация гипотез и выбор метрик.
• Моделирование. Подбор статистического подхода, построение DAG, поиск инструментов/конфаундеров, тестирование на синтетике и реальных данных.
• Продукционализация. Выкатка решений в прод (регулярный расчет), доработка собственной Python-библиотеки и написание статей по итогам крутых кейсов.
🧠 Ты нам подходишь, если:
У тебя есть опыт в DS от 2-х лет и крепкий бэкграунд в эконометрике (академический или рабочий).
Hard Skills & Theory:
• Глубокое понимание эндогенности (причины/борьба), умение отличать конфаундер от инструмента.
• Умеешь рисовать графы для конкретного DGP, находить коллайдеры и медиаторы.
• Владеешь методами для кросс-секционных и панельных данных: AIPW (Doubly Robust), DiD, TWFE, IV.
• Пишешь чистый, структурированный код, знаешь классические алгоритмы.
• Пишешь оптимальные запросы (знание Hadoop-стека будет плюсом).
🎁 Мы предлагаем:
• Полная удаленка или гибрид (офисы на м. Добрынинская / м. Волгоградский проспект).
• Гибкое начало рабочего дня (с 8 до 10 утра), 5/2.
• Оплата обучения, профильных конференций, программы мотивации для авторов статей и спикеров.
• ДМС со стоматологией и выездом за рубеж, страхование жизни.
• Демократичная среда, отсутствие бюрократии, ретро с мемами и оффлайн-тимбилдинги.
📩 Контакты
Резюме в формате "Фамилия Имя Резюме DS ad-hoc" присылать сюда: @Zzzelar
Не забудь указать, что ты от @datasciencejobs
#вакансия#job#relocate#remote#удаленка#работа#openai#opaenaiapi#chatgpt#python#nodejs
Ищем разработчика OpenAI API чатбота-помощника (язык API не важен)
Город: Лиссабон, немного возможна удаленка
Занятость: fulltime
ЗП: ~3k USD gross, можно пробовать больше обсудить.
Название компании: Intelas, https://www.intelas.com/
Команда Intelas ищет разработчика OpenAI API чатбота-помощника в базе регуляторной и иной документации в сфере коммерческой недвижимости, типа нишевого https://pdfgpt.io/ (A Chatbot who can chat with you about Your provided pdf, can Talk about content. You Just Need to upload pdf and ask any question).
Intelas занимаются разработкой b2b SaaS сервисов и интеграционного API для рынка коммерческой недвижимости в США. Основаны в 2022м году, есть совсем свежий продукт и клиенты, рост немного опережает планы, HQ в Нью-Йорке.
Нужно будет
Генерировать и проверять гипотезы держа продукт в уме
Тюнить ответы
Добиваться самого мощного и удобного функционала.
Требования
Опыт работы с OpenAI API (чем больше, тем лучше!). Python, Node.js или каким иным - не так важно. Кажется, что тут прям advanced навыки разработки не требуются, намного важнее энтузиазм)
Обязателен хороший разговорный английский!!!
Но продвинутые навыки разработки или иные хордовые продуктовые скиллы могут быть полезны.
Условия
На старте удаленная работа со скорейшим переездом из РФ/РБ, если еще не. После - релокация в Португалию. Сколько времени можно на удаленке - обсуждаемо, ну может там диплом сдать, что-то такое, но желательно будет поскорее переехать.
ЗП на удаленке ~3k USD gross, можно пробовать больше обсудить.
Вопрос с ЗП в Португалии пока не до конца прояснен, еще выясню, сколько там на визы ЗП ок.
Студентов рассмотрим.
Контакты [email protected] и @workwor.
#NLP#ML#AI#NaturalLanguageProcessing#DeepLearning#Python#УдаленнаяРабота#ИП#LLM#TextAnalysis
Вакансия: ML/NLP разработчик
Грейд: Middle+/Senior
Локация: строго РФ
Формат работы: удалённая, трудоустройство только по ИП
Зарплата: 250-350 тыс. руб. 💸
📌О проекте:
Мы разрабатываем интеллектуальную Систему анализа проектной документации для обработки и анализа текстовых данных. В рамках проекта вы будете участвовать в создании когнитивного поиска, рекомендательных систем и digital-ассистентов, помогая реализовать передовые решения на основе естественного языка.
📌Задачи:
- Разработка моделей для структурирования текстов и понимания запросов на естественном языке 🧠
- Решение NLP задач для когнитивного поиска и рекомендательных систем
- Разработка NLU моделей для digital-ассистентов
- Развитие и оптимизация больших языковых моделей (LLM)
📌Мы предлагаем:
- Удалённую работу с гибким графиком 🏡
- Трудоустройство по ИП с прозрачными условиями
- Участие в интересных проектах по текстовому анализу
- Возможности для профессионального роста 🚀
- Работа с передовыми технологиями и решениями
📌Наши ожидания:
- Опыт работы с NLP задачами от 3 лет
- Глубокие знания машинного обучения и deep learning в NLP
- Практический опыт работы с задачами для русского языка: классификация текста, topic modeling, NER, Text2SQL
- Участие в хакатонах или Kaggle будет плюсом 🏆
📌Технологический стек:
Python, NLTK, DeepPavlov, Hugging Face, LSH, faiss, nmslib, HNSW, Spark, Pandas, Numpy, Sklearn, Keras, PyTorch, Tensorflow, RNN, CNN, Transformer, BERT.
📌Преимуществом будет:
- Опыт работы с LLM, включая RAG, LangChain, LoRA
- Навыки fine-tuning и prompt engineering
Если хотите присоединиться к нашему проекту, пишите в Telegram: @BekhterevaElena.