Загрузка файлов асинхронно
Если у нас есть список URL картинок для загрузки, использование простого цикла for позволит нам загрузить их последовательно, по одной за раз.
Однако, для задач, включающих загрузку большогоколичества маленьких файлов, параллелизация может заметно ускорить процесс.
Для параллелизации мы можем использовать ThreadPoolExecutor из модуля concurrent.futures. Этот инструмент позволяет выполнить функцию загрузки в нескольких параллельных потоках, где в конструкторе необходимо указать максимальное количество потоков для одновременного выполнения.
С помощью метода .map(download, urls) можно развернуть функцию загрузки на каждый URL из списка, обеспечивая их параллельнуюобработку.
Важно понимать, что так как загрузка файлов является IO-операцией, данный метод неускоряет выполнение кода в прямом смысле, а скорее позволяет начать загрузку следующего файла, не ожидая завершения предыдущего.
#python#threading
📌ThinkSound: новыйvideo-to-sound инструмент
ThinkSound — духовный наследник mmAudio — который способен генерировать звук к видео с высокой точностью.
▪ Поддерживает chain-of-thoughtпромпты: позволяет по шагам объяснить, как должен звучать объект (например: «это металл, он падает на плитку, должно звучать звонкой эхо»)
▪ Учитывает контекст сцены, физику движения объектов, состав материалов и многое другое
▪ Работает с видео как reasoning-модель, а не просто визуально-аудиофильтр
В демках можно послушать звук шагов на песке, звон разбитого стекла, шум дождя — всё сгенерировано на лету, без записанных сэмплов.
Из минусов - сложно подобрать промпт, но когда получается, то модель выдает годноту.
🟡Github: https://github.com/FunAudioLLM/ThinkSound
🟡Демо: https://thinksound-project.github.io/
🟡Статья: https://arxiv.org/pdf/2506.21448
🟡Проект: https://ThinkSound-Demo.github.io
@ai_machinelearning_big_data
#python#videotosound
👥>>> telegram.Bot()
This group is for questions, answers and discussions around the python-telegram-bot library and, to some extent, Telegram bots in general.
#bot#python#programming#group
#вакансия#Python#Fulltime#remote
◾️Компания: Аккредитованная ИТ компания Devim - FinTech, 9+ лет на рынке
◾️Вакансия: Data Engineer (python)
🌏Формат работы: удаленка откуда угодно (офис по желанию в СПБ, м. Старая деревня), главное - иметь РФ счет для ЗП
💳 Вилка: очень примерная - 250 000-400 000 руб NET, готовы отталкиваться от ожиданий кандидатов
🙏Пожелания к кандидату: 3+ лет опыта с данными в качестве Data Engineer; понимание принципов построения DWH и ETL процесса
➕Как плюс: опыт с оркестрацией ETL на Airflow или аналогах, опыт вывода моделей в прод
🪄Стек: Python, Airflow, PostgreSQL, Clickhouse, Docker, k8s
📍Задачи: строить хранилище данных для DS команды и продуктового офиса, разрабатывать инфраструктуру обработки данных и ML (MLFlow, DBT, Superset). Проект на начальной стадии, нет легаси, только новые фичи и можно будет собрать data фреймворк под себя
🧠 Этапы: всего 2 - тех интервью и финальная встреча с CPO
📬 Кидать резюме сюда: @k_shvt🖖
#вакансия # DataScientist #fulltime#удаленно#Python
👋Привет! Меня зовут Ирина. Я представляю группу компаний Top Selection.
🔥В данный момент мы в поисках DataScientist 🔥 Грейд: midlle+
Рейт: 200-230 К на руки
Формат работы: удаленка
Локация/Гражданство: только РФ
Срок привлечения: до конца 2026
Загрузка: fulltime
Оформление: как ИП
Сфера: ритейл
📝Задачи и обязанности:
• Развивать AI-помощника для сотрудников: улучшать качество ответов, разрабатывать дополнительные интеграции с внутренними базами и документами, разрабатывать новые фичи
• Определять структуру и качество данных для разработки новых фичей/продуктов
• Разрабатывать базовые AI-решения на уровне MVP: от обработки данных и настройки модели до простого интерфейса и интеграции с внутренними системами
• Тестировать, сравнивать и адаптировать различные ML-подходы (классификация, кластеризация, ранжирование) и новые рыночные решения для внутренних продуктов.
• Разрабатывать архитектуру AI-решений и писать чистый, эффективный и поддерживаемый кода на Python.
✅Требования:
• Опыт работы в Data Science от 3 лет
• Высшее образование: IT, техническое, математическое
• Уверенное знание Python, умение писать чистый, поддерживаемый продакшен-код.
• Практический опыт решения задач классического ML: классификация, регрессия, кластеризация.
• Глубокое владение основными библиотеками и фреймворками для анализа данных (scikit-learn, XGBoost/LightGBM, numpy, pandas, plotly/ matplotlib/ seaborn)
• Понимание feature engineering и методологий оценки качества моделей.
• Знание SQL, опыт работы с реляционными СУБД на уровне пользователя
• Умение работать с Git
• Опыт создания и сопровождения ML-сервисов на современных фреймворках (FastAPI, Flask).
• Понимание работы REST/gRPC API.
• Понимание микросервисной архитектуры и контейнеризации (Docker).
• Владение инструментами CI/CD и принципами MLOps для автоматизации развертывания моделей в Kubernetes-окружении
• Навыки настройки логирования и мониторинга для ML-компонентов.
• Знание архитектурных паттернов для LLM.
• Понимание концепций: transformer, механизмы внимания, GPT-архитектуры
• Методы тонкой настройки LLM: LoRA, QLoRA, адаптерные подходы
• Навыки работы с большими языковыми моделями (Hugging Face, vLLM),
• Опыт построения и оптимизации RAG-систем.
• Навыки работы с векторными базами данных (подбор, оптимизация запросов, управление индексами).
• Умение строить и донастраивать сложные взаимодействия с LLM: prompt engineering, prompt chaining, использование function calling и управление контекстом (contextual memory).
• Умение работать с неструктурированными данными
• Способность самостоятельно доводить решения до рабочего прототипа
• Готовность активно погружаться в быстро развивающийся стек LLM-технологий и внедрять их в рабочие продукты.
📲@irazhura87
🚀 Google kutilmaganda Data Science uchun yangi sun’iy intellekt yordamchisini taqdim etdi!
Ushbu AI vositasi bir necha daqiqa ichida to‘liq ishlaydigan bloknot (notebook) yaratadi – ma’lumotlarni yuklashdan tortib yakuniy tahlilgacha barcha jarayonlarni o‘z zimmasiga oladi.
📊AI Python tilida kod yozadi, maʼlumotlarni vizuallashtiradi va qadam-baqadam optimal yechimni taklif qiladi. Sizga faqat hajmi 1 Gb gacha bo‘lgan datasetni yuklash kifoya.
Natijada zerikarli ish va uzluksiz xatolarni tuzatish bilan shug‘ullanmasdan, tayyor kod va grafikalar bilan to‘liq loyiha olasiz.
📌 Sinab ko‘rish uchun havola: colab.google
#Google#DataScience#AI#Python