🚀 API Shop - API Xizmatlaringiz Uchun Eng Yaxshi Tanlov! 🌟
📲 Bizda Mavjud Xizmatlar:
1️⃣ Ijtimoiy Tarmoqlardan Media Yuklab Olish: Instagram, TikTok, Facebook, Twitter va boshqa ijtimoiy tarmoqlardan media va rasm yuklab oling. 📸🎥
2️⃣🎙 TTS (Text-to-Speech) API: Matnni ovozga aylantiring, har qanday til va ovoz variantlari bilan. Oson va tez! 🗣💬
3️⃣🎵 Shazam API: Musiqa tanish, qo'shiqlarni aniqlash va har qanday audio faylni tanib olish imkoniyati. 🎶🔍
4️⃣📁 Photolab API: Tasvirlaringizni ajoyib effektlar bilan bezang! Eng yaxshi tasvir tahrirlash API xizmati sizni kutmoqda. 🌟📸
🤖 Barcha xizmatlarimizni Telegram botimiz orqali ham ko'rishingiz mumkin:@Apishopbot
🔗 Bizning xizmatlarimizdan foydalaning va imkoniyatlardan maksimal darajada foydalaning! 🚀
🌐 Bot:@Apishopbot
📩 Bog'lanish:@bizbotsupport
#API#Xizmatlar#TTS#Shazam#Fotomuhandislik#Innovatsiya
#вакансия#machinelearning#ml#datascience#ds#python#middle#senior#nlp#asr#tts
Middle/Senior Machine Learning Engineer
Вилка: 3000–5500 евро (в зависимости от уровня)
📍Локации: Россия, СНГ, ЕС, Сербия, Турция
Компания: североамериканская компания, работающая на рынке VoIP-решений
Стек: Python, ML&DL, NLP, ASR, Speech synthesis (TTS), PyTorch/TensorFlow, HuggingFace, ONNX/TensorRT, NeMo, NumPy
Что предстоит делать:
— Разрабатывать решения в области речевых технологий — обработка аудио и речи (в оффлайн и потоковом режиме), анализ текста (суммаризация, поиск сущностей, классификация, выделение тем и т.д.), детектирование угроз (мошенничество, спам и т.д.).
— Быстро создавать прототипы решений и подстраивать их под бизнес-требования.
— Разрабатывать и оптимизировать ML-модели для распознавания речи, анализа текста и смежных задач.
— Взаимодействовать с проектным менеджером и продакт-лидом для преобразования бизнес-требований в технические решения.
— Следить за современными методами и исследованиями в области обработки речи и NLP.
— Участвовать в профессиональном развитии команды.
Будет существенным плюсом:
— Опыт работы с современными библиотеками обработки речи.
— Опыт конвертации/оптимизации/ускорения моделей с помощью TensorRT или аналогичных инструментов.
— Участие в ML-соревнованиях (Kaggle и др.).
Требования к английскому: уровень B1 и выше.
Позиция подразумевает участие во всех этапах разработки — от уточнения бизнес-требований до реализации продакшн-решений.
Контакт для связи: @sl_sergei
🎙 VibeVoice Подкастер PRO ● Лучший генератор речи по образцу голоса ● RU ● Portable by NerualDreming
Ссылка на GitHub(форк):https://github.com/rsxdalv/VibeVoice
Репакер:#NerualDreming
Дата обновления: 1 сентября 2025
Версия: 1.1
Категории:#TTS, #voiceclone, #AIaudio, #podcast
Платформа:#Windows
Язык: RU
Место на диске: до 40 ГБ (включая все три модели)
Системные требования: NVIDIA GPU 8/16/24 ГБ VRAM
Совместимость:#Nvidia
🖥Описание софта
VibeVoice — это легендарный инструмент для генерации речи, который задал новую планку качества в клонировании голоса. Технология оказалась настолько совершенной, что Microsoft удалила код и модели через сутки после публикации из-за опасений злоупотреблений. Мы нашли оригинальную большую модель и собрали для неё удобный и функциональный интерфейс.
Это незаменимый инструмент для создателей контента, разработчиков игр, рекламщиков и всех, кто работает со звуком. Модель идеально передает тончайшие нюансы голоса, интонации и эмоциональную окраску, делая синтезированную речь практически неотличимой от настоящей. В комплекте — 50 готовых голосов от нашего сообщества.
😬Основные возможности VibeVoice Подкастер PRO
🟣 Отличная поддержка русского языка: Модель прекрасно понимает и генерирует русскую речь, сохраняя естественность и правильные интонации.
🟣 Три модели на выбор для разных GPU:
• VibeVoice-1.5B: требует 8 ГБ VRAM (генерирует аудио до 90 минут)
• VibeVoice-7B: требует 16 ГБ VRAM (промежуточная модель)
• VibeVoice-Large: требует 24 ГБ VRAM (генерирует аудио до 45 минут)
🟣 Генерация длинных аудио: Создавайте целые подкасты или аудиокниги длиной до 90 минут за один раз. (мы не проверяли)
🟣 Мульти-голосовая генерация: Поддержка до 4 разных дикторов в одном аудиофайле с естественными переходами.
🟣 Естественная подача и эмоции: Модель превосходно улавливает контекст, ставит правильные ударения и управляет эмоциональной окраской речи.
🟣 Тонкая настройка: Доступ к расширенным параметрам для полного контроля над процессом генерации.
🟣 Гибкость форматов: Сохранение результата в трех популярных аудиоформатах на выбор.
🟣 Готовая библиотека голосов: 50 тщательно отобранных голосов доступны сразу после установки, еще больше — в нашем чате.
🟣 Удобный интерфейс: Полностью русифицированный интерфейс с возможностью прослушивания и загрузки своих образцов голоса.
⚠️Известныепроблемы:В зависимости от контекста, VibeVoice может самопроизвольно генерировать звуковые эффекты, такие как фоновая музыка, аплодисменты или закадровый смех. Это не баг, а фича.
Если шаги генерации не идут - перезапустите bat. Это может быть связано с слишком длинными образцами голоса, попробуйте использовать не больше 12 секунд - обрезать можно прямо в интерфейсе.
💿Установка и запуск:
Примечание: Модели (1.5B, 7B, Large) не скачиваются сразу. Загрузка нужной модели начнется автоматически при первой попытке генерации.
Для версии Installer (ZIP):
⁍ Скачайте ZIP-архив.
⁍ Распакуйте его в удобное место (путь без кириллицы и пробелов).
⁍ Запустите файл install.bat для установки окружения.
⁍ После завершения установки, для работы используйте run_demo.bat.
Для версии ENV (7z):
⁍ Скачайте 7z-архив.
⁍ Распакуйте его в удобное место.
⁍ Для работы сразу запустите файл run_demo.bat.
➡️ Скачать архиватор 7z
➡️Скачать VibeVoice PRO Portable Installer (ZIP) — ZIP-архив с полным установщиком (скачает окружение).
➡️Скачать VibeVoice PRO Portable ENV (7z)— обычный 7z-архив с готовым окружением (модели скачиваются при первом использовании).
💬Обсудить в чате | ⭐️Поддержать канал
👾НЕЙРО-СОФТ — Делаем нейросети доступнее.
Speech Note
#Linux desktop and #Sailfish OS app for note taking, reading and translating with offline #Speech to Text #stt, Text to Speech #tts and Machine #Translation
https://github.com/mkiol/dsnote
MPL-2.0 license
https://github.com/mkiol/dsnote#how-to-install
Speech Note let you take, read and translate notes in multiple languages. It uses Speech to Text, Text to Speech and Machine Translation to do so. Text and voice processing take place entirely offline, locally on your computer, without using a network connection. Your privacy is always respected. No data is sent to the Internet.
Speech Note uses many different processing engines to do its job. Currently these are used:
Speech to Text (STT)
Coqui STT (a fork of Mozilla DeepSpeech)
Vosk
whisper.cpp
Faster Whisper
april-asr
Text to Speech (TTS)
espeak-ng
MBROLA
Piper
RHVoice
Coqui TTS
Mimic 3
WhisperSpeech
Kokoro
Parler-TTS
F5-TTS
S.A.M.
Machine Translation (MT)
Bergamot Translator
🆕 Qwen3-TTS Portable PRO ● Ультимативный синтез и клонирование голоса ● RU ● v2.0.0 ● Portable by nerual dreming
Ссылка на оригинальный GitHub:https://github.com/timoncool/Qwen3-TTS_portable_rus
Репакер:#nerual_dreming
Версия: 2.0.0 PRO
Категории:#TTS, #voicecloning, #AIaudio
Платформа:#Windows
Язык: RU
Место на диске: 20 ГБ (все модели)
Совместимость:#Nvidia#cpu
🖥Описание софта
Qwen3-TTS — это революционная серия моделей синтеза речи от команды Alibaba Qwen, построенная на базе универсальной End-to-End архитектуры. В отличие от традиционных систем, модель использует дискретный многоканальный лексикон (12.5 Гц, 16 слоев) и технологию Flow Matching, что полностью исключает эффект «роботизированности» и каскадные ошибки генерации.
Главная фишка Qwen3-TTS — глубокое понимание контекста и семантики: нейросеть адаптивно управляет тоном, эмоциями и ритмом речи на основе ваших инструкций. Система поддерживает экстремально низкую задержку потоковой передачи (до 97 мс) и демонстрирует SOTA-результаты в Zero-Shot клонировании голоса, обходя ElevenLabs и MiniMax по показателям сходства спикеров на 10 языках, включая русский.
😬Основные возможности Qwen3-TTS:
🟣 Синтез по пресетам: Огромный выбор готовых настроек с опциональным выбором стиля речи.
🟣 Клонирование голоса: В комплекте уже идёт полсотни (50+) готовых голосов, а еще более 700 голосов можно скачать прямо в интерфейсе раздела клонирования.
🟣 Multi-Speaker режим: Создание полноценных диалогов и подкастов с поддержкой до 4 спикеров одновременно.
🟣 Voice Design: Уникальная фишка — создание уникального голоса через текстовый промпт. Просто опишите характер голоса, и нейросеть его воспроизведёт.
🟣 Выбор весов: 6 различных моделей весом от 1.8 до 3 ГБ каждая для гибкой настройки под ваше железо.
💿Установка и запуск
⁍ Распакуйте архив в корень диска (путь без кириллицы).
⁍ Перейдите в папку Qwen3-TTS_portable_rus\portable.
⁍ Запустите install.bat для автоматической настройки окружения, если скачали установщик.
⁍ Используйте run.bat если скачали env.
⁍ Модели будут скачаны при первом использовании.
➡️Скачать Qwen3-TTS Portable PRO v2.0.0 installer — установщик, сам все скачает
➡️Скачать Qwen3-TTS Portable PRO v2.0.0 env — готовое окружение под win11
💬Обсудить в нашем чате
👾НЕЙРО-СОФТ - делаем нейросети доступнее
🎭Fish Speech Dialogue Portable● Обновленная мультиязычная портативная версия с 50+ голосами ● RU+EN ● Portable by Shahmatist^RMDA
Ссылка на оригинальный GitHub:https://github.com/shaitanzx/fish_speech/
Репакер:#Shahmatist/RMDA
Дата обновления: 24 февраля 2025
Версия: 0.07
Категории: #TTS, #voiceclone, #AIaudio, #dialogue
Платформа:#Windows
Язык: RU, EN
Место на диске: 10GB
Системные требования: NVIDIA GPU 8GB
Совместимость:#Nvidia
🖥Описание софта:
Fish Speech Dialogue — это мощное решение для озвучки диалогов и отдельных реплик с использованием различных голосов. Новая портативная версия включает все необходимые компоненты и библиотеку из более чем 50 готовых голосов от сообщества. Теперь работает даже с одним говорящим. Больше не требуется установка базового Fish Speech MOD. Портативная версия.
😬Основные возможности Fish Speech Dialogue:
🟣 Поддержка от 1 до 10 говорящих в одном диалоге
🟣 Автоматическое распределение голосов в диалогах
🟣 Озвучка одиночных реплик и монологов
🟣 Более 50 готовых голосов от сообщества
🟣 Форматирование диалога "Говорящий: текст"
🟣 Форматы сохранения: WAV, MP3 и FLAC
🟣 Мультиязычный интерфейс (RU/EN)
🟣 Стабильная GitHub версия с автообновлением
🟣 Расширенные настройки для продвинутых пользователей
💿Установка и запуск:
⁍ Скачайте zip или exe архив Fish Speech Dialogue
⁍ Распакуйте в любую папку на диске
⁍ Запустите start.bat
⁍ После проверки обновлений и загрузки компонентов интерфейс откроется в браузере
➡️Скачать Fish Speech Dialogue 7z — архив с GitHub, без модели, модель скачается при запуске, используйте 7z для распаковки
➡️Скачать Fish Speech Dialogue exe — самораспаковывающийся архив 7z с моделью, после распаковки сразу готов к работе
💬Обсудить в чате | ⭐️Поддержать канал
👾НЕЙРО-СОФТ — Делаем нейросети доступнее.
http://aiomysql.readthedocs.io/en/latest/sa.html
aiomysql.sa — support for SQLAlchemy functional SQL layer
sqlalchemy support ported from #aiopg, so #api should be very familiar for aiopg user.
While core API provides a core support for access to #MySQL#database, manipulations with raw SQL strings too annoying.
Fortunately we can use excellent SQLAlchemy Core as SQL query builder.
So you can execute SQL #query built by tbl.insert().values(val='abc') or tbl.select() expressions.
#sqlalchemy has rich and very powerful set of SQL construction functions, please read tutorial for full list of available operations.
Also we provide SQL transactions support. Please take a look on SAConnection.begin() method and family.
📢 “Yangi O‘zbekiston” universitetida tayanch doktoranturaga qabul davom etmoqda!
Hurmatli yosh tadqiqotchilar!
2025-yil 5-noyabr, 23:59 gacha “Yangi O‘zbekiston” universitetida doktoranturaga hujjatlar qabul qilinmoqda.
🎓 Endi siz to‘liq shtatda ishlash bilan birga doktoranturani o‘qishingiz mumkin!
Universitetda ilm-fan, ta’lim va sanoat tarmoqlari integratsiyasi yo‘lga qo‘yilgan bo‘lib, doktorantlar sanoat korxonalarida ilmiy izlanish olib borish, amaliy loyihalarda qatnashish va o‘z natijalarini ishlab chiqarish jarayonlariga tatbiq etish imkoniga ega.
🌍 Xalqaro hamkorlik va ilmiy mobillik Doktorantlar Nazarboyev universiteti (dunyoda top 500) va Xalifa universiteti (dunyoda top 200) kabi nufuzli oliygohlarda ilmiy tadqiqotlar o‘tkazish, tajriba almashish va malaka oshirish imkoniyatiga ega.
🚀Kelajak ilm-fanini birgalikda yarataylik!
🔁English
➖➖➖➖➖➖➖➖➖➖
#LetsDoResearchForNewUU#Tadqiqot#Innovatsiya#Ilm#AI#DataScience#Engineering#Biotech#Physics
⬇️Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
🎓 “Yangi O‘zbekiston” universitetida xalqaro innovatsiyalar va ilmiy tadqiqotlar olamining bir qismiga aylaning!
🔬 “Yangi O‘zbekiston” universiteti bugun ilm-fan va innovatsiyalar shakllanayotgan zamonaviy tadqiqot markazidir. Bu yerda xalqaro darajadagi professor-o‘qituvchilar, yosh va iqtidorli mutaxassislar birgalikda yangi g‘oyalar va texnologiyalarni yaratish ustida ishlamoqda.
🌍 Siz ham muhandislik, tabiiy fanlar, sun’iy intellekt, biotexnologiya, fizika, iqtisodiyot, ma’lumotlar tahlili va matematik modellashtirish kabi ustuvor yo‘nalishlarda o‘z ilmiy izlanishlaringizni amalga oshiring.
💡 “Yangi O‘zbekiston” universiteti — bu bilim, ijod va xalqaro hamkorlik uyg‘unlashgan muhit. Ilmiy g‘oyangizni hayotga tatbiq etish uchun eng yaxshi joy shu yerda!
🔁English
➖➖➖➖➖➖➖➖➖➖
#LetsDoResearchForNewUU#Tadqiqot#Innovatsiya#Ilm#AI#DataScience#Engineering#Biotech#Physics
⬇️Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
🚀 Security Concerns Arise Over LLM Agent API Routers
On April 10, Solayer founder @Fried_rice highlighted on social media the growing reliance of large language model (LLM) agents on third-party API routers, which distribute tool call requests to multiple upstream providers. According to BlockBeats, these routers operate as application layer proxies and can access each JSON payload in plaintext during transmission. However, no provider currently enforces encryption integrity protection between the client and upstream models.
A study tested 28 paid routers purchased from platforms like Taobao, Xianyu, and Shopify independent sites, along with 400 free routers collected from public communities. The findings revealed that one paid router and eight free routers were actively injecting malicious code. Additionally, two routers deployed adaptive evasion triggers, 17 accessed AWS Canary credentials owned by researchers, and one stole ETH from a private key held by researchers.
Further poisoning studies demonstrated that seemingly harmless routers could also be exploited. A leaked OpenAI key was used to generate 100 million GPT-5.4 tokens and over seven Codex sessions. Weaker bait configurations resulted in 2 billion billing tokens, 99 credentials across 440 Codex sessions, and 401 sessions running autonomously in YOLO mode.
The research team developed an experimental proxy named Mine, capable of executing all four types of attacks on four public proxy frameworks. They also verified three client defense strategies: fault lock strategy gating, response-side anomaly screening, and append-only transparent logging.
#LLM#API#Security#CyberSecurity#Malware#DataBreach#Encryption#Proxy#AI#MachineLearning#ETH