TGTGInsightinteligencia telegramLIVE / telegram public index
← Python Academy

TGINSIGHT SIMILAR POSTS

Buscar contenido similar

Canal fuente @python_academy · Post #2153 · 3 sept

Воспроизводим аудиофайлы Для этого воспользуемся кроссплатформенным пакетом playsound, который легко устанавливается через pip. Он содержит в себе лишь одну полезную функцию для воспроизведения аудиофайла: playsound('path/to/file.mp3') В качестве параметра функции можно указать путь к .mp3 или .wav файлу, или вообще его url. #audio

Hashtags

Resultados

107 posts similares encontrados

Búsqueda global general

科技&趣闻&杂记

@kejiqu · Post #3768 · 19/09/2025, 04:35

小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,对话自然度、交互适配达拟人化水准 小米今日宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于In-Context Learning (ICL) 的少样本泛化。该模型基于创新预训练架构和上亿小时训练数据,在自然度、情感表达和交互适配方面呈现出拟人化水准。Xiaomi-MiMo-Audio打破了现有语音大模型严重依赖大规模标注数据的瓶颈,证明将语音无损压缩预训练 Scaling 至 1 亿小时可“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。小米同时开源了完整的语音预训练方案,包括 Tokenizer、全新模型结构、训练方法和评测体系。该模型参数量达 1.2B,基于 Transformer 架构,支持音频重建和音频转文本任务。IT之家 🏷#Xiaomi#MiMo#Audio#语音模型#开源 📢频道👥群组📝投稿

BotsGram®

@botsgram_cu · Post #3333 · 27/12/2020, 17:03

@HearForYou_Bot Qué puede hacer este bot? Este bot puede Convertir mensajes de audio de Telegram y WhatsApp a texto Idioma: Inglés (visto en @BotsGram_cu) #whatsapp, #telegram, #speachtotext, #convert, #audio

🤖 GPT4Free ● Бесплатный доступ к премиум моделям ИИ ● EN ● Portable by NerualDreming Ссылка на оригинальный GitHub:https://github.com/xtekky/gpt4free Репакер:#NerualDreming Дата обновления: 20 апреля 2025 Версия: v0.5.1.3 Категории:#AIchat, #txt2img, #audio Платформа:#Windows Язык: EN Место на диске: 1 ГБ Системные требования: Любой ПК Совместимость:#Nvidia, #AMD, #Intel 🖥Описание софта: GPT4Free — это бесплатный клиент, который подключается к открытым провайдерам ИИ и объединяет их в единый интерфейс. Даёт доступ к десяткам нейросетей, включая премиум модели, без необходимости оплаты подписок или ключей API. Вся обработка происходит на серверах провайдеров, поэтому локальное оборудование практически не нагружается. 😬Основные возможности GPT4Free: 🟣 Доступ к GPT-4, GPT-4o, Claude, Llama, Gemini и десяткам других моделей 🟣 Генерация изображений через Flux, DALL-E 3 и другие визуальные модели 🟣 Создание аудио контента через GPT-4o-audio 🟣 Веб-интерфейс для удобных чатов с историей диалогов 🟣 API-сервер для интеграции в собственные проекты 🟣 Сохранение всех запросов и возможность продолжения диалогов 💿Установка и запуск: ⁍ ВАРИАНТ 1: Скачайте автоматический установщик install_gpt4free_portable_installer.bat ⁍ Запустите файл установщика и дождитесь завершения процесса ⁍ После установки запустите start_gpt4free.bat ⁍ ВАРИАНТ 2: Скачайте архив с готовым окружением gpt4free_portable_environment.zip ⁍ Распакуйте архив в удобное место (избегайте кириллицы в пути) ⁍ Запустите файл start_gpt4free.bat для веб-интерфейса ⁍ Для запуска только API-сервера используйте start_server.bat ⁍ Для обновления используйте update_gpt4free.bat Какие-то провайдеры могут временно не работать, просто попробуйте еще раз или поменяйте модель. Отключить не нужных провайдеров (например тех, кто требует ввод токена) можно в настройках. ➡️Скачать GPT4Free Portable Installer — портативный установщик, сам всё скачает ➡️Скачать GPT4Free Portable Environment — готовое окружение, только распаковать 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

Data Science Jobs

@datasciencejobs · Post #2141 · 05/06/2024, 06:02

#вакансия#vacancy#Tech_Lead#minsk#job#gan#audio Компания: X-Labs Inc Позиция: Техлид генерации Audio Формат: #офис / full-time Локация: Минск/Москва ЗП: 450к-600к X-Labs Inc - - международная компания, лаборатория продуктов, где мы стремится стать лидерами в области VR/XR, web3, машинного обучения и нейронных сетей. Компания разрабатывает и внедряет революционные решения, устанавливая новые стандарты и вдохновляя на достижение невозможного в области информационных технологий. На данный момент мы ищем Техлида в GenAI - стартап на ранней стадии. Какие задачи вас ждут: - Исследовать и разрабатывать модели генерации Аудио - Превращать продуктовые затеи в четкие задачи машинного обучения - Предлагать идеи и участвовать в обсуждениях новых решений - Отвечать за технологические решения в направлении генерации Аудио - Технически планировать, анализировать и прорабатывать перспективные направления исследований, составлять технологические дорожные карты и формировать стратегии развития Мы ждем, что вы: - Имеете опыт работы в качестве ML/DL Engineer не менее 3 лет. - Имеете опыт решения задач генерации аудио - Имеете опыт вывода моделей продакшн - Имеете опыт работы в исследовательских R&D-проектах - Готовы брать инициативу и не боитесь смелых вызовов Что мы предлагаем: - Сильная команда, с которой можно расти; - Работа над задачами, которые до вас никто не решал; - Возможность присоединится в компанию у самых ее истоков; - Офис в Москва Сити/БЦ Футурис (Минск) или удаленка - Гибкое начало рабочего дня (до 10:00/11:00); - Sick days; - Медицинская страховка; - Реферальная программа. По всем вопросам и cv: @hrannafindjob😊

🗣 LavaSR ● Улучшение и апскейл аудио (BWE) ● RU ● Portable by Nerual Dreming Ссылка на оригинальный GitHub:https://github.com/ysharma3501/LavaSR Ссылка на репозиторий репакера: https://github.com/timoncool/LavaSR_portable_ru Репакер:#nerual_dreming Дата обновления: 15 марта 2026 Категории:#audio, #enhancement, #BWE, #AIaudio Платформа:#Windows Язык: RU Системные требования: Windows 10/11 (64-bit), NVIDIA GTX 10xx+ (~500 МБ VRAM) или CPU, ОЗУ от 4 ГБ, Место на диске: ~2 ГБ. Совместимость: #Nvidia, #CPU 🖥Описание софта LavaSR(v2) — это новейшая компактная нейросеть для расширения полосы пропускания (Bandwidth Extension) и удаления шумов. Модель способна улучшить 5000 секунд аудио всего за 1 секунду на видеокарте, превосходя по качеству тяжелые диффузионные аналоги. Применяется для реставрации записей низкого качества, апскейла телефонных звонков и улучшения результатов работы TTS или ASR моделей. 😬Основные возможности LavaSR: 🟣 Космическая скорость: Обработка аудио в 20–80 раз быстрее реального времени на CPU и до 5000 раз быстрее на GPU. 🟣 Универсальность: Поддержка записей с любой частотой дискретизации от 8 до 48 кГц (на выходе всегда чистые 48 кГц). 🟣 Легковесность: Размер самой модели всего около 50 МБ, при этом она выдает качество лучше 6-гигабайтных аналогов. 🟣 Реставрация речи: Идеально очищает и восстанавливает глухие, шумные или сильно сжатые голосовые записи. 🟣 Удобство: Веб-интерфейс полностью на русском языке. 💿Установка и запуск ⁍ Скачайте архив с установщиком или окружением. ⁍ Распакуйте в папку без кириллицы в пути. ⁍ Запустите install.bat для установки библиотек (для установщика). ⁍ Запустите run.bat для старта веб-интерфейса. ⁍ Модели скачаются при первом запуске ➡️Скачать LavaSR Portable installer — установщик, сам все скачает ➡️Скачать LavaSR Portable env — готовое окружение под 4090 и Win 11 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее

BotsGram®

@botsgram_cu · Post #5019 · 05/09/2024, 03:05

🤖 Nuevo bot 📋 Nombre: Meeting_summarizer_bot 🆔 Nombre de usuario: @Meeting_summarizer_bot ⭐️ Calificación: ⭐️⭐️⭐️ (3.4/5 en 43 votos) ➖➖➖ ℹ️Descripción: Brifer es una IA avanzada para resumir contenido de video, audio y YouTube en más de 70 idiomas. Sube tu archivo o enlace y Brifer lo convertirá en una transcripción de texto y un resumen estructurado con marcas de tiempo. Luego, puedes hacer cualquier pregunta sobre el contenido de las reuniones o generar objetivos SMART. 🌐 Idiomas: ruso inglés 💬 Admite en línea: no 👥 Grupos: no #️⃣ Etiquetas: #IA#audio#voz#video#resumen#transcriptor

BotsGram®

@botsgram_cu · Post #5016 · 23/07/2024, 04:34

🤖 Nuevo robot 📋 Nombre: MediaTranscribeBot 🆔 Nombre de usuario: @MediaTranscribeBot ⭐️ Calificación: ⭐️⭐️⭐️⭐️ (4.3/5 sobre 124 votos) ➖➖➖ ℹ️Descripción: ¡Transcribe, resume y traduce en cualquier idioma! Cargue cualquier archivo multimedia (grabaciones de voz, clips de audio o videos) de hasta 4 horas de duración. 🌐 Idiomas: Inglés 💬 Soportes en línea: no 👥 Grupos: no #️⃣ Etiquetas: #convertidor#audio#medios#voz#texto#video#resumenador

Libreware

@libreware · Post #1114 · 09/03/2023, 22:58

https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition

12•••6789