Воспроизводим аудиофайлы
Для этого воспользуемся кроссплатформенным пакетом playsound, который легко устанавливается через pip.
Он содержит в себе лишь одну полезную функцию для воспроизведения аудиофайла: playsound('path/to/file.mp3')
В качестве параметра функции можно указать путь к .mp3 или .wav файлу, или вообще его url.
#audio
Three Double Top Detected At The Same Time 👇
#AUDIO#HOOK#ARPA
How do you like it? Create your own signals and never miss opportunities.
www.coinlegs.com
¿Qué puede hacer este bot?
@YTBADBOT
Este bot ayuda a descargar audio de cualquier vídeo o podcast de YouTube.
Idioma: Inglés
#youtube#audio#videos#podcast
(Visto en @BotsGram_Cu)
SonoBus
SonoBus is an easy to use application for streaming high-quality, low-latency peer-to-peer audio between devices over the internet or a local network.
Android-İOS-Linux-MacOS-Windows
https://github.com/sonosaurus/sonobus
#sonobus#audio#music
https://github.com/tyiannak/pyAudioAnalysis
#pyAudioAnalysis is a Python library covering a wide range of audio analysis tasks. Through pyAudioAnalysis you can:
Extract #audio features and representations (e.g. mfccs, spectrogram, chromagram)
Classify unknown #sounds
Train, parameter tune and evaluate classifiers of audio segments
Detect audio events and exclude silence periods from long recordings
Perform supervised segmentation (joint segmentation - classification)
Perform unsupervised segmentation (e.g. speaker diarization)
Extract audio thumbnails
Train and use audio regression models (example application: emotion recognition)
Apply dimensionality reduction to visualize audio data and content similarities
🌟Audio Flamingo Next: открытая аудио-языковую модель от NVIDIA
Audio Flamingo Next (AF-Next) - аудио-языковая модель, обученная на корпусе из 1 млн часов аудио и 108 млн примеров для генерации подробных текстовых описаний аудиозаписей: перечисление инструментов, звуковых событий и музыкальных характеристик того, что звучит на записи. Максимальная длина входного аудио - 30 минут.
Релиз закрывает отставание мультимодальных систем в работе со звуком: речью, музыкой и окружающими шумами на длинных записях.
🟡Архитектура собрана из 4-х блоков:
🟢Кодировщик AF-Whisper (128-канальная лог-мел-спектрограмма, окно 25 мс, шаг 10 мс, выход 50 Гц);
🟢Двухслойный MLP-адаптер;
🟢Qwen-2.5-7B с расширенным контекстом 128K токенов;
🟢Потоковый TTS-модуль для голосовых диалогов.
Фишка архитектуры - Rotary Time Embeddings: угол поворота токена привязывается к реальной временной метке аудио, что дает модели устойчивое временное рассуждение.
🟡Релиз состоит из 3-х версий
AF-Next-Captioner: модель, заточенная под детальное описание аудио. Она генерирует подробные текстовые описания аудиозаписей: перечисляет инструменты, звуковые события, спикеров и музыкальные характеристики того, что звучит на записи, с привязкой к таймкодам.
На распознавании инструментов Medley-Solos-DB она набирает 92,13 против 85,80 у Audio Flamingo 2.
На музыкальных описаниях SongCaps, где качество оценивает GPT-5, показатели покрытия и корректности выросли с 6,7 и 6,2 у AF3 до 8,8 и 8,9.
AF-Next-Instruct: универсальная инструктивная версия, после GRPO для повседневных задач: ответов на вопросы по аудио, голосовых ассистентов, транскрипции речи и перевода.
Именно она устанавливает новые планки среди LALM по ASR.
WER 1,54 на LibriSpeech. На LongAudioBench 73,9 против 60,4 у закрытой Gemini 2.5 Pro (в варианте с речью разрыв еще больше - 81,2 против 66,2.)
AF-Next-Think: ризонинг-версия с Temporal Audio Chain-of-Thought: модель привязывает каждый шаг рассуждения к конкретной временной метке в аудио, что делает ее пригодной для разбора длинных записей, где нужно собирать факты из разных моментов (анализа совещаний, интервью, подкастов, трейлеров и сюжетных аудиоисторий).
75,01 на MMAU-v05.15.25 и 58,7 на более жестком MMAU-Pro, что выше, чем у Gemini-2.5-Pro (57,4).
📌Лицензирование: NVIDIA OneWay Noncommercial License.
🟡Страница проекта
🟡Arxiv
🟡Demo
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#MMLM#Audio#AudioFlamingo#NVIDIA
LosslessCut
#Lossless#video#audio#editor
Electron based. Linux windows or mac
LosslessCut aims to be the ultimate cross platform FFmpeg GUI for extremely fast and lossless operations on video, audio, subtitle and other related media files. The main feature is lossless trimming and cutting of video and audio files, which is great for saving space by rough-cutting your large video files taken from a video camera, GoPro, drone, etc. It lets you quickly extract the good parts from your videos and discard many gigabytes of data without doing a slow re-encode and thereby losing quality. Or you can add a music or subtitle track to your video without needing to encode. Everything is extremely fast because it does an almost direct data copy, fueled by the awesome FFmpeg which does all the grunt work.
https://github.com/mifi/lossless-cut
💥Auriculares OneOdio Pro10 DJ
Sumérgete en el mundo de la música con calidad profesional
✅OFERTA: 24.8€
❌ Antes: 45.99€
💰Ahorras un 46%🔥
Escucha cada detalle con nitidez y precisión para una experiencia única
👉 Descubre la excelencia auditiva ahora
#rebajas#auricularesdj#estudiodegrabacion#musica#ofertas#descuentos#audio#invierno
🛰️Oferta publicada en Cultura y Ocio
The best free Audacity Alternatives
https://www.ghacks.net/2021/07/04/the-best-free-audacity-alternatives/
All alternatives listed below lack at least one of the main characteristics of Audacity. They are either only available for one operating system, e.g. Windows, not open source, don't offer the same set of core features, or lack in other departments.
Audacity Forks
Audacity is an open source project, and developers started to fork the application as soon as the announcement hit the Internet that the project team changed.
Forks match all main characteristics of Audacity, but there is no "main" fork yet that all disgruntled developers and users switched to.
Here is a link to a promising forks (because it is updated regularly)
https://github.com/cookiengineer/audacity
Another
https://github.com/SartoxOnlyGNU/audacium
📡@nogoolag📡@libreware
#alternatives#audacity#audio#editor