Тут уже несколько дней народ играется с генерацией музыки по текстовому описанию. Идея такая же, как с картинками: ты пишешь фразу, тебе нейросетка по ней создаёт трек.
На деле реализовано чуть более топорно: текстовый препроцессор разбирает фразу и ищет контекстную близость до слов из специального списка тегов. Ну, например, он считает слово "weed" (трава, конопля) близким к жанру "reggie", вот и подставляет.
Эти теги передаются в облачный API сервиса Mubert (да, никакого опенсорса на этот раз), и оно выдаёт трек.
Я попробовал тоже. По примерам из статей я уже было подумал, что окончательно решена проблема "не подобрать трек для нового видео". Но увы. Результат на деле (а не в рекламе) такой же не впечатляющий, как и с картинками.
Эта штука сносно генерирует всякие эмбиенты и другие спокойные треки, но на более сложных жанрах сразу загибается и очень сильно недокручивает и темп, и агрессию и разнообразие музыкальных фраз. Я после часа попыток не смог сделать ничего для быстрого интенсивного полёта дрона, только для плавного и медленного. Ну и очень часто неправильно улавливает контекст, даже даже открыто писать, что примерно ты от неё хочешь (вот как с треком Помпеи — вообще мимо, слишком спокойная и не грустная мелодия).
Первые два трека сгенерировал @wooferclaw. Он не хейтер ML, в отличие от меня, поэтому у него больше терпения и, вероятно, он смог дольше перебирать варианты. Но всё равно на мой взгляд какой-то намёк на правильную идею есть, а развития совсем нет.
Музыканты, можете выдохнуть.
#dev
🤖Создавай ботов и ассистентов с доступом к большим объемам информации!
В нашем сервисе вы можете создавать Telegram-ботов и GPTs-ассистентов, используя векторные базы данных.
Это позволяет:
• Боту искать релевантную информацию в базе данных для ответа на запрос
• Загружать большие массивы данных без перегрузки контекста в чате с моделью
Смотрите наш подробный скринкаст, где мы показали как создать и использовать векторную базу данных в GPTunneL
🌐YouTube |
🌐Rutube
#b2b@gptunnel#assistant@gptunnel#bd@gptunnel
Рейтинг архитектурных фирм в области S+T
Отчет BD+C's 2025 Giants 400 Report представляет передовые компании в архитектуре научно-технических сооружений в США. Лидерами стали Gensler, Page и HDR с выручкой более $100 млн каждая. Эти компании фокусируются на разработке лаборатоий, исследовательских зданий и производственных предприятий.
Gensler занимает первое место с выручкой в $133,5 млн, подчеркивая свою неоспоримую позицию на рынке. Другие участники, такие как HOK и Flad Architects, также играют значительную роль в создании инновационных объектов.
Отчет демонстрирует, как архитектура играет ключевую роль в научно-техническом прогрессе. Это подтверждает важность интеграции инженерии и дизайна в современном строительстве.
#Архитектура#НаукаИТехнологии#СтроительныеТренды#BD+C2025
@stroynewsrussia