TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15421 · Jan 18

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

Results

1 similar post found

Search: #aipoweredmetaverse

当前筛选 #aipoweredmetaverse清除筛选
Метаверсошная

@olya_tashit · Post #3329 · 12/16/2024, 07:02 AM

Поглядываю, куда движется наш прости господи AI-powered метаверс. Сегодня пару слов про вклад компании Niantic - это ребята, которые делали покемон го (а потом оказалось, что они так нас заставляли собирать данные о физическом мире. Умно 😂) У Ниантика есть идея-фикс - оцифровать весь мир в 3D виде и перенести на карту. И для этого у них есть сервис Scaniverse (на iOS и Андроидах). Ставите, выбираете, как будете сканировать - обычным методом, известным как фотограмметрия, или методом gaussian splatting. Разница между первым и вторым в том, что первый дает на выходе капец какую тяжелую 3D модель из полигонов, а второй создает 3D сцену из "размытых пятен", которая описывается математической гауссовой функцией (не спрашивайте, я гуманитарий 😭) Короче, это быстрее и эффективнее. ИИ помогает эти пятна вычислять и улучшать. И считается, что это и есть наш путь к легкому и быстрому созданию 3D контента, примерно как сейчас мы снимаем видео. Хотя мне не нравится то, как GS модели выглядят сейчас - вблизи они выглядят как вермишель. Но со временем станет лучше. Так вот, Scaniverse. Я не особо стараясь отсканила Егора на балконе (Егор - это растение), телефон у меня уже староват для этих ИИ извращений (Pixel 6), а обработка скана происходит на устройстве. Так что он нагревался 20 минут, а потом выдал вот такой скан - ссылка. Также Ниантик выпустили сервис на шлемы Квест для просмотра всего этого великолепия в виаре. Сервис надо запускать, открыв браузер на квесте, и набрав ссылку intothescaniverse.com Егором полюбоваться у меня не получилось, потому что они еще не сделали авторизацию для андроида. Но чужие сканы и сам сервис мне понравились - записала видосик. Особенно эффект и звук открывания моделек, когда прыгаешь внутрь. Что-то такое из sci-fi фильмов про телепортацию. #AI#Niantic#GaussianSplatting#AIPoweredMetaverse