Post #419

@Only4Share

自我|技能|提升|网课|资源分享

Views3,220Post view count

PostedMay 1305/13/2023, 12:05 PM

Post content

Meta 开源多模态LLM ImageBind，可跨 6 种不同的模态——图像、文本、音频、深度、热能和 IMU 数据 ImageBind 据说可以通过声音来直接生成图像。自动根据视频内容来生成文案和字幕，并匹配上合适的背景音乐。还有可能通过一首歌，直接为歌手生成一段视频 MV。 #AI#多模态 Github Blog-Holistic AI learning across six modalities