最近帖子
第 9/37 页 · 共 441 条
发布 5月24日
利用 Meta 的 ImageBind 训练出来的多模态模型。 只使用了 文本-图像 数据进行微调就获得了很好的多模态效果。https://vxtwitter.com/yixuan_su/status/1661064018868551691
发布 5月24日
QLoRA 是一种LLM微调的新技术。 - 12小时的单个消费级GPU上训练,性能就可以达到了ChatGPT的97% - 4bit训练,但是性能与16bit相当 这个数据有点离谱。。https://twitter.com/Tim_Dettmers/status/1661379354507476994?s=20
发布 5月23日
https://vxtwitter.com/forasteran/status/1660840485244616705?s=20
发布 5月23日
微软推出开源的开发者工具Dev Home(下载链接和项目地址见下推),可以连接到GitHub账号,将开发环境部署自动化,并带来为开发人员定制的新存储卷Dev Drive,可以将高I/O负载下的应用构建时间缩短30%。 https://vxtwitter.com/sundyme/status/1661062441743319041?s=20
发布 5月23日
windows copilot 😲https://vxtwitter.com/Microsoft/status/1661045178180812805
发布 5月23日
在 @Photoshop (测试版)应用程序中引入生成式填充 - 一种通过简单的文本提示创建非凡图像的全新神奇方式,由#AdobeFirefly提供支持。https://vxtwitter.com/Adobe/status/1660964405893541888
发布 5月23日
https://twitter.com/acghnu/status/1660651153917370372
发布 5月22日
Meta AI 新作品 - Massively Multilingual Speech - 为 1,100 多种语言推出语音转文本、文本转语音等功能,语言转文本的错误率只有 Whisper 的一半 - 为 4000 多种语言训练的语言识别模型,仅有6.1%的错误率 - 使用连接时序分类CTC的技术,而不是LLMs - 今天已经公开模型和代码,以方便其他研究者使用 - 在 wav2vec2.0 的基础上构建 - 使用了一个巧妙的宗教语言数据集: - 目前最大的语音数据集仅涵盖100种语言 - 但是圣经等宗教文本已经被翻译而且有公开的录音 - 我们创建了包含1100+语言的圣经新约数据集,每种语言32小时的数据 - 在纳入其他基督教读物的无标签录音后,将可用语言数量增加到4000+ - 录音以男性为主,但是模型的男女性声音表现同样出色 - 录音是宗教内容,但模型并没有过度偏向宗教语言(还是有一点) https://ai.facebook.com/blog/multilingual-model-speech-recognition/ https://ai.facebook.com/blog/wav2vec-20-learning-the-structure-of-speech-from-raw-audio/
发布 5月20日
OpenCat 这次更新太质变了! ChatGPT3.5换成claude 1.3,速度起飞效果更好。 再创建一个claude 100k 总结机器人,打开论文全选粘贴,总结要点,随意提问,效果远超 chatPDF。https://twitter.com/waylybaye/status/1659760963179122688
发布 5月20日
这个ChatGPT插件的速度和质量达到了一个非常棒的水平
发布 5月19日
美区苹果id内购限制了怎么办? - 孤独的单机狗的回答 - 知乎 https://www.zhihu.com/question/381956875/answer/2251032474
发布 5月19日
App Store 美国区礼品卡购买地址,支持微信和支付宝 https://shop.pockyt.io/product?brand=App%20Store%20%26%20iTunes%20US