#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning
VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work.
https://github.com/OpenBMB/VoxCPM
拥有专属维基词条的研究论文
https://x.com/tikalteacall/status/1938282898865508585
这个 X 线程不错,分享了 100 篇左右维基百科评选的史上最具影响力或最重要的论文合集。
比如 1974 年的《作为一只蝙蝠是怎样的体验》,以及目前讨论得比较多的 Attention Is All You Need,还有《论随机鹦鹉的危险:语言模型会不会太大?》这些大模型相关重要文献, 可以 AI 跑报告来快速了解,挺有趣的。
#academic
经典有趣的论文推荐
Ask HN: What are the best papers you read in your life?
这个帖子不错,分享了很多有趣经典的论文,包括自然科学和社会科学在内的各种研究。现在网络文章大多信息密度太低,噪点多,而真正凝练有价值的内容还是在书籍和文献中,我后面也会多挖掘分享各领域论文相关期刊和内容。
前面我分享了不少杂志文章订阅源,还有些论坛帖子推荐,可以结合看。下面就分享帖子里提到的一些有趣论文:
A Mathematical Theory of Communication
香农的「通信的数学理论」
Proof of an External World
如何确认自己是不是「缸中之脑」
Best linguistics paper ever: “The perception of rhythm in language”
语言学与韵律
The Universe of Minds
心灵设计:哲学和人工智能的结合
POSSIBLE GIRLS
模态实在论与平行宇宙
“I’m Not Mopping the Floors, I’m Putting a Man on the Moon”: How NASA Leaders Enhanced the Meaningfulness of Work by Changing the Meaning of Work
关于领导力的论文
Reference
有趣的论坛讨论
AI 前沿文献研究列表的追踪网站
我的阅读系统
#academic
AI(GPT4V) 和人文科学的未来
Translating Latin demonology manuals with GPT-4 and Claude.
11 creative ways to use GPT-4's vision features in ChatGPT.
这两篇文章可以结合看。第一篇作者使用 GPT4 和 Claude2 翻译一本 1200 页的魔鬼学(Demonology)书籍,主要通过 OCR 文本放入模型中翻译并提取,最终结论是 Claude 在处理和提取更长上下文文本时优于 GPT4(100k tokens),LLM 将成为辅助原始材料翻译和分析时必不可少的工具,但无法替代研究员。
AI 人文科学的研究实例(Digital Humanities)我前面有分享文章,提到 AI 在模拟人社会行为时可以提供大量有效参考样本。这里 AI 主要辅助史学研究和学术遗产处理,AI 可以根据不完美原材料提供猜测,如早期印刷时「光学字符识别 OCR」出现的乱码文本;大型语言模型拥有大量历史数据背景;再结合目前的 GPT Vision 版本可以更全面总结和分析材料。
AI could replace humans in social science research
第二篇文章介绍了 GPT4V 主要用途,作为多模态版本(Vision/ Voice), GPT4V 可以在编程中根据截图和绘图重建仪表板、解释图片模因、教育辅导/作业分析、设计建议等,最后也提到了在历史手稿中的破解和翻译(OCR 识别),人文学科的游戏规则改变。
德国社会学家尼古拉斯·卢曼,一生共创作 90000 多条 Zettelkasten 卡片笔记,50 多本书、数百篇论文、150 多份未出版手稿。现在关于卢曼学术遗产翻译和编辑的项目仍在继续,其中一个项目已持续到 2030 年(Niklas Luhmann – Theorie als Passion. Wissenschaftliche Erschließung und Edition des Nachlasses)。而卢曼的卡片盒笔记都是手写纸质卡(Antinet Zettelkasten),滑片箱作为沟通伙伴,以母语德语手写为主,因此其学术遗产翻译量和难度巨大,而现在 GPT4V 或将能助攻和加速该项目。
Reference
关于卢曼介绍 Zettelkasten 原始论文
#AI#academic
学术研究利器丨文献、图谱与 AI
这个专题其实从频道初就有想法,一直没确定适合的 COMBO 内容。关于学术研究的利器,主要是对前沿文献的处理,文献趋势追踪(包括 RSS 技术)、文献图谱过滤以及 AI 处理都是最适合的。其它工具的、单独文献库的则不算。
这个频道每一个单独主题都会持续更新,Telegram 作为我的「动态知识库」,后续会建立索引。我也非常感谢很多小伙伴提供很多有用有意思的工具,这里属于每一个人。我频道主题分享很少使用 similar site,google related 这样处理,其中用到的工具多是比较系统的联系在一起,涌现并形成一种 COMBO 能力。
---
The Observatory of International Research:今天的发现,根据研究趋势和期刊排名来陈列当前前沿文献研究内容,几乎涵盖所有学科,追踪领域前沿内容。
Ask a question, get conclusions from research papers:AI 处理,提出问题并从文献研究中得出结论。昨天在「封装系 AI」中。
Summit Keyword Graph:论文关键词可视化图谱,点击节点随即推出相关论文信息及溯源 paper source,对于论文追踪,主题写作很有用。
Connected Papers:同上,非常强的相关论文推荐、展示与可视化。
---
Research Rabbit:又一个文献 dig 利器。可视化、个性化推荐、关键词图谱,Similar Work 等功能确实不错,UI 差点意思。
Literature Review:根据某个主题关键词输入,直接生成文献综述和引用文献列表。
Elicit:同上,根据主题推荐文献,并形成摘要一览,也有过滤等。(加持 chatgpt4)
Paperdigest:人工智能总结文献,给定文献链接 DOI 直接生成总结摘要,适用文献浏览泛读。这个也算文献利器相关。
---
arXiv Xplorer:加持 openai 的 arXiv 关键词搜索。
PubMed 图谱
Athena
Athena 是专门为 AI 研究员推荐 AI 文献的网站,可以 Bookmark 相关论文以及订阅你搜索的主题。
Semantic Scholar?
这是 AI 驱动的免费文献搜索研究工具,搜索文献时的分类/联系/索引非常强大。
reference
RSS 源的全平台烧制
可视化图谱
科塔学术导航
封装系 AI
#AI#academic