Find similar content

@nnnoteee · Post #835 · 12/08/2025, 01:54 AM

#酷 janitorai scraper https://sleazyfork.org/zh-CN/scripts/537206-janitorai-character-card-scraper

Hashtags

@nnnoteee · Post #830 · 12/03/2025, 12:00 AM

#酷感谢我好厚密NN给我蹬了两周的大香蕉，不用去找傻逼贩子挂脚本并发。这里记录一下大香蕉的审核机制，不知道将来会是怎样的大香蕉的出图流程是在输入提示词后由g3p思考，大香蕉提炼提示词后，再传输提示词和参考图，最后生成的图片通过一层外审选择道歉或者输出（是的没错。最后生图其实是大香蕉提炼了g3p的提示词。有时候出图如果和输入的提示词不一样，那大概率就是g3p改了。当然，第三方的话有可能是贩子掺水）这个过程中，有甲的部分是g3p的思考和最后出图的外审，提炼提示词和生图是没有甲的。如果能思考但出不了图，大概率是被最后一层外审给拦住了，在谷歌的机房应该可以找得到 —- 顺带一提，两个图片都是ai，只不过右图是大香蕉生成的，把左图多出的手指给修正好了🤣

Hashtags

@nnnoteee · Post #816 · 11/19/2025, 12:03 AM

#酷 g3p还没深度测试，虽然标榜是百万上下文，但实际上到40k就有点勉强了。看得出来指令遵循变强了，很吃预设，不清楚是不是预设的问题🤔 目前各家的写作都到瓶颈了，八股不洗就不洗吧，我正则屏蔽就行了。接下来得提升逻辑、注意力、召回率和有效上下文

Hashtags

@nnnoteee · Post #813 · 11/15/2025, 12:29 PM

#酷牢梁疑似在用音声台本训练ds “”和「」有冲突，老是分不清。但「」和『』就分得很清楚，神秘

Hashtags

@nnnoteee · Post #809 · 11/04/2025, 11:41 PM

#酷贩子要急了 lmarena的请求体格式变了，用户发的消息或历史消息改成在云端存储了，完全无法注入可能大的要来了吧闹钟LLM骇客，你在哪

Hashtags

@nnnoteee · Post #806 · 10/30/2025, 12:14 PM

#酷刚好和朋友聊到，顺便整理一下在这发感觉目前的语音模型到瓶颈了。GSV目前确实是音色与情感一致性最高的，但是业务上使用时自定义音色需求更多。也就是像index-tts2那样，底模能通过参数控制情感的能力。但是带情感的数据集应该很难找，现在声音克隆领域的难点就在情感方面了，高质量的标注数据一小时几百到几千，没几万小时数据也没用换而言之，如果爬虫能通过识别说话人情感真的可以爬一套房出来🤣

Hashtags

@nnnoteee · Post #786 · 09/12/2025, 04:37 AM

#酷 gemini的世界书基本都是一排D，太深了不适合ds，基本都得改，降低深度如图是g改d。d0主要是给文风，状态栏，格式之类的，这三个之外的尽量不要D0，不管蓝灯绿灯都一样；若卡带cot最好复制进预设里面 ds的d0会被看做是user的附加要求，如果把卡的设定啥的插进去就可能会过于强调

Hashtags

@nnnoteee · Post #778 · 08/16/2025, 12:18 PM

#酷 - 推理时漏字多，就用低轮数的GPT模型 - 音色不像就换SoVITS模型 - 一般GPT模型训练10轮，SoVITS模型训练15轮，更多轮数提升不大，甚至更差 - 手动打标能提升效果 - 音频切分后手动去切完的文件夹看一下，是不是有超过10秒的音频，有超过10秒的音频会导致显存暴涨，全部低于10秒时显存占用8g左右，有超过10秒的显存占用16g占用，可以直接删掉或手动再单独切一下 - 降噪和人声分离不是必须的，降噪会降低音量 - 训练音频总长10min就可以了，超过1小时过拟合了

Hashtags

@nnnoteee · Post #763 · 06/20/2025, 12:23 AM

#酷当输出数学公式时，单美元符号表示行内公式，不要用行间公式。美元符号后的第一个符号不是空格，美元符号的前的第一个字符也不是空格。所有美元符号放到一行。非常非常实用的提示词，拯救眼睛

Hashtags