Најди сличен содржај

Изворен канал @pythonotes · Post #425 · 20 апр.

Недавно делал быстрый прототип асинхронного приложения в котором требовалось вызывать много синхронного кода. Да, я знаю, что это не лучший дизайн, но нужно было быстрое решение на один процесс и без очередей. Поэтому я выполнял код в потоках. Выглядело это примерно так: from fastapi.concurrency import run_in_threadpool async def execute(data: DataRequest) -> DataResponse: try: result = await run_in_threadpool(sync_function, data) return DataResponse(data=result) except Exception as e: return DataResponse( error=str(e), success=False, ) В общем работает нормально. Для всех вызовов под капотом используется общий тредпул, всё работает предсказуемо. Но потребовалось изменить количество запускаемых в пуле потоков (по умолчанию создается 40 воркеров). Так как дело происходит с FastAPI, делается это через lifespan используя настройки anyio: import anyio @asynccontextmanager async def lifespan(app: FastAPI): limiter = anyio.to_thread.current_default_thread_limiter() limiter.total_tokens = 100 yield # если вдруг нужно вернуть обратно limiter.total_tokens = 40 Зачем менять количество воркеров? - уменьшить, если оперативки мало (один тред занимает ~8мб) - увеличить чтобы выдержать нагрузку Если есть предложения получше при тех же вводных - предлагайте😉 #async

Hashtags

#async

Резултати

Пронајдени 1 слични објави

Пребарај: #koboldcpp

当前筛选 #koboldcpp清除筛选

秀儿の科技软件|资源分享社🎀

@JianjiaoPD · Post #9506 · 04.10.2025 г., 10:01

Најди слично Погледај

👥 KoboldCpp | 本地大模型一站式工具刚开始在本地跑大模型，往往要折腾环境依赖、库文件兼容，体验极其繁琐。后来虽然有了 Ollama、llama.cpp 这类工具简化部署，但功能单一。KoboldCpp 在此基础上走得更远：既继承了 llama.cpp 的高效推理，又保持了 Ollama 式的简单易用，只需下载一个可执行文件，就能直接运行它不仅支持 CPU/GPU 双模式，还额外集成了图像生成、语音识别、文字转语音等多模态 AI 功能，并且兼容 OpenAI、Ollama 等主流 API，能无缝接入现有服务。跨平台支持 Windows、macOS、Linux，真正做到了开箱即用，对想要体验多功能本地大模型的用户来说非常友好 😎小编有话说：装环境那套折磨人，这玩意儿就是“懒人直装版” 👩‍💻KoboldCpp 标签：#KoboldCpp#大模型#本地部署#llamacpp#Ollama#AI 🗓@xiuerSearch 搜索历史资源 ✈️频道 | 💬群聊 | 📱中文包

Hashtags

#koboldcpp #大模型 #本地部署 #llamacpp #ollama #ai