TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #425 · 20 апр.

Недавно делал быстрый прототип асинхронного приложения в котором требовалось вызывать много синхронного кода. Да, я знаю, что это не лучший дизайн, но нужно было быстрое решение на один процесс и без очередей. Поэтому я выполнял код в потоках. Выглядело это примерно так: from fastapi.concurrency import run_in_threadpool async def execute(data: DataRequest) -> DataResponse: try: result = await run_in_threadpool(sync_function, data) return DataResponse(data=result) except Exception as e: return DataResponse( error=str(e), success=False, ) В общем работает нормально. Для всех вызовов под капотом используется общий тредпул, всё работает предсказуемо. Но потребовалось изменить количество запускаемых в пуле потоков (по умолчанию создается 40 воркеров). Так как дело происходит с FastAPI, делается это через lifespan используя настройки anyio: import anyio @asynccontextmanager async def lifespan(app: FastAPI): limiter = anyio.to_thread.current_default_thread_limiter() limiter.total_tokens = 100 yield # если вдруг нужно вернуть обратно limiter.total_tokens = 40 Зачем менять количество воркеров? - уменьшить, если оперативки мало (один тред занимает ~8мб) - увеличить чтобы выдержать нагрузку Если есть предложения получше при тех же вводных - предлагайте😉 #async

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #koboldcpp

当前筛选 #koboldcpp清除筛选

👥 KoboldCpp | 本地大模型一站式工具 刚开始在本地跑大模型,往往要折腾环境依赖、库文件兼容,体验极其繁琐。后来虽然有了 Ollama、llama.cpp 这类工具简化部署,但功能单一。KoboldCpp 在此基础上走得更远:既继承了 llama.cpp 的高效推理,又保持了 Ollama 式的简单易用,只需下载一个可执行文件,就能直接运行 它不仅支持 CPU/GPU 双模式,还额外集成了 图像生成、语音识别、文字转语音 等多模态 AI 功能,并且兼容 OpenAI、Ollama 等主流 API,能无缝接入现有服务。跨平台支持 Windows、macOS、Linux,真正做到了开箱即用,对想要体验多功能本地大模型的用户来说非常友好 😎小编有话说:装环境那套折磨人,这玩意儿就是“懒人直装版” 👩‍💻KoboldCpp 标签:#KoboldCpp#大模型#本地部署#llamacpp#Ollama#AI 🗓@xiuerSearch 搜索历史资源 ✈️频道 | 💬群聊 | 📱中文包