Недавно делал быстрый прототип асинхронного приложения в котором требовалось вызывать много синхронного кода. Да, я знаю, что это не лучший дизайн, но нужно было быстрое решение на один процесс и без очередей. Поэтому я выполнял код в потоках.
Выглядело это примерно так:
from fastapi.concurrency import run_in_threadpool
async def execute(data: DataRequest) -> DataResponse:
try:
result = await run_in_threadpool(sync_function, data)
return DataResponse(data=result)
except Exception as e:
return DataResponse(
error=str(e),
success=False,
)
В общем работает нормально. Для всех вызовов под капотом используется общий тредпул, всё работает предсказуемо.
Но потребовалось изменить количество запускаемых в пуле потоков (по умолчанию создается 40 воркеров).
Так как дело происходит с FastAPI, делается это через lifespan используя настройки anyio:
import anyio
@asynccontextmanager
async def lifespan(app: FastAPI):
limiter = anyio.to_thread.current_default_thread_limiter()
limiter.total_tokens = 100
yield
# если вдруг нужно вернуть обратно
limiter.total_tokens = 40
Зачем менять количество воркеров?
- уменьшить, если оперативки мало (один тред занимает ~8мб)
- увеличить чтобы выдержать нагрузку
Если есть предложения получше при тех же вводных - предлагайте😉
#async
#Open Привіт, друзі!
Ми хочемо повідомити, що на нашому порталі з'явився новий збір Терміновий збір компресор для ГУР А0656, який потребує вашої підтримки. Традиційно, закликаємо вас підтримати збір фінансово або поширенням!
Кожна гривня має значення і наближає нас до ПЕРЕМОГИ! 💙💛
Для швидкого донату ділимось з вами посиланням на монобанку.
З повагою, команда HelpUA Foundation.
🔷Web🔶Facebook🔷Instagram🔶Telegram
Colossal-AI 是新加坡的 HPC-AI Tech 推出的开源深度学习框架,以高效著称。
For ChatGPT training based on a small model with 120 million parameters, a minimum of 1.62GB of GPU memory is required, which can be satisfied by any single consumer-level GPU.
https://www.hpc-ai.tech/blog/colossal-ai-chatgpt
#open#ml