TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #425 · 20 апр.

Недавно делал быстрый прототип асинхронного приложения в котором требовалось вызывать много синхронного кода. Да, я знаю, что это не лучший дизайн, но нужно было быстрое решение на один процесс и без очередей. Поэтому я выполнял код в потоках. Выглядело это примерно так: from fastapi.concurrency import run_in_threadpool async def execute(data: DataRequest) -> DataResponse: try: result = await run_in_threadpool(sync_function, data) return DataResponse(data=result) except Exception as e: return DataResponse( error=str(e), success=False, ) В общем работает нормально. Для всех вызовов под капотом используется общий тредпул, всё работает предсказуемо. Но потребовалось изменить количество запускаемых в пуле потоков (по умолчанию создается 40 воркеров). Так как дело происходит с FastAPI, делается это через lifespan используя настройки anyio: import anyio @asynccontextmanager async def lifespan(app: FastAPI): limiter = anyio.to_thread.current_default_thread_limiter() limiter.total_tokens = 100 yield # если вдруг нужно вернуть обратно limiter.total_tokens = 40 Зачем менять количество воркеров? - уменьшить, если оперативки мало (один тред занимает ~8мб) - увеличить чтобы выдержать нагрузку Если есть предложения получше при тех же вводных - предлагайте😉 #async

Hashtags

Резултати

Пронајдени 2 слични објави

Пребарај: #lpu

当前筛选 #lpu清除筛选
经济信息联播

@eco_cn · Post #30006 · 18.03.2026 г., 03:41

在GTC 2026主题演讲结束后,英伟达CEO黄仁勋接受了Stratechery创始人Ben Thompson的专访: AI在过去一年跨越了一个关键门槛——推理能力的提升使模型首次开始产生真实的经济价值,而编程代理的爆发则是这一转变最清晰的体现。 生成式AI早期因幻觉问题难以商业化,而推理能力的引入使模型得以通过反思、检索与搜索实现"落地",进而从提供信息跃升为真正完成任务。"搜索是一项没有人付费的服务,原因在于获取信息的门槛不足以让人掏钱。 在技术层面,由Vera Rubin GPU处理高FLOP的注意力计算,由Groq的 #LPU 架构承担需要极高token速率与极低延迟的部分。 黄仁勋将AI代理的工具使用分为两类: 一类是结构化工具,包括CLI、API和数据库查询; 另一类是非结构化工具,包括需要模型通过多模态感知操作网页界面的PC端应用。#英伟达 在两条路径上均有布局。

经济信息联播

@eco_cn · Post #29990 · 18.03.2026 г., 01:25

华尔街点评GTC: #英伟达 GTC大会释放核心信号:AI算力的商业逻辑正在发生根本性重构——Token已成为新的大宗商品,而算力即收入。 美银认为,Blackwell系统相较上一代Hopper已实现每Token成本降低高达35倍,即将推出的Rubin系列有望在此基础上再降低2至35倍,这种持续压缩的Token成本曲线,是驱动需求规模化扩张的根本动力。 高盛快评,价值高达1万亿美元的数据中心 #AIDC 营收订单,远超市场普遍预期,有助于消除投资者对于AI资本开支可能已达“峰值”的担忧。其次,英伟达推出了Groq的LPX机架系统,此举进一步巩固了对推理市场的战略承诺。 郭明錤:2026至2027年 #LPU 出货量预计达400至500万台,较历史年产量暴增10倍。机架密度从64跃至256单元,背后的 #PCB 供应链同步迎来新周期——WUS印制电路或成最大赢家。