TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3988 · 19 мар.

​🔥Как работает нейросеть? — [9:59] Нейросети уже заполонили мир, особенно ChatGPT и Midjourney, поэтому важно приблизительно понимать как они работают. В этом ролике речь пойдёт об общем строении ИИ, что такое нейрон, вес и как подбирается результат. Перейти к просмотру #видео#ai

Результаты

Найдено 1 похожих постов

Поиск: #modelefficiency

当前筛选 #modelefficiency清除筛选
Venture Village Wall 🦄

@venturevillagewall · Post #4010 · 28.01.2025, 16:00

Chinese AI Insights from DeepSeek Founder DeepSeek founder shares insights on Chinese AI developments. Highlights include: - V3 model boosts efficiency by up to 90% via Multi-head Latent Attention, saving 15% during inference via caching. - R1 Zero showcases breakthrough in RL usage without supervised fine-tuning, emphasizing LLM+RL as the next big wave. - DeepSeek's team, mostly recent graduates, is self-financed and rapidly developing competitive models. - Their 7B parameter model shows competitiveness with 70B models, indicating that efficiency and data utilization are new frontiers. For more details, check the full tweets: source #AI#RL#DeepLearning#China#Tech#Innovation#Startups#MachineLearning#ML#LLM#Investment#Quantum#Education#SelfFunding#ModelEfficiency#OpenAI#AIResearch#Efficiency#DataScience#Growth#Technology