TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #geminiapi

当前筛选 #geminiapi清除筛选
NEWS 鏈新聞-ABMedia

@abmedia_news · Post #24369 · 05.05.2026 г., 08:03

【🤖 AI人工智慧|Gemini API 推 Webhooks:Google 解決長任務輪詢痛點、Batch/Veo 可即時推送】 #Google#GeminiAPI#Webhooks Google 於 5 月 4 日上線 Gemini API Webhooks,解決長任務開發者頻繁輪詢的痛點。 該功能支援 Batch 與 Veo 2 結果主動推送,Logan Kilpatrick 稱此舉大幅優化 DevX。相較 OpenAI 專注消費端產品,Google 則選擇持續深耕開發者基建路線。 📍閱讀全文: https://abmedia.io/gemini-api-webhooks-event-driven-long-running-tasks-may-2026 📍 訂閱鏈新聞頻道:https://linktr.ee/abmedia.io

拔毛工 🥸

@bamaogong · Post #926 · 05.10.2025 г., 16:26

#Cloudflare#GeminiAPI#负载均衡#代理服务 部署在 Cloudflare Workers 上的 Gemini API 负载均衡器和代理服务 使用了 Durable Objects 来存储和管理 API 密钥,无论你连接的 worker 节点在属于哪个地区,最后都会转发到美国以后再向 Gemini 发起请求,不用再担心地区不支持的问题! 🧲 网站网址:http://github.com/zaunist/gemini-balance-do

🚀 Google Imagen 4 — доступен всем разработчикам! Google открыл общий доступ к мощному семейству моделей Imagen 4 для генерации изображений через Gemini API и Google AI Studio. Ключевое: 1. Три модели: ➡️Imagen 4 Fast: Скорость + низкая цена ($0.02/изображение). ➡️Imagen 4: Флагман, лучшее качество и рендеринг текста. ➡️Imagen 4 Ultra: Максимум детализации (премиум). 2. 2K разрешение: Imagen 4 и Ultra теперь генерируют изображения до 2048x2048 пикселей. 3. Безопасность: Встроенная невидимая водяная марка SynthID для ответственного ИИ. 🔥Итог: Революционные возможности генерации изображений теперь доступны разработчикам для интеграции в свои проекты. Подробности и документация на официальном сайте Google #Google#Imagen4#GeminiAPI#ИскусственныйИнтеллект#ГенерацияИзображений#AI Картинка сделана новой моделью по следующему промпту: Create a four panel comic strip in a retro style. The first panel should show a friendly cat sitting next to a Chromebook that is pulled up to the website https://ai.dev comic caption: Imagen 4 is now Generally Available! The second panel should show a dog saying “And we’re introducing Imagen 4 FAST which offers low-latency images at just $0.02 per image” panel three should show the cat saying “2K image upscaling is available too!” Panel 4 should show the cat and dog high-fiving with the caption “Try Imagen 4 in AI Studio now!” https://t.me/semasci

AI一线|ShareCentre

@ShareCentre · Post #7129 · 26.03.2026 г., 07:45

Google DeepMind 发布 Gemini API 开发者技能:用 Agent Skills 弥合模型知识鸿沟 Google DeepMind 于 3 月 25 日发文介绍其构建的 Gemini API 开发者技能(gemini-api-dev),旨在通过 Agent Skills 规范弥合大语言模型的知识鸿沟。测试显示,Gemini 3 系列模型在启用该技能后,代码生成正确率从不足 7% 大幅提升至接近 100%,但前提是模型需具备强大的推理能力。 ⚙️ 技能内容 该技能包含四部分: - API 高级功能集概览 - 当前模型和各语言 SDK 说明 - 各 SDK 基础示例代码 - 文档入口点列表(作为真实信息源) 技能已开源在 GitHub,支持通过 Vercel skills 和 Context7 两种方式安装: npx skills add google-gemini/gemini-skills --skill gemini-api-dev --global npx ctx7 skills install /google-gemini/gemini-skills gemini-api-dev 📊 评测结果 - 评测集:117 个 prompt,覆盖 Agent 编码、聊天机器人、文档处理、流式内容等场景 - 失败标准:生成的代码使用了旧版 SDK - Gemini 3.0 Pro/Flash:基线仅 6.8%,启用技能后大幅提升 - Gemini 3.1 Pro:基线 28%,启用技能后几乎全部通过 - Gemini 2.5 系列:也有提升,但远不如 3.x 系列——强推理能力是关键 - SDK Usage 类别通过率最低(95%),部分失败来自明确要求使用 Gemini 2.0 模型的 prompt 📎 相关链接 原文:https://developers.googleblog.com/closing-the-knowledge-gap-with-agent-skills/ GitHub:https://github.com/google-gemini/gemini-skills Agent Skills 规范:https://agentskills.io Google ADK Skills 文档:https://google.github.io/adk-docs/skills/ #Google#AI#AgentSkills#GeminiAPI#ADK#开发者工具