TGTGInsighttelegram intelligenceLIVE / telegram public index
← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Harbor, cargo port, ships #AI#artificial_Intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

404 Information

@Info404 · Post #65329 · 22/04/2026 02:04

OpenAI推出GPT-Image-2 模型 具备“思考”的图像功能已向 ChatGPT Plus、Pro 和 Business 用户开放(企业版即将推出),底层模型 gpt-image-2 已在 API 中可用。 ChatGPT Images 2.0是OpenAI首个具备“思考”能力的图像模型。无需参考图、仅凭简短提示词,即可生成以假乱真的TikTok截图、论文海报、商品广告。 Thinking能力的加入,使得模型可以处理更复杂的任务,在准确性、时效性、一致性和视觉连贯性上有更加强大的表现。 在API中,ChatGPT Images 2.0最高支持生成2K分辨率的图像。 它还具备更强的多语言理解能力、支持最宽3:1、最窄1:3的图片比例、一次提示最多可生成8个输出,并且图中的角色和物体能保持连续性。 ChatGPT Images 2.0 的知识库已更新至 2025 年 12 月,具备能够端到端完成各类复杂任务的智能——无论是撰写文案、进行分析,还是进行设计构图,都能胜任并交付专业成果。 在大模型竞技场上,ChatGPT Images 2.0已登顶第一,并且在文本到图像任务中,断层领先第二名Nano Banana 2 240分。 🗒 标签: #OpenAI#GPT#AI#图像 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

Machinelearning

@ai_machinelearning_big_data · Post #8465 · 06/09/2025 11:15

📌Почему языковые модели галлюцинируют. OpenAI опубликовали исследование о причинах галлюцинации LLM. Галлюцинации - это не мистический сбой в сознании ИИ, а вполне предсказуемый побочный эффект его обучения. Представьте, что перед моделью стоит задача бинарной классификации - определить, является ли предложенное утверждение корректным или нет. Математическая выкладка в исследовании проста: уровень ошибок генерации как минимум в 2 раза превышает уровень ошибок классификации. Если модель не способна надежно отличить факт от вымысла, она неизбежно будет этот вымысел генерировать. 🟡Все начинается еще на претрейне. Даже на идеально чистых данных статистические цели обучения подталкивают модель к генерации ошибок. Особенно это касается фактов, которые редко встречаются в обучающей выборке. В работе вводится понятие singleton rate — доля фактов, которые появились в данных лишь один раз. Теоретический расклад показывает, что уровень галлюцинаций модели будет как минимум равен этой доле. Проще говоря, если 20% фактов о днях рождения в датасете встретились единожды, модель будет выдумывать дни рождения как минимум в 20% случаев. 🟡Эксперименты это подтверждают. Модель DeepSeek-V3, на просьбу назвать день рождения одного из авторов статьи, трижды выдала неверные даты: 03-07, 15-06 и 01-01. Ни одна из них не была даже близка к правильной (осенью). В другом тесте, где нужно было сосчитать количество букв D в слове DEEPSEEK, та же DeepSeek-V3 выдавала 2 или 3, а модели компании Марка Цукерберга и Claude 3.7 Sonnet доходили до 6 и 7. При этом базовые модели после претрейна часто показывают отличную калибровку. Например, у предобученной GPT-4 ожидаемая ошибка калибровки составляла всего 0.007, что говорит о высокой статистической адекватности ее предсказаний. Кто бы сомневался. 🟡Почему галлюцинации не исчезают после пост-тренинга и RLHF? Ответ на этот вопрос - в системе оценки. Большинство современных бенчмарков поощряют угадывание. Модели, по сути, постоянно находятся в режиме сдачи экзамена, где за правильный ответ дают 1 балл, а за пустой бланк или ответ я не знаю - 0. В такой системе оптимальная стратегия при неуверенности - только угадать. Любой шанс на правильный ответ лучше, чем гарантированный ноль. Эту гипотезу подтвердили анализом популярных оценочных наборов. В GPQA, MMLU-Pro, Omni-MATH, SWE-bench и HLE используется строго бинарная система оценки (правильно/неправильно). Возможности получить частичный балл за честное признание в незнании там просто нет. Из 10 рассмотренных в исследовании популярных бенчмарков только один, WildBench, присуждает частичные баллы за ответы формата я не знаю. Остальные же фактически наказывают модель за отказ галлюцинировать, создавая эпидемию штрафов за неуверенность и поощряя ее выдавать правдоподобную ложь. 🟡Что делать инженерам. OpenAI предлагает встраивать явные целевые уровни уверенности в рубрики, вводить поведенческую калибровку и оценивать модели по секциям с разными порогами уверенности. Еще рекомендуют включают мониторинг singleton-rate на корпусе, измерение вероятности важных ответов, комбинирование RAG с верификацией фактов и изменение лидербордов чтобы ответы я не знаю не штрафовались автоматически. 🔜Читать статью полностью @ai_machinelearning_big_data #AI#ML#LLM#Research#OpenAI

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #2369 · 21/06/2024 02:47

🚀 GPT-5 将达到博士水准! OpenAI 首席技术官 Mira Murati 表示,GPT-4 是聪明的高中生,而 GPT-5 将在一年半后发布,达到博士级别。这个消息对AI领域是个巨大的推动,不仅在科研上,更在实际应用上将带来深远影响。 📌 想了解更多关于AI的发展趋势?点击链接查看详细内容👇 Digitaltrends #AI#GPT5#OpenAI#未来科技

OKHK 👀

@iokhk · Post #9230 · 02/04/2026 05:46

Multica - AI Agent 协作统一管理平台 https://multica.ai/ https://github.com/multica-ai/multica https://fxtwitter.com/jiayuan_jy/status/2039241051605791028 感觉适合小团队用起来 将 AI Coding Agent 变成真正的队友。 分配任务、跟踪进度、积累技能 —— 在一个地方管理你的人类 + Agent 团队。 不再需要复制粘贴 prompt,不再需要盯着运行过程。你的 Agent 出现在看板上、参与对话、随着时间积累可复用的技能。支持 Claude Code 和 Codex。 #AI#Tool#DevOps#GitHub#Golang

AI для продакта 🧠🚀

@aiforproduct · Post #599 · 21/03/2025 14:44

🔍 Сравнение цен API языковых моделей Разбираемся в ценах на API популярных языковых моделей и находим оптимальные варианты для разных потребностей. Указано вход/выход, 1М. ➡️GigaChat (Sber) Lite / 2 Lite: Простые задачи — 190-200 ₽ за 1M токенов. Бесплатно для физлиц: 900 тысяч токенов на год Pro / 2 Pro: Средние задачи — 1455-1500 ₽ за 1M токенов. Бесплатно для физлиц: 50 тысяч токенов на год Max / 2 Max: Сложные задачи — 1852-1950 ₽ за 1M токенов. Бесплатно для физлиц: 50 тысяч токенов на год Для юрлиц и больших пакетов (от 200M) цена падает ➡️Yandex Cloud (синхронный/асинхронный) YandexGPT 3 Lite: Эконом — 200 ₽ / 120 ₽ . YandexGPT 3 Pro: Умный (аналитика и длинные тексты) — 1200 ₽/ 600 ₽. ➡️Gemini (Google) 2.0 Flash-Light: Эконом — $0.075/$0.30 2.0 Flash: Текст+картинки — $0.10-$0.70/$0.40. Зависит от того, что используете (текст, картинки, аудио) 1.5 Flash-8B: Лёгкие задачи — $0.0375-$0.075/$0.15-$0.30 (зависит от размера запроса: ниже 128K токенов — дешевле, выше — дороже) 1.5 Flash: Быстрые задачи — $0.075-$0.15/$0.30-$0.60 (зависит от размера запроса) 1.5 Pro: Умные задачи — $1.25-$2.50/$5-$10 (до 128K токенов — дешевле, больше — дороже) ➡️DeepSeek V3: Чат — $0.07-$0.27/$1.10 (дешевле ночью: $0.035/$0.55) R1: Умные ответы — $0.14-$0.55/$2.19 (дешевле ночью: $0.035/$0.55) Цена зависит от кэша (hit — дешевле, miss — дороже) и времени суток (ночью скидки до 75%) ➡️Claude (Anthropic) 3.5 Haiku: Быстрый — $0.80/$4 3.7 Sonnet: Умный — $3/$15 3 Opus: Сложные задачи — $15/$75 ➡️OpenAI o3-mini: Эконом-ум — $1.10/$4.40 o1: Сложные задачи — $15/$60 GPT-4o mini: Быстрые задачи — $0.15/$0.60 GPT-4o: Текст+картинки — $2.50/$10 GPT-4.5: Креатив — $75/$150 ➡️Grok (xAI) 2-1212: Текст — $2/$10 2-vision-1212: Текст+картинки — $2+$2/$10 📎Модели самые дешевые: - для простых задач (чат-боты): DeepSeek V3 (ночью) и Gemini 1.5 Flash-8B. - для сложных задач (аналитика, длинные тексты): DeepSeek R1 и Gemini 1.5 Pro. 📌А вы каким API пользуетесь? #ИИ#AI#Нейросети#API ——— #Инструменты ✍️Подписывайтесь: @aiforproduct

12•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••536537538539540•••550•••600•••650•••700•••750•••800•••838839