TGTGInsighttelegram intelligenceLIVE / telegram public index
Назад кон каналите
Точки над ИИ avatar

TGINSIGHT CHAT

Точки над ИИ

@TochkiNadAI

Education

• Учимся системной работе с AI • Провожу консультации для бизнеса и команд • В канале удобная навигация, любой AI-сервис в закрепленном посте Автор: Ваня Юницкий Записаться в AI-кэмп: tochkicamp.ru Реклама: @hello_voic Чат: https://shorturl.at/gXE8C

Претплатници1.5万Тековни претплатници
Следени објави1,011Број на индексирани објави
Неодамнешен опфат42,510Збир на неодамнешни прегледи
Неодамнешни објави

Неодамнешни објави

Ознака: #llm · 17 објави

当前筛选 #llm清除筛选

Објавено 24 дек.

Уже неделю периодически юзаю новую модель от Xiaomi Называется MiMo-V2-Flash, открытая LLM с архитектурой mixture-of-experts. Формально это 309B параметров, но на каждом проходе активно всего около 15B, так что по ощущениям она работает как средняя по цене, но большая по возможностям. Делали ее кажется под рассуждения, код и агентные сценарии, но я ради эксперимента тестирую на креативных задачках, показывает неплохие результаты. По качеству MiMo-V2-Flash целится в DeepSeek-V3.2 и большие проприетарные модели. В коде и математике она сильна, в агентных цепочках и автокомплите выглядит логично и стабильно. Доступна уже сейчас. Веса на Hugging Face, API, плюс сообщество активно пилит гайды для локального запуска. Я юзаю через OpenRouter. Hugging Face проекта #llm@TochkiNadAI

5,240 views

Hashtags

Објавено 1 дек.

Небольшой гайд по API Gemini 3 Главные новые ручки в API две: thinking_level и media_resolution. Первая задает, насколько глубоко модель думает: low – когда нужен просто быстрый и дешевый ответ high – когда важно качество рассуждений и сложные задачи. Вторая управляет тем, насколько подробно модель разбирает картинки и видео, можно экономить токены на простом видео или, наоборот, выкрутить качество для слайдов и PDF с мелким текстом. Показывают примеры вызовов из Python/JS/cURL, работу с инструментами вроде google_search и url_context, а еще thoughtSignature, это скрытые подписи рассуждений, которые надо передавать дальше, чтобы длинные диалоги и function calling не теряли нить. Отдельно советуют не мудрить с промптами, оставить температуру 1.0 и, если нужен болтливый стиль попросить об этом прямо. Плюс есть раздел, как переехать с Gemini 2.5 и в каких задачах пока логично держать старые модели. С полным гайдом можно ознакомиться тут. #LLM@TochkiNadAI#coding@TochkiNadAI

3,450 views

Hashtags

Објавено 29 окт.

Для тех, кто как и я, устал подкручивать промпты в GPT под "неджипитишный" райтинг. Потестил Spiral. Это сервис на базе LLM, заточенный под живое письмо – статьи, письма, посты. Не знаю что у них за системные промпты, но очень захотелось такие себе, потому что пишет он отлично. Можно обучать чат на своем стиле, импортировать посты из соцсетей, добавлять куски текста в виде документов. Также есть рабочие пространства. Результат выдает в трех вариациях. Еще раз подчеркну, пишет прям хорошо. Лучше, чем все что я видел до этого. Есть фри токены, можно потестировать. #llm@TochkiNadAI#copywriting@TochkiNadAI

3,690 views

Објавено 28 окт.

Кстати, Андрей Карпаты недавно выкатил NanoChat — минималистичный опенсорс, в котором весь цирк LLM умещается в один репозиторий и около восьми тысяч строк. На выходе у вас будет собственный LLM-бот и отчет со всеми метриками. Цена такого развлечения около ста долларов на сервере с восемью H100 и примерно четыре часа пробега. Если восьми H100 под рукой как-то не оказалось, можно крутить на одной видеокарте дома, просто уменьшаешь батч и запастись терпением. Проект опенсорс и бесплатный, подходит тем, кто хочет быстро разобраться в архитектуре языковых моделей. А если захочется по-взрослому, автор уже намекает на более длинные пробеги за триста и тысячу долларов. В общем, отличный учебный каркас для своих маленьких ботов. Git проекта #llm@TochkiNadAI

3,380 views

Hashtags

Објавено 29 сеп.

DeepSeek выкатили новую V3.2-Exp Качество примерно как у прошлой Terminus, а цена упала больше чем в 2 раза. Они придумали DSA, это умный sparse attention. Модель не тратит ресурсы на все токены подряд, а выбирает только важные. Решает за нее специальный Lightning Indexer, быстро прикидывает, что важно, и по этим токенам считается внимание. В итоге – быстрее, дешевле и качество почти не пострадало. Работает в вебе, приложении и через API. Кому актуально – можно уже тестить. HuggingFace Github #LLM@TochkiNadAI

3,650 views

Hashtags

Објавено 16 авг.

Спрашивали как-то в комментариях: как легко запускать локально модели без танцев с бубном? У Ollama появился официальный десктопный апп для macOS и Windows. Ставите приложение, выбираете модель (Llama, Mistral, Gemma, Qwen, DeepSeek и др.) и можно: - кидать в чат PDF, код или текст для саммаризации и анализа; - загружать изображения для мультимодальных моделей; - настраивать контекст Все работает локально, офлайн без связи с облаком, с максимальным контролем над данными. Для Linux GUI пока нет, но на Mac и Windows это, пожалуй, самый простой способ запустить локально LLM за пару минут. Скачиваем тут #llm@TochkiNadAI

4,140 views

Hashtags

Објавено 23 јул.

Обновили Qwen3 И Alibaba явно собирается серьезно конкурировать с остальными моделями в номинации самый чудесный нейминг. Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B. Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название. Модель стала быстрее, проводили тесты на RTX4090. В бенчах опережает Claude 4 и DeepSeek V3. В некоторых тестах дышит в спину Gemini 2.5 Pro. Также увеличили окно контекста, что позволяет грузить больше файлов. Пу сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно. Hugging FaceПопробовать онлайн А, ну и еще вышел Qwen3-Coder. Отдельная версия для кодеров. Архитектура 480B суммарно, 35B активных. Контекст 256 000 токенов, можно растянуть до 1M. По задачам для разработки держится на уровне Claude Sonnet и GPT-4.1, а DeepSeek V3 остается позади. Hugging FaceИ также в чате #LLM@TochkiNadAI #coding@TochkiNadAI

2,830 views

Hashtags

Објавено 22 јул.

Много бесплатных ответов лучше одного платного. Найдена симпатичная мульти-эл-эл-эмная платформа. Prompt Cannon выстреливает вашим запросом сразу в два с лишним десятка моделей: GPT-4.5, GPT-4o Mini, Claude Opus/Haiku/Sonnet, Gemini Pro/Flash, Grok, DeepSeek, Perplexity, Mistral и другие (полный список около 20+ моделей). После этого ранжирует по более релевантным и подставляет ответы рядом друг с другом, чтобы вы могли выбрать наиболее подходящий вариант. Тестим тут. #LLM@TochkiNadAI

3,300 views

Hashtags

Објавено 29 мај

Perplexity запускает Labs Теперь это что-то вроде целой команды. Что делает: – пишет код – строит графики и таблицы – пишет отчёты и презы – собирает простые веб-приложения – все в одном окне Можно попросить: сделай анализ продаж за год + дашборд + интерактивную страницу с фильтрами и через 10 минут готово. Фишки: – все файлы, что генерятся, складываются в Assets, удобно скачивать и пересматривать – можно собирать мини-приложения прямо внутри интерфейса – AI сам планирует шаги, сам гуглит, сам пишет код и сам отлаживает Для креативщиков и продюсеров – способ быстро превратить идею в прототип. Для команд – шанс делать быстрые MVP. Попробовать можно уже сейчас, если вы на Pro-подписке. #creative@TochkiNadAI #documents@TochkiNadAI #llm@TochkiNadAI

3,230 views

Ну а Grok теперь умеет генерить пдф-ки Описываете задачу и добавляете: создай PDF. У меня получилось только с третьей попытки, сперва выдавал ошибки, но любезно предлагал их исправить. Я, конечно же, соглашался, и как оказалось – не зря. Работает бесплатно, тестить тут. #documents@TochkiNadAI#llm@TochkiNadAI

3,110 views

Објавено 29 апр.

Вышла Qwen3 Сегодня Alibaba анонсировала обновление своей LLM, которая включает как большие модели, так и более компактные версии, обеспечивая баланс между производительностью и эффективностью. Особенности: Гибридное мышление: возможность выбора между режимом размышлений для сложных задач и быстрым ответом для простых. Многоязычная поддержка: теперь доступно 119 языков и диалектов, что значительно расширяет возможности использования модели. Улучшенная производительность: улучшенные агентные возможности и поддержка MCP для интеграции и адаптации модели в различные рабочие процессы. Qwen3 был оптимизирован для работы с кодированием и агентными способностями. Модель теперь лучше взаимодействует с окружением, справляется с вызовами в реальном времени и использует MCP для улучшенной работы с агентами и инструментами, сокращая количество необходимого кода и ускоряя выполнение задач. Тут релиз и ссылки на платформы. #LLM@TochkiNadAI

3,130 views

Hashtags

Објавено 16 апр.

OpenAI только что представили две новые модели — o3 и o4-mini o3 — самая мощная модель OpenAI, делает меньше критичных ошибок, умеет глубоко анализировать визуальные данные, код, научные и бизнес-задачи. o4-mini — компактная, но умная. Оптимизирована под скорость, дешевле, идеально подходит для массового использования. Обе модели умеют использовать инструменты ChatGPT (поиск, код, анализ файлов) самостоятельно и стратегически, что приближает нас к “агентному” ИИ. Модели умеют думать с изображениями — не просто распознают, а используют их в логике рассуждений. Продолжаем пытаться не запутаться в нейминге моделей😭 Тут подробности. #LLM@TochkiNadAI

3,360 views

Hashtags

12
ПретходнаСтраница 1 од 2Следна