TGTGInsighttelegram intelligenceLIVE / telegram public index
← GZ学习频道

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @olddriverGDstudy · Post #29 · Mar 17

搜索使用说明 #搜索指南 因为电报软件对中文搜索支持不好,大队特别对队内资源搜索进行了整理汇集,使用方法说明如下: 1.1 原理: 电报对中文搜索支持不佳,汉字只有在前后含有asic码字符的前提下可以被正确搜索出,如 _广州修车大队_ (“_”指代空格)、(广州修车大队);等形式可以搜索“广州修车大队”搜索出相关信息;搜索“广州”等未被asic码间隔的汉字无法正确显示。 为正确搜索,在编制频道资源时,对重要信息可以采取Hashtag的形式已方便搜索,即以"#"字符开头,接汉字,以“空格字符”结尾的形式,点击一个hashtag即可快速定位该频道或聊天群内所有相同标签,建议所有管理在编辑重要资料包括ls信息、广播台、学习频道时正确使用hashtag。 !!注意标签不要随意编写,要参考搜索指南中有的标签类型!! 1.2 JS资源定位: JS目前支持 Hasgtag(#K老师)、数字标签(#GZ003)的搜索方式,在对应榜单和报告区中试用上述方式均可查找到JS的相关信息。 使用举例:在“广州公开榜”或“广州修车大队”的搜索栏中输入 #K老师 或 #GZ003,均可定位到K老师资料页;在报告区的搜索栏中输入#K老师 或 #GZ003,均可定位到K老师的验证报告。这两者是快速了解JS基本信息和评价的便捷办法。 1.3 标签查找 公榜榜单目前均支持标签查找,可以快速定位某种类型或地区的所有JS,目前仅支持Hashtag查找,目前常用标签解释如下: 地区标签: 一定要使用一级标签,例如 #天河区(注意不要有错别字) #颜值: 不解释 #服务: 评价中92、95的,有场子出身花式水平的,均会归入此类; #大胸: 不解释,一般D以上归入此类; #长腿: 不解释,一般168以上归入此类; #身材: 不解释,较为宽松; #嫩妹: 22岁以下或者长相很嫩的,白小纯的,loli系的,cos系的归入此类; #熟女: 30岁以上风韵犹存的,归入此类; #特服: 提供3p、3t、wt、字母等特殊服务的JS归入此类。 使用举例:在红榜的搜索栏中输入 #长腿,可以快速查看“莉贝伦”等8位长腿JS。 类型标签评价目前非常主观,有不妥之处请队内私信 JackJack 或其他管理人员修改。 1.4 资料查找 目前学习频道中试用hashtag来快速定位资料,目前使用的标签有如下几种: #安全CJ#素质CJ#卫生CJ #搜索指南 #大队玩法 #语录#秀哥语录 #技巧#知识

Results

59 similar posts found

Search: #rag

当前筛选 #rag清除筛选
Data Science Jobs

@datasciencejobs · Post #2920 · 09/12/2025, 12:01 PM

#Вакансия#RAG Всем привет! На связи команда Sprint Labs 🚀 Мы в поисках AI-инженера / Специалиста по RAG для проекта по созданию интеллектуального ассистента для психотерапевта на основе RAG-архитектуры. ✨Краткий обзор:✨ Мы ищем опытного AI-инженера для разработки прототипа интеллектуальной системы-ассистента, предназначенной для когнитивно-поведенческих терапевтов. Цель системы — автоматизировать процесс анализа данных из диагностических опросников и генерировать на их основе релевантные терапевтические гипотезы и рекомендации по применению конкретных техник. ⚡️Основная задача:⚡️ Разработать end-to-end RAG-пайплайн, который реализует следующий двухэтапный воркфлоу: - На вход система получает структурированные данные из заполненного пациентом диагностического бланка в формате JSON. - На выходе система генерирует структурированный отчет для терапевта, который включает: - Краткий диагностический анализ. - Список ключевых терапевтических мишеней. - Рекомендации по конкретным техникам с обоснованием их применимости. 🚀Ключевые технические и интеллектуальные вызовы:🚀 - Качество сегментации: От вас потребуется не просто техническая реализация, а продуманный подход к разбиению узкоспециализированных текстов на осмысленные единицы. - Логика цепочки вызовов: Необходимо грамотно спроектировать передачу данных между двумя RAG-шагами, где вывод одного является входом для поиска другого. - Точность и надежность: Система должна быть максимально точной и основываться исключительно на предоставленных источниках. Это не чат-бот общего назначения, а экспертная система. ⚡️Требуемые навыки и квалификация:⚡️ Обязательно:🔗 -Глубокое понимание и практический опыт построения RAG-систем. - Сильные навыки в Python и NLP. - Продвинутый промпт-инжиниринг. Крайне желательно:🔗 Опыт работы с фреймворками LangChain или LlamaIndex. Опыт построения многоэтапных (multi-step) или агентских LLM-воркфлоу. Будет плюсом:🔗 -Интерес к психологии или опыт работы с экспертными системами в других областях. ⚡️Условия⚡️ - Ставка в час от 1.500р - Проект с возможностью дальнейших совместных задач 🚀Ожидаемые результаты:🚀 - Рабочий прототип системы. - Документация с описанием архитектуры, выбранных моделей, стратегии сегментации и структуры промптов. - Исходный код с комментариями. Если тебя заинтересовала эта задача- отправляй резюме и пару слов о себе и своем опыте @NikaFromSL✅

Tomoko RD

@tomoko_channel · Post #682 · 09/27/2024, 07:34 AM

🔖 Chunking Strategies for LLM Applications | Pinecone #pinboard#llm#rag Learn about effective chunking strategies for improved memory retention. https://www.pinecone.io/learn/chunking-strategies/

Machinelearning

@ai_machinelearning_big_data · Post #8094 · 07/17/2025, 09:14 AM

🌟Amazon встроила векторную базу данных прямо в хранилище S3. Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%. По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову). 🟡Дальше все работает как магия Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой. Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов. 🟡Главная сила этого решения - в экосистеме. S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища. Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки. 🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch. AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch. Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью. Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions. Попробовать S3 Vectors можно в Amazon S3 console. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RAG#Amazon

Гуманитарии в цифре

@DHRIsfu · Post #815 · 08/11/2025, 06:26 AM

🙂 RAG — важная аббревиатура современного машинного обучения 🎁 RAG — retrieval-augmented generation или генерация, дополненная поиском, — подход, при котором генерация ответа большой языковой модели (LLM) осуществляется на основе данных, полученных в результате поиска по внешним ресурсам (это могут быть файлы, базы данных, веб-архивы и другие источники). 🧑‍💻 14 августа в 12:00 (Мск) Яндекс.Cloud приглашает на вебинар, посвящённый сценарию RAG на YDB (СУБД Яндекса) и тому, как реализовать семантический поиск, обогащая ответы LLM-моделей в ИИ-решениях, которые работают с текстовыми массивами знаний. 🔜Регистрация 👩‍💻 28 августа в 11:00 (Мск) провайдет Cloud.ru (в прошлом SberCloud) приглашает на вебинар о том, как с помощью Evolution Managed RAG избавить AI-агента от галлюцинаций, предоставляя релевантную информацию из ваших документов, как подготовить документы, где их хранить и как правильно настроить обработку данных для улучшения качества ответа LLM без дообучения. 🔜Регистрация Ещё по теме RAG: 🙂Размышление о пользе RAG для цифровой истории 😉Что такое RAG? — простыми словами рассказывает СБъ Иллюстрация от fusionbrain.ai по промту «retrieval-augmented generation или генерация, дополненная поиском» #ии#ai#ml#rag#термины

GitHub Trends

@githubtrending · Post #14909 · 07/03/2025, 02:30 PM

#other#agent#llm#rag Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research. https://github.com/datawhalechina/happy-llm

GitHub Trends

@githubtrending · Post #15325 · 12/10/2025, 12:00 PM

#python#agent#llm#rag#tutorial You can learn to build smart AI agents from scratch with a free, open-source tutorial called Hello-Agents by Datawhale. It covers everything from basic concepts and history to hands-on projects like creating your own AI agent framework and multi-agent systems. The course includes practical skills such as memory, context handling, communication protocols, and training large language models. By following it, you gain deep understanding and real coding experience, moving from just using AI models to designing intelligent systems yourself. This helps you develop advanced AI skills useful for jobs, research, or building innovative AI applications. The materials are online and easy to access anytime. https://github.com/datawhalechina/hello-agents

Data Science Jobs

@datasciencejobs · Post #3081 · 12/23/2025, 09:03 AM

#вакансия#fulltime#remote#senior#dataengineer#llm#rag Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG). Формат работы: Удаленка по РФ Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата) Уровень: Senior 🔷 Требования: Отличное знание Python: структуры данных, итераторы, декораторы, асинхронное и параллельное программирование, OOP и FP Уверенное владение SQL: сложные запросы, CTE, оконные функции Опыт работы с vector DB: OpenSearch, Qdrant Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища Понимание принципов RAG и обогащения LLM контекстными данными Опыт разработки промышленных ETL-сервисов на Python Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server) Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx) Опыт работы с PostgreSQL, Oracle Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg Опыт работы в JupyterLab / JupyterHub 🔷 Будет плюсом: Опыт потоковой обработки данных Опыт работы в AI / ML / LLM-проектах Понимание требований к данным для обучения и эксплуатации ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде 🔷 Обязанности: Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings) Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo Оптимизация SQL-запросов и Spark-приложений Взаимодействие с командами Data Science, ML/LLM и инфраструктуры Участие в развитии data-платформы для LLM-решений 💌 Для откликов и вопросов — писать в лс @ktvsk_d Будем рады знакомству! ❤️

Machinelearning

@ai_machinelearning_big_data · Post #9841 · 04/09/2026, 01:20 PM

🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти. Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео. Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску. Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов. Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков. 🟡Поверх графа работает Graph-Modulated Visual Memory Encoding. Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков. Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам). 🟡Третий компонент - Graph-GPO. GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных. По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга. 🟡Тесты 🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench). 🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2. При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ. В репозитории доступны: 🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB); 🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом). Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео. Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba. 🟡Arxiv 🟡Модель 🖥GitHub @ai_machinelearning_big_data #AI#ML#RAG#VRAG#TongyiLab

科技&趣闻&杂记

@kejiqu · Post #4221 · 03/02/2026, 12:50 PM

Stack Overflow 添加新功能(包括 AI Assist),重新思考“外观和感觉” Stack Overflow 宣布推出重新设计的 beta 版本,并新增多项功能,包括 AI Assist、开放式问题支持以及 Coding Challenges 等。据 DevClass.com 报道,Stack Overflow 2014 年初每月接收的问题数量超过 200,000 个,但 2025 年 12 月仅为 3,862 个,同比下降 78%。此次更新旨在改善用户体验,构建一个以人为本、AI 赋能的技术交流平台。新站点将于 4 月正式上线,用户可访问 beta.stackoverflow.com 提供反馈。Slashdot 🏷#Stack#Overflow#AI#Assist#RAG 📢频道👥群组📝投稿

AGIRussia.news (ОИИРоссия.новости)

@agirussianews · Post #2130 · 08/20/2025, 01:39 PM

🚀 20 августа 2025 Стартует RRNCB – Russian RAG Normative – Corporate Benchmark, первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной, правовой и технической документацией компаний. Почему это важно? ✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно. ✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией. ✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами. ✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе. Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов). Участие. 📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие. В вашем распоряжении будут: • Независимый лидерборд. • Управление сабмитами. • Возможность тестировать сабмиты до отправки в лидерборд. • Разделение сабмитов на категории cloud и on-prem. 🗓Даты проведения: Запуск: 20 августа Регистрация RAG решений участников: до 3го сентября Результаты: 20 сентября. Почему стоит участвовать. • Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта. Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие. • Попадание в топ лидерборда — это готовый повод для PR. • Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах. • Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды. • Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки. Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/ Инициатор проведения бенчмарка - ООО Аватар Машина. #RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource

Data Science Jobs

@datasciencejobs · Post #2658 · 04/10/2025, 12:00 PM

#вакансия#remote#AIengineer#LLM#RAG#hiring AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности. Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом. Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick. Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы. 🌍 Формат: удаленно 🧠 Уровень: Middle / Senior / Deep Thinker 💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker 📍 Гео: неважно, главное -- мышление О проекте На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ. Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение. Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности. 🔧 Технологический стек: [ ] LangChain, LlamaIndex [ ] Реализация высоконадежного Retrieval-Augmented Generation [ ] RAG, который работает в условиях реального давления, а не в демке [ ] Валидация источников и данных в реальном времени [ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья 👀 Мы ищем человека, который: [ ] Знает, что такое инженерия рассуждений, а не просто промпты [ ] Понимает, что эпистемология важнее вайрфреймов [ ] Может строить пайплайны, которые думают, а не просто индексируют [ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков) Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 07/10/2025, 11:37 AM

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

PreviousPage 1 of 5Next