TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15413 · Jan 14

#powershell#ai#bloatware#bloatware_removal#copilot#debloat#generative_ai#image_creator#optimizer#powershell#privacy#recall#rewrite#security#windows This PowerShell script removes all AI features from Windows 11 (like Copilot, Recall, AI in Paint/Notepad/Edge), disables registry keys, deletes packages/files, prevents reinstalls, and offers classic app replacements with backup/revert options. Run it as admin via UI or commands for a cleaner system. You gain better privacy, security, faster performance, and no unwanted bloat—full control over your PC. https://github.com/zoicware/RemoveWindowsAI

Results

59 similar posts found

Search: #rag

当前筛选 #rag清除筛选
Data Science Jobs

@datasciencejobs · Post #2920 · 09/12/2025, 12:01 PM

#Вакансия#RAG Всем привет! На связи команда Sprint Labs 🚀 Мы в поисках AI-инженера / Специалиста по RAG для проекта по созданию интеллектуального ассистента для психотерапевта на основе RAG-архитектуры. ✨Краткий обзор:✨ Мы ищем опытного AI-инженера для разработки прототипа интеллектуальной системы-ассистента, предназначенной для когнитивно-поведенческих терапевтов. Цель системы — автоматизировать процесс анализа данных из диагностических опросников и генерировать на их основе релевантные терапевтические гипотезы и рекомендации по применению конкретных техник. ⚡️Основная задача:⚡️ Разработать end-to-end RAG-пайплайн, который реализует следующий двухэтапный воркфлоу: - На вход система получает структурированные данные из заполненного пациентом диагностического бланка в формате JSON. - На выходе система генерирует структурированный отчет для терапевта, который включает: - Краткий диагностический анализ. - Список ключевых терапевтических мишеней. - Рекомендации по конкретным техникам с обоснованием их применимости. 🚀Ключевые технические и интеллектуальные вызовы:🚀 - Качество сегментации: От вас потребуется не просто техническая реализация, а продуманный подход к разбиению узкоспециализированных текстов на осмысленные единицы. - Логика цепочки вызовов: Необходимо грамотно спроектировать передачу данных между двумя RAG-шагами, где вывод одного является входом для поиска другого. - Точность и надежность: Система должна быть максимально точной и основываться исключительно на предоставленных источниках. Это не чат-бот общего назначения, а экспертная система. ⚡️Требуемые навыки и квалификация:⚡️ Обязательно:🔗 -Глубокое понимание и практический опыт построения RAG-систем. - Сильные навыки в Python и NLP. - Продвинутый промпт-инжиниринг. Крайне желательно:🔗 Опыт работы с фреймворками LangChain или LlamaIndex. Опыт построения многоэтапных (multi-step) или агентских LLM-воркфлоу. Будет плюсом:🔗 -Интерес к психологии или опыт работы с экспертными системами в других областях. ⚡️Условия⚡️ - Ставка в час от 1.500р - Проект с возможностью дальнейших совместных задач 🚀Ожидаемые результаты:🚀 - Рабочий прототип системы. - Документация с описанием архитектуры, выбранных моделей, стратегии сегментации и структуры промптов. - Исходный код с комментариями. Если тебя заинтересовала эта задача- отправляй резюме и пару слов о себе и своем опыте @NikaFromSL✅

Tomoko RD

@tomoko_channel · Post #682 · 09/27/2024, 07:34 AM

🔖 Chunking Strategies for LLM Applications | Pinecone #pinboard#llm#rag Learn about effective chunking strategies for improved memory retention. https://www.pinecone.io/learn/chunking-strategies/

Machinelearning

@ai_machinelearning_big_data · Post #8094 · 07/17/2025, 09:14 AM

🌟Amazon встроила векторную базу данных прямо в хранилище S3. Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%. По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову). 🟡Дальше все работает как магия Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой. Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов. 🟡Главная сила этого решения - в экосистеме. S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища. Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки. 🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch. AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch. Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью. Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions. Попробовать S3 Vectors можно в Amazon S3 console. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RAG#Amazon

Гуманитарии в цифре

@DHRIsfu · Post #815 · 08/11/2025, 06:26 AM

🙂 RAG — важная аббревиатура современного машинного обучения 🎁 RAG — retrieval-augmented generation или генерация, дополненная поиском, — подход, при котором генерация ответа большой языковой модели (LLM) осуществляется на основе данных, полученных в результате поиска по внешним ресурсам (это могут быть файлы, базы данных, веб-архивы и другие источники). 🧑‍💻 14 августа в 12:00 (Мск) Яндекс.Cloud приглашает на вебинар, посвящённый сценарию RAG на YDB (СУБД Яндекса) и тому, как реализовать семантический поиск, обогащая ответы LLM-моделей в ИИ-решениях, которые работают с текстовыми массивами знаний. 🔜Регистрация 👩‍💻 28 августа в 11:00 (Мск) провайдет Cloud.ru (в прошлом SberCloud) приглашает на вебинар о том, как с помощью Evolution Managed RAG избавить AI-агента от галлюцинаций, предоставляя релевантную информацию из ваших документов, как подготовить документы, где их хранить и как правильно настроить обработку данных для улучшения качества ответа LLM без дообучения. 🔜Регистрация Ещё по теме RAG: 🙂Размышление о пользе RAG для цифровой истории 😉Что такое RAG? — простыми словами рассказывает СБъ Иллюстрация от fusionbrain.ai по промту «retrieval-augmented generation или генерация, дополненная поиском» #ии#ai#ml#rag#термины

GitHub Trends

@githubtrending · Post #14909 · 07/03/2025, 02:30 PM

#other#agent#llm#rag Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research. https://github.com/datawhalechina/happy-llm

GitHub Trends

@githubtrending · Post #15325 · 12/10/2025, 12:00 PM

#python#agent#llm#rag#tutorial You can learn to build smart AI agents from scratch with a free, open-source tutorial called Hello-Agents by Datawhale. It covers everything from basic concepts and history to hands-on projects like creating your own AI agent framework and multi-agent systems. The course includes practical skills such as memory, context handling, communication protocols, and training large language models. By following it, you gain deep understanding and real coding experience, moving from just using AI models to designing intelligent systems yourself. This helps you develop advanced AI skills useful for jobs, research, or building innovative AI applications. The materials are online and easy to access anytime. https://github.com/datawhalechina/hello-agents

Data Science Jobs

@datasciencejobs · Post #3081 · 12/23/2025, 09:03 AM

#вакансия#fulltime#remote#senior#dataengineer#llm#rag Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG). Формат работы: Удаленка по РФ Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата) Уровень: Senior 🔷 Требования: Отличное знание Python: структуры данных, итераторы, декораторы, асинхронное и параллельное программирование, OOP и FP Уверенное владение SQL: сложные запросы, CTE, оконные функции Опыт работы с vector DB: OpenSearch, Qdrant Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища Понимание принципов RAG и обогащения LLM контекстными данными Опыт разработки промышленных ETL-сервисов на Python Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server) Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx) Опыт работы с PostgreSQL, Oracle Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg Опыт работы в JupyterLab / JupyterHub 🔷 Будет плюсом: Опыт потоковой обработки данных Опыт работы в AI / ML / LLM-проектах Понимание требований к данным для обучения и эксплуатации ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде 🔷 Обязанности: Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings) Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo Оптимизация SQL-запросов и Spark-приложений Взаимодействие с командами Data Science, ML/LLM и инфраструктуры Участие в развитии data-платформы для LLM-решений 💌 Для откликов и вопросов — писать в лс @ktvsk_d Будем рады знакомству! ❤️

Machinelearning

@ai_machinelearning_big_data · Post #9841 · 04/09/2026, 01:20 PM

🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти. Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео. Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску. Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов. Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков. 🟡Поверх графа работает Graph-Modulated Visual Memory Encoding. Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков. Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам). 🟡Третий компонент - Graph-GPO. GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных. По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга. 🟡Тесты 🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench). 🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2. При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ. В репозитории доступны: 🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB); 🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом). Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео. Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba. 🟡Arxiv 🟡Модель 🖥GitHub @ai_machinelearning_big_data #AI#ML#RAG#VRAG#TongyiLab

科技&趣闻&杂记

@kejiqu · Post #4221 · 03/02/2026, 12:50 PM

Stack Overflow 添加新功能(包括 AI Assist),重新思考“外观和感觉” Stack Overflow 宣布推出重新设计的 beta 版本,并新增多项功能,包括 AI Assist、开放式问题支持以及 Coding Challenges 等。据 DevClass.com 报道,Stack Overflow 2014 年初每月接收的问题数量超过 200,000 个,但 2025 年 12 月仅为 3,862 个,同比下降 78%。此次更新旨在改善用户体验,构建一个以人为本、AI 赋能的技术交流平台。新站点将于 4 月正式上线,用户可访问 beta.stackoverflow.com 提供反馈。Slashdot 🏷#Stack#Overflow#AI#Assist#RAG 📢频道👥群组📝投稿

AGIRussia.news (ОИИРоссия.новости)

@agirussianews · Post #2130 · 08/20/2025, 01:39 PM

🚀 20 августа 2025 Стартует RRNCB – Russian RAG Normative – Corporate Benchmark, первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной, правовой и технической документацией компаний. Почему это важно? ✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно. ✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией. ✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами. ✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе. Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов). Участие. 📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие. В вашем распоряжении будут: • Независимый лидерборд. • Управление сабмитами. • Возможность тестировать сабмиты до отправки в лидерборд. • Разделение сабмитов на категории cloud и on-prem. 🗓Даты проведения: Запуск: 20 августа Регистрация RAG решений участников: до 3го сентября Результаты: 20 сентября. Почему стоит участвовать. • Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта. Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие. • Попадание в топ лидерборда — это готовый повод для PR. • Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах. • Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды. • Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки. Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/ Инициатор проведения бенчмарка - ООО Аватар Машина. #RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource

Data Science Jobs

@datasciencejobs · Post #2658 · 04/10/2025, 12:00 PM

#вакансия#remote#AIengineer#LLM#RAG#hiring AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности. Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом. Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick. Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы. 🌍 Формат: удаленно 🧠 Уровень: Middle / Senior / Deep Thinker 💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker 📍 Гео: неважно, главное -- мышление О проекте На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ. Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение. Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности. 🔧 Технологический стек: [ ] LangChain, LlamaIndex [ ] Реализация высоконадежного Retrieval-Augmented Generation [ ] RAG, который работает в условиях реального давления, а не в демке [ ] Валидация источников и данных в реальном времени [ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья 👀 Мы ищем человека, который: [ ] Знает, что такое инженерия рассуждений, а не просто промпты [ ] Понимает, что эпистемология важнее вайрфреймов [ ] Может строить пайплайны, которые думают, а не просто индексируют [ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков) Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 07/10/2025, 11:37 AM

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

PreviousPage 1 of 5Next