TGTGInsighttelegram intelligenceLIVE / telegram public index
← () => "翠楼屋"

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @lambdaexpression · Post #206 · 4月20日

前段时间一直被MajdataPlay的外键输入问题困扰:有玩家反映majplay会无征兆地出现拖判和吃音,但是内屏一切正常 因为我是第一次接触游戏开发,IO这方面也完全没经验 一开始我和bb本怀疑是线程调度的问题,即:IO线程时间片被其他线程挤占了,导致IO线程无法及时处理HID设备回报。为了验证这个猜想,我们尝试提高了IO线程的优先级,照旧 接下来我怀疑是我那套框架有问题:majplay是根据上一帧与这一帧的按键状态判断按键是不是"click"。为此我重写了这部分的实现,改进了IO线程与主线程之间的交互,问题照旧....... 到这里我已经怀疑这不是majplay的锅:IO线程没有任何异常,IO线程与主线程的交互没有问题,Note判定逻辑也没有问题,那就是设备确实没有回报给majplay或者设备发过来的回报中按键确实没有按下,但是大佬说hdd没有这种问题.....(人已经快崩溃了,这完全看不透也摸不着,因为我用单片机模拟玩家打高速纵连是完全没有问题的,我在家里用手台测试也没有问题) 到最后,bb本灵光一闪,说有没有可能是led刷新率过高,把按键控制板干爆炸了?我们让大佬把led刷新间隔从16ms改成100ms,吃音问题瞬间没有了,无语了 。。。。。。。。。。。。。。。。。。。。 adx是一个控制板同时管理按键和led,为什么我没有遇到吃音问题呢,因为我的手台不是adx的... #dev

Hashtags

Results

找到 59 条相似帖子

搜索 #rag

当前筛选 #rag清除筛选
Data Science Jobs

@datasciencejobs · Post #2920 · 2025/09/12 12:01

#Вакансия#RAG Всем привет! На связи команда Sprint Labs 🚀 Мы в поисках AI-инженера / Специалиста по RAG для проекта по созданию интеллектуального ассистента для психотерапевта на основе RAG-архитектуры. ✨Краткий обзор:✨ Мы ищем опытного AI-инженера для разработки прототипа интеллектуальной системы-ассистента, предназначенной для когнитивно-поведенческих терапевтов. Цель системы — автоматизировать процесс анализа данных из диагностических опросников и генерировать на их основе релевантные терапевтические гипотезы и рекомендации по применению конкретных техник. ⚡️Основная задача:⚡️ Разработать end-to-end RAG-пайплайн, который реализует следующий двухэтапный воркфлоу: - На вход система получает структурированные данные из заполненного пациентом диагностического бланка в формате JSON. - На выходе система генерирует структурированный отчет для терапевта, который включает: - Краткий диагностический анализ. - Список ключевых терапевтических мишеней. - Рекомендации по конкретным техникам с обоснованием их применимости. 🚀Ключевые технические и интеллектуальные вызовы:🚀 - Качество сегментации: От вас потребуется не просто техническая реализация, а продуманный подход к разбиению узкоспециализированных текстов на осмысленные единицы. - Логика цепочки вызовов: Необходимо грамотно спроектировать передачу данных между двумя RAG-шагами, где вывод одного является входом для поиска другого. - Точность и надежность: Система должна быть максимально точной и основываться исключительно на предоставленных источниках. Это не чат-бот общего назначения, а экспертная система. ⚡️Требуемые навыки и квалификация:⚡️ Обязательно:🔗 -Глубокое понимание и практический опыт построения RAG-систем. - Сильные навыки в Python и NLP. - Продвинутый промпт-инжиниринг. Крайне желательно:🔗 Опыт работы с фреймворками LangChain или LlamaIndex. Опыт построения многоэтапных (multi-step) или агентских LLM-воркфлоу. Будет плюсом:🔗 -Интерес к психологии или опыт работы с экспертными системами в других областях. ⚡️Условия⚡️ - Ставка в час от 1.500р - Проект с возможностью дальнейших совместных задач 🚀Ожидаемые результаты:🚀 - Рабочий прототип системы. - Документация с описанием архитектуры, выбранных моделей, стратегии сегментации и структуры промптов. - Исходный код с комментариями. Если тебя заинтересовала эта задача- отправляй резюме и пару слов о себе и своем опыте @NikaFromSL✅

Tomoko RD

@tomoko_channel · Post #682 · 2024/09/27 07:34

🔖 Chunking Strategies for LLM Applications | Pinecone #pinboard#llm#rag Learn about effective chunking strategies for improved memory retention. https://www.pinecone.io/learn/chunking-strategies/

Machinelearning

@ai_machinelearning_big_data · Post #8094 · 2025/07/17 09:14

🌟Amazon встроила векторную базу данных прямо в хранилище S3. Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%. По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову). 🟡Дальше все работает как магия Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой. Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов. 🟡Главная сила этого решения - в экосистеме. S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища. Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки. 🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch. AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch. Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью. Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions. Попробовать S3 Vectors можно в Amazon S3 console. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RAG#Amazon

Гуманитарии в цифре

@DHRIsfu · Post #815 · 2025/08/11 06:26

🙂 RAG — важная аббревиатура современного машинного обучения 🎁 RAG — retrieval-augmented generation или генерация, дополненная поиском, — подход, при котором генерация ответа большой языковой модели (LLM) осуществляется на основе данных, полученных в результате поиска по внешним ресурсам (это могут быть файлы, базы данных, веб-архивы и другие источники). 🧑‍💻 14 августа в 12:00 (Мск) Яндекс.Cloud приглашает на вебинар, посвящённый сценарию RAG на YDB (СУБД Яндекса) и тому, как реализовать семантический поиск, обогащая ответы LLM-моделей в ИИ-решениях, которые работают с текстовыми массивами знаний. 🔜Регистрация 👩‍💻 28 августа в 11:00 (Мск) провайдет Cloud.ru (в прошлом SberCloud) приглашает на вебинар о том, как с помощью Evolution Managed RAG избавить AI-агента от галлюцинаций, предоставляя релевантную информацию из ваших документов, как подготовить документы, где их хранить и как правильно настроить обработку данных для улучшения качества ответа LLM без дообучения. 🔜Регистрация Ещё по теме RAG: 🙂Размышление о пользе RAG для цифровой истории 😉Что такое RAG? — простыми словами рассказывает СБъ Иллюстрация от fusionbrain.ai по промту «retrieval-augmented generation или генерация, дополненная поиском» #ии#ai#ml#rag#термины

GitHub Trends

@githubtrending · Post #14909 · 2025/07/03 14:30

#other#agent#llm#rag Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research. https://github.com/datawhalechina/happy-llm

GitHub Trends

@githubtrending · Post #15325 · 2025/12/10 12:00

#python#agent#llm#rag#tutorial You can learn to build smart AI agents from scratch with a free, open-source tutorial called Hello-Agents by Datawhale. It covers everything from basic concepts and history to hands-on projects like creating your own AI agent framework and multi-agent systems. The course includes practical skills such as memory, context handling, communication protocols, and training large language models. By following it, you gain deep understanding and real coding experience, moving from just using AI models to designing intelligent systems yourself. This helps you develop advanced AI skills useful for jobs, research, or building innovative AI applications. The materials are online and easy to access anytime. https://github.com/datawhalechina/hello-agents

Data Science Jobs

@datasciencejobs · Post #3081 · 2025/12/23 09:03

#вакансия#fulltime#remote#senior#dataengineer#llm#rag Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG). Формат работы: Удаленка по РФ Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата) Уровень: Senior 🔷 Требования: Отличное знание Python: структуры данных, итераторы, декораторы, асинхронное и параллельное программирование, OOP и FP Уверенное владение SQL: сложные запросы, CTE, оконные функции Опыт работы с vector DB: OpenSearch, Qdrant Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища Понимание принципов RAG и обогащения LLM контекстными данными Опыт разработки промышленных ETL-сервисов на Python Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server) Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx) Опыт работы с PostgreSQL, Oracle Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg Опыт работы в JupyterLab / JupyterHub 🔷 Будет плюсом: Опыт потоковой обработки данных Опыт работы в AI / ML / LLM-проектах Понимание требований к данным для обучения и эксплуатации ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде 🔷 Обязанности: Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings) Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo Оптимизация SQL-запросов и Spark-приложений Взаимодействие с командами Data Science, ML/LLM и инфраструктуры Участие в развитии data-платформы для LLM-решений 💌 Для откликов и вопросов — писать в лс @ktvsk_d Будем рады знакомству! ❤️

Machinelearning

@ai_machinelearning_big_data · Post #9841 · 2026/04/09 13:20

🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти. Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео. Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску. Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов. Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков. 🟡Поверх графа работает Graph-Modulated Visual Memory Encoding. Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков. Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам). 🟡Третий компонент - Graph-GPO. GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных. По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга. 🟡Тесты 🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench). 🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2. При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ. В репозитории доступны: 🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB); 🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом). Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео. Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba. 🟡Arxiv 🟡Модель 🖥GitHub @ai_machinelearning_big_data #AI#ML#RAG#VRAG#TongyiLab

科技&趣闻&杂记

@kejiqu · Post #4221 · 2026/03/02 12:50

Stack Overflow 添加新功能(包括 AI Assist),重新思考“外观和感觉” Stack Overflow 宣布推出重新设计的 beta 版本,并新增多项功能,包括 AI Assist、开放式问题支持以及 Coding Challenges 等。据 DevClass.com 报道,Stack Overflow 2014 年初每月接收的问题数量超过 200,000 个,但 2025 年 12 月仅为 3,862 个,同比下降 78%。此次更新旨在改善用户体验,构建一个以人为本、AI 赋能的技术交流平台。新站点将于 4 月正式上线,用户可访问 beta.stackoverflow.com 提供反馈。Slashdot 🏷#Stack#Overflow#AI#Assist#RAG 📢频道👥群组📝投稿

AGIRussia.news (ОИИРоссия.новости)

@agirussianews · Post #2130 · 2025/08/20 13:39

🚀 20 августа 2025 Стартует RRNCB – Russian RAG Normative – Corporate Benchmark, первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной, правовой и технической документацией компаний. Почему это важно? ✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно. ✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией. ✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами. ✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе. Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов). Участие. 📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие. В вашем распоряжении будут: • Независимый лидерборд. • Управление сабмитами. • Возможность тестировать сабмиты до отправки в лидерборд. • Разделение сабмитов на категории cloud и on-prem. 🗓Даты проведения: Запуск: 20 августа Регистрация RAG решений участников: до 3го сентября Результаты: 20 сентября. Почему стоит участвовать. • Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта. Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие. • Попадание в топ лидерборда — это готовый повод для PR. • Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах. • Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды. • Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки. Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/ Инициатор проведения бенчмарка - ООО Аватар Машина. #RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource

Data Science Jobs

@datasciencejobs · Post #2658 · 2025/04/10 12:00

#вакансия#remote#AIengineer#LLM#RAG#hiring AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности. Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом. Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick. Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы. 🌍 Формат: удаленно 🧠 Уровень: Middle / Senior / Deep Thinker 💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker 📍 Гео: неважно, главное -- мышление О проекте На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ. Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение. Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности. 🔧 Технологический стек: [ ] LangChain, LlamaIndex [ ] Реализация высоконадежного Retrieval-Augmented Generation [ ] RAG, который работает в условиях реального давления, а не в демке [ ] Валидация источников и данных в реальном времени [ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья 👀 Мы ищем человека, который: [ ] Знает, что такое инженерия рассуждений, а не просто промпты [ ] Понимает, что эпистемология важнее вайрфреймов [ ] Может строить пайплайны, которые думают, а не просто индексируют [ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков) Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 2025/07/10 11:37

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

上一页第 1/5 页下一页