TGTGInsighttelegram intelligenceLIVE / telegram public index
← GZ学习频道

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @olddriverGDstudy · Post #102 · Oct 18

游龙历险记 孔子云:食色性也。本人自然逃不出圣人所料。于是踏上了这条不归路。能看到这篇文章的估计都已经在此道初窥门径,我便不再规劝各位,望各位好自为之。以下我分享一下个人探索世界的经历,希望各位能从其中吸取教训,少上当,多开好车。 探索篇 人生初体验: 资源途径是朋友分享的专业招嫖软件,名为51品茶。一日恰逢休假,兴致大发,遂行动。QQ约好800/pp(上门)。到了宾馆之后给她拍房卡,发送手机号,坐等上门。约半小时后,人到。人图不一,想退货,奈何是个新手在小姐的忽悠下同意了(这个小姐外形也还行)。付钱开搞。服务非常简单,口硬了开干。态度奇差,一直玩手机。一炮结束后,大为扫兴,要求退钱。小姐没同意,说给推荐其他资源。让人走了,发消息不回。两百块没了。 事后反省: 招嫖软件上的基本都是代聊,鸡头,层层转包,八百最后到小姐手机可能只有四百。尽量不要通过软件找。根据另一次经历,推测出一个人软件发布资源,然后转给鸡头,鸡头联系小姐。对小姐不要心软,人图不一的全是代聊,直接拒绝。路费都不要给。这种小姐能拿到手的都非常少,不可能有好的体验。不要对小姐的人品抱有期待,和小姐的交易必须当面完成,人走账清。 人生再探索: 去找同学玩,同学介绍了一家洗浴中心,398半套,技师年纪偏大,服务一流。不满意的可以换,多换几个总能找到个还行的。熟人带着才有全套。 事后反省: 熟人带着可以搞大活,要么就装老嫖客,技师可以私聊带出来。级别翻倍。随便搞。 斗智斗勇篇 洗浴中心第二天,同学给了一个QQ号,加上之后网上选人。888/p,本人选了两个1600。留下联系方式和房卡。约好时间,时间到了之后让转账后小姐上楼。觉得号是同学给的诚信有保障,遂给888。转账后暴露,各种借口让付另一半,小姐没上楼。期间双方斗智斗勇,互相忽悠。我想让对面给我把钱转回来,对面忽悠我转剩下的一半。最终恼羞成怒,报上我的姓名,扬言砍我一只手,(猜测酒店前台泄露了我的信息)同时发来一段视频,西瓜刀寒光四射。本人放话:有种上来。同时戴上口罩开门跑路,110已经拨好,随时可打。 反省:任何时候都不要放松警惕,哪怕同学给的资源,不见小姐不付钱。面对卖淫团伙仙人跳威胁不要怂,他刚你更刚。报警挂嘴上。(报警流程有不熟悉的建议有机会找个小事试一下,一般会问一些信息,提前准备好,比如出警地点) 安魂舒缓篇 找同学玩回来,欲找个熟女安慰一下受惊的心灵。人来略坦,无奈大莱莱迷惑了我的双眼,上门后推荐闺蜜双飞,怦然心动。共计2400。无奈服务相当机车,身材走样,下面松垮垮,除了奶子可以,其余都不行。没射出来就软了。实在下不去鸡儿。 反省:不要相信鸡头嘴里熟女这种东西,玛德二十多的他说是学生,30多的他说是二十的,四五十的才是他们嘴里的熟女。再次强调不要在床上相信小姐任何话,这时候男人每个清醒的,要谈也是提上裤子以后。 同一个地方跌倒四次: 一日兴起,招嫖,谈好价格1000pp,人来看中,付钱后准备洗漱。小姐借口自己来之前已经洗漱过了,让我自行洗漱,于是洗漱,途中和小姐聊天,指挥我洗一下鸡儿,不然口的时候不卫生。遂用肥皂擦洗,泡沫正浓时,小姐夺路而逃。跑了。又一日兴起,约好后酒店等人敲门后端详良久,这特么不是上次跑路的那个小姐,遂激动指控,逼其退钱,无奈忘记堵门,又跑了。再一日兴起,来一未成年,吓我一哆嗦,赶紧换了一个,由于兴致大起,已经洗好澡等待,准备人来直接开干。来后小姐说已经洗过澡了,没多久,提枪上马,干到一半,小姐私处异味严重,大为影响兴致。某一日,兴致再起,欲探索酒店小卡片。打电话后,人来。500一次,没啥服务,催人,质量不行,隆胸,关键隆过以后也只有B-,还特么硬,我都不敢捏,害怕摸坏了。 反省:之所以是一个地方跌倒四次,是因为开房地点都在万达中心。怀疑此地有诈。各位谨慎。小姐来了以后一定要洗澡,不论她什么借口。一定要注意卫生。不健康不说,还特么影响兴致。如果洗澡前付了钱,就同时洗澡,要么洗澡之后付钱。针对上门小姐服务机车,不认真的情况,各位可以尝试事后付款。(这点要约之前就谈好,省的浪费时间),另外远离未成年,绝对不能精虫上脑。万一被抓就不是换个星球生活的事了 云南之行: 微信约好1600包夜,小姐来到后,外形颜值良好。遂付款开整态度良好。体验良好。两炮结束后,小姐借口上厕所,卫生间内偷偷穿戴整齐,趁机夺路而逃。一日游玩结束后,浑身酸痛,想洗个澡。打车告诉司机说去洗澡。无奈司机会错意,直接拉到一家养生馆,说有当地特色。于是体验一把。没有大活298,洗澡加按摩加轻色情服务,最后大飞机。技师相当漂亮。听话。云南少数民族农村的,后悔没加微信。 反省:包夜一定要谨慎小姐偷偷溜走,思来想去只有钱给一半这个办法,这种方法也得提前说好。省的浪费时间。养生馆的小姐姐,我怎么就没要微信呢。真特么后悔。 青岛之行: 是一家spa馆,只做特殊服务的那种,小姐质量超高,服务非常机车。1399打了个飞机摸了一下奶。 反省:不要让妹妹迷失了双眼啊,看到漂亮姐姐就付钱是可耻的。 门店会员: 一家我工作城市的足浴店,挺大的,技师日常上班三四十个。质量有好有差,不满意就换,服务分档次,1000的会员,3000的会员,10000的会员。我是3000的,3000的不给口,可以打奶炮。服务挺好,单次消费666,按摩,加胸推,调情之类的,不给口,不给日。 反省:足浴店的技师因为按摩脚丫子,稍有不慎就会沾染脚气,再摸你的蛋蛋,容易引起蛋蛋瘙痒,或者各种皮肤病。要谨慎啊,事后一定要用肥皂清洗自己的二弟,别图省事用纸擦擦了事。别问我怎么知道的。 大本营: 一个外围2000两小时,相当漂亮,服务温柔,身材也好。 反省:我怎么这么穷? 作者:王一 标签:#原创,#知识,#经验反省

Results

59 similar posts found

Search: #rag

当前筛选 #rag清除筛选
Data Science Jobs

@datasciencejobs · Post #2920 · 09/12/2025, 12:01 PM

#Вакансия#RAG Всем привет! На связи команда Sprint Labs 🚀 Мы в поисках AI-инженера / Специалиста по RAG для проекта по созданию интеллектуального ассистента для психотерапевта на основе RAG-архитектуры. ✨Краткий обзор:✨ Мы ищем опытного AI-инженера для разработки прототипа интеллектуальной системы-ассистента, предназначенной для когнитивно-поведенческих терапевтов. Цель системы — автоматизировать процесс анализа данных из диагностических опросников и генерировать на их основе релевантные терапевтические гипотезы и рекомендации по применению конкретных техник. ⚡️Основная задача:⚡️ Разработать end-to-end RAG-пайплайн, который реализует следующий двухэтапный воркфлоу: - На вход система получает структурированные данные из заполненного пациентом диагностического бланка в формате JSON. - На выходе система генерирует структурированный отчет для терапевта, который включает: - Краткий диагностический анализ. - Список ключевых терапевтических мишеней. - Рекомендации по конкретным техникам с обоснованием их применимости. 🚀Ключевые технические и интеллектуальные вызовы:🚀 - Качество сегментации: От вас потребуется не просто техническая реализация, а продуманный подход к разбиению узкоспециализированных текстов на осмысленные единицы. - Логика цепочки вызовов: Необходимо грамотно спроектировать передачу данных между двумя RAG-шагами, где вывод одного является входом для поиска другого. - Точность и надежность: Система должна быть максимально точной и основываться исключительно на предоставленных источниках. Это не чат-бот общего назначения, а экспертная система. ⚡️Требуемые навыки и квалификация:⚡️ Обязательно:🔗 -Глубокое понимание и практический опыт построения RAG-систем. - Сильные навыки в Python и NLP. - Продвинутый промпт-инжиниринг. Крайне желательно:🔗 Опыт работы с фреймворками LangChain или LlamaIndex. Опыт построения многоэтапных (multi-step) или агентских LLM-воркфлоу. Будет плюсом:🔗 -Интерес к психологии или опыт работы с экспертными системами в других областях. ⚡️Условия⚡️ - Ставка в час от 1.500р - Проект с возможностью дальнейших совместных задач 🚀Ожидаемые результаты:🚀 - Рабочий прототип системы. - Документация с описанием архитектуры, выбранных моделей, стратегии сегментации и структуры промптов. - Исходный код с комментариями. Если тебя заинтересовала эта задача- отправляй резюме и пару слов о себе и своем опыте @NikaFromSL✅

Tomoko RD

@tomoko_channel · Post #682 · 09/27/2024, 07:34 AM

🔖 Chunking Strategies for LLM Applications | Pinecone #pinboard#llm#rag Learn about effective chunking strategies for improved memory retention. https://www.pinecone.io/learn/chunking-strategies/

Machinelearning

@ai_machinelearning_big_data · Post #8094 · 07/17/2025, 09:14 AM

🌟Amazon встроила векторную базу данных прямо в хранилище S3. Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%. По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову). 🟡Дальше все работает как магия Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой. Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов. 🟡Главная сила этого решения - в экосистеме. S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища. Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки. 🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch. AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch. Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью. Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions. Попробовать S3 Vectors можно в Amazon S3 console. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RAG#Amazon

Гуманитарии в цифре

@DHRIsfu · Post #815 · 08/11/2025, 06:26 AM

🙂 RAG — важная аббревиатура современного машинного обучения 🎁 RAG — retrieval-augmented generation или генерация, дополненная поиском, — подход, при котором генерация ответа большой языковой модели (LLM) осуществляется на основе данных, полученных в результате поиска по внешним ресурсам (это могут быть файлы, базы данных, веб-архивы и другие источники). 🧑‍💻 14 августа в 12:00 (Мск) Яндекс.Cloud приглашает на вебинар, посвящённый сценарию RAG на YDB (СУБД Яндекса) и тому, как реализовать семантический поиск, обогащая ответы LLM-моделей в ИИ-решениях, которые работают с текстовыми массивами знаний. 🔜Регистрация 👩‍💻 28 августа в 11:00 (Мск) провайдет Cloud.ru (в прошлом SberCloud) приглашает на вебинар о том, как с помощью Evolution Managed RAG избавить AI-агента от галлюцинаций, предоставляя релевантную информацию из ваших документов, как подготовить документы, где их хранить и как правильно настроить обработку данных для улучшения качества ответа LLM без дообучения. 🔜Регистрация Ещё по теме RAG: 🙂Размышление о пользе RAG для цифровой истории 😉Что такое RAG? — простыми словами рассказывает СБъ Иллюстрация от fusionbrain.ai по промту «retrieval-augmented generation или генерация, дополненная поиском» #ии#ai#ml#rag#термины

GitHub Trends

@githubtrending · Post #14909 · 07/03/2025, 02:30 PM

#other#agent#llm#rag Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research. https://github.com/datawhalechina/happy-llm

GitHub Trends

@githubtrending · Post #15325 · 12/10/2025, 12:00 PM

#python#agent#llm#rag#tutorial You can learn to build smart AI agents from scratch with a free, open-source tutorial called Hello-Agents by Datawhale. It covers everything from basic concepts and history to hands-on projects like creating your own AI agent framework and multi-agent systems. The course includes practical skills such as memory, context handling, communication protocols, and training large language models. By following it, you gain deep understanding and real coding experience, moving from just using AI models to designing intelligent systems yourself. This helps you develop advanced AI skills useful for jobs, research, or building innovative AI applications. The materials are online and easy to access anytime. https://github.com/datawhalechina/hello-agents

Data Science Jobs

@datasciencejobs · Post #3081 · 12/23/2025, 09:03 AM

#вакансия#fulltime#remote#senior#dataengineer#llm#rag Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG). Формат работы: Удаленка по РФ Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата) Уровень: Senior 🔷 Требования: Отличное знание Python: структуры данных, итераторы, декораторы, асинхронное и параллельное программирование, OOP и FP Уверенное владение SQL: сложные запросы, CTE, оконные функции Опыт работы с vector DB: OpenSearch, Qdrant Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища Понимание принципов RAG и обогащения LLM контекстными данными Опыт разработки промышленных ETL-сервисов на Python Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server) Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx) Опыт работы с PostgreSQL, Oracle Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg Опыт работы в JupyterLab / JupyterHub 🔷 Будет плюсом: Опыт потоковой обработки данных Опыт работы в AI / ML / LLM-проектах Понимание требований к данным для обучения и эксплуатации ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде 🔷 Обязанности: Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings) Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo Оптимизация SQL-запросов и Spark-приложений Взаимодействие с командами Data Science, ML/LLM и инфраструктуры Участие в развитии data-платформы для LLM-решений 💌 Для откликов и вопросов — писать в лс @ktvsk_d Будем рады знакомству! ❤️

Machinelearning

@ai_machinelearning_big_data · Post #9841 · 04/09/2026, 01:20 PM

🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти. Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео. Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску. Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов. Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков. 🟡Поверх графа работает Graph-Modulated Visual Memory Encoding. Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков. Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам). 🟡Третий компонент - Graph-GPO. GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных. По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга. 🟡Тесты 🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench). 🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2. При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ. В репозитории доступны: 🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB); 🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом). Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео. Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba. 🟡Arxiv 🟡Модель 🖥GitHub @ai_machinelearning_big_data #AI#ML#RAG#VRAG#TongyiLab

科技&趣闻&杂记

@kejiqu · Post #4221 · 03/02/2026, 12:50 PM

Stack Overflow 添加新功能(包括 AI Assist),重新思考“外观和感觉” Stack Overflow 宣布推出重新设计的 beta 版本,并新增多项功能,包括 AI Assist、开放式问题支持以及 Coding Challenges 等。据 DevClass.com 报道,Stack Overflow 2014 年初每月接收的问题数量超过 200,000 个,但 2025 年 12 月仅为 3,862 个,同比下降 78%。此次更新旨在改善用户体验,构建一个以人为本、AI 赋能的技术交流平台。新站点将于 4 月正式上线,用户可访问 beta.stackoverflow.com 提供反馈。Slashdot 🏷#Stack#Overflow#AI#Assist#RAG 📢频道👥群组📝投稿

AGIRussia.news (ОИИРоссия.новости)

@agirussianews · Post #2130 · 08/20/2025, 01:39 PM

🚀 20 августа 2025 Стартует RRNCB – Russian RAG Normative – Corporate Benchmark, первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной, правовой и технической документацией компаний. Почему это важно? ✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно. ✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией. ✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами. ✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе. Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов). Участие. 📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие. В вашем распоряжении будут: • Независимый лидерборд. • Управление сабмитами. • Возможность тестировать сабмиты до отправки в лидерборд. • Разделение сабмитов на категории cloud и on-prem. 🗓Даты проведения: Запуск: 20 августа Регистрация RAG решений участников: до 3го сентября Результаты: 20 сентября. Почему стоит участвовать. • Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта. Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие. • Попадание в топ лидерборда — это готовый повод для PR. • Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах. • Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды. • Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки. Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/ Инициатор проведения бенчмарка - ООО Аватар Машина. #RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource

Data Science Jobs

@datasciencejobs · Post #2658 · 04/10/2025, 12:00 PM

#вакансия#remote#AIengineer#LLM#RAG#hiring AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности. Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом. Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick. Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы. 🌍 Формат: удаленно 🧠 Уровень: Middle / Senior / Deep Thinker 💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker 📍 Гео: неважно, главное -- мышление О проекте На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ. Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение. Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности. 🔧 Технологический стек: [ ] LangChain, LlamaIndex [ ] Реализация высоконадежного Retrieval-Augmented Generation [ ] RAG, который работает в условиях реального давления, а не в демке [ ] Валидация источников и данных в реальном времени [ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья 👀 Мы ищем человека, который: [ ] Знает, что такое инженерия рассуждений, а не просто промпты [ ] Понимает, что эпистемология важнее вайрфреймов [ ] Может строить пайплайны, которые думают, а не просто индексируют [ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков) Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 07/10/2025, 11:37 AM

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

PreviousPage 1 of 5Next