TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15494 · Feb 14

#cplusplus#ann_search#embedded_database#rag#vector_search#vectordb Zvec is a lightweight, open-source vector database built on Alibaba's Proxima engine that searches billions of vectors in milliseconds. You can install it instantly with a single command and start using it within seconds—no servers or complex configuration needed. It supports both dense and sparse vector embeddings, hybrid search combining semantic similarity with filters, and runs anywhere your code runs, from notebooks to edge devices. The key benefit is that you get production-grade, low-latency similarity search with minimal setup, making it ideal for AI applications like semantic search, recommendation systems, and retrieval-augmented generation without the overhead of traditional database infrastructure. https://github.com/alibaba/zvec

Results

118 similar posts found

General global search

Data Science Jobs

@datasciencejobs · Post #2790 · 06/27/2025, 06:02 AM

Вакансия: ML Engineer в крупную международную компанию 🌟 Мы — команда крупной телеком-компании, объединяющая ML-инженеров, PhD-студентов и преподавателей ведущих вузов. Работаем на стыке науки и инженерии, создавая инновационные решения в области NLP и машинного обучения. 🚀 Если у вас есть опыт работы с LLM, трансформерами, NLP, умение тренировать и дообучать модели, знание Python и библиотек для ML, опыт парсинга и обработки текстов, готовность изучать новые статьи и внедрять передовые подходы, присоединяйтесь к нашей международной R&D команде в СПб! Также важны: разговорный английский, готовность к работе офисе (часы гибкие), законченное высшее образование. 🔍Основные задачи: • Обучение и адаптация небольших LLM под конкретные задачи • Разработка и оптимизация semantic search на основе sentence transformers • Работа с бенчмарками и эксперименты для оценки качества моделей • Создание RAG-систем и AI-агентов • Разработка модулей автоматической суммаризации проектов (чтобы даже сложные задачи становились понятными) • Участие в научных публикациях • Работа над «проектом-мечтой» — вашей собственной амбициозной задачей в области ИИ! Вопросы и резюме в Telegram: @daria_hw1 #ML#LLM#Python#RAG#вакансия#работа#jobs#SPb

Data Science Jobs

@datasciencejobs · Post #2785 · 06/25/2025, 12:02 PM

#вакансия#промпт#инженер#rag#finetuning#remote Есть достаточно обьемная методология согласно которой ai должен делать оценку соискателя. Сейчас есть МВП - воркфлоу на Н8Н, но результаты автоматической генерации по методикам явно недотягивают до результатов оценки квалифицированного психолога.(полноценное тз под нда) Стек: - Prompting skills - RAG and Vector Databases - Fine-tuning Language Models - Workflow Automation (n8n) - Data Structuring with JSON - Python, langchain Компания: физ. лицо (небольшая команда) Занятость: проектная, объем работы 1-2 месяца Формат работы: удаленно Вилка: почасовая оплата от 1500 до 1800 руб/час Вариант трудоустройства: неофициальное либо договор ГПХ Только с портфолио выполненных проектов подобных задаче Ваши резюме сюда: @Biduero

GitHub Trends

@githubtrending · Post #14941 · 07/10/2025, 01:00 PM

#cplusplus#bindings#python **pybind11** is a tool that helps connect C++ and Python. It allows you to use C++ code in Python and vice versa. This means you can take advantage of C++'s speed and Python's ease of use. **pybind11** is lightweight and easy to use, making it simpler to create Python bindings for C++ code compared to older tools like Boost.Python. It supports many C++ features and works on multiple platforms, including Windows, Linux, and macOS. Using **pybind11** can make your programs smaller and faster to compile. https://github.com/pybind/pybind11

Data Science Jobs

@datasciencejobs · Post #2851 · 08/07/2025, 06:01 AM

Senior ML Researcher в крупную международную компанию Формат: офис (с гибкими часами) 🌟 Мы — команда крупной телеком-компании, объединяющая ML-инженеров, PhD-студентов и преподавателей ведущих вузов. Разрабатываем AI-агенты и тренируем LLM-модели. 🚀 Если у вас есть опыт работы с LLM, трансформерами, умение тренировать и дообучать модели; знание Python, PyTorch, Docker, SQL, GNU Coreutils, Git; готовность изучать новые статьи и внедрять передовые подходы — присоединяйтесь к нашей международной R&D команде в СПб! Важны: разговорный английский, позиция фулл-тайм офис (гибкое начало-окончание рабочего дня), законченное высшее образование. 🔍 Основные задачи: • Инструменты с ИИ для проектов в области ПО (суммирование кода, Code QA, поиск багов через LLM) • Пайплайны обучения, донастройки и оценки с LLM и анализом кода • Взаимодействие с заказчиками и экспертами • Подготовка и курирование сложных датасетов • Техническое лидерство и стратегия разработки. 👉 Вопросы и резюме в Telegram: @daria_hw1 #AI#ML#LLM#Python#RAG#вакансия#работа#jobs#SPb

GitHub Trends

@githubtrending · Post #15295 · 11/11/2025, 05:00 PM

#python#ai#faiss#gpt_oss#langchain#llama_index#llm#localstorage#offline_first#ollama#privacy#python#rag#retrieval_augmented_generation#vector_database#vector_search#vectors LEANN is a tiny, powerful vector database that lets you turn your laptop into a personal AI assistant capable of searching millions of documents using 97% less storage than traditional systems without losing accuracy. It works by storing a compact graph and computing embeddings only when needed, saving huge space and keeping your data private on your device. You can search your files, emails, browser history, chat logs, live data from platforms like Slack and Twitter, and even codebases—all locally without cloud costs. This means fast, private, and efficient AI-powered search and retrieval on your own laptop. https://github.com/yichuan-w/LEANN

IT Events RU

@iteventsru · Post #306 · 03/21/2018, 07:13 AM

🔥 Сегодня 🔥 NN IT HR meetup №1 📅 21 марта / 12:00 — 19:00 (время МСК) / Нижний Новгород, ул. Тургенева, 30 💵 Бесплатно 📝 Регистрация тут: https://goo.gl/ygC1D4 Мы начинаем традицию регулярных встреч IT HR в Нижнем Новгороде в формате митапов и приглашаем принять участие в первом мартовском мероприятии. На первой встрече обсудим практические кейсы по разным HR-областям: от привлечения новых сотрудников до реализации отдельных HR-проектов. 🔗 Программа: https://goo.gl/ygC1D4 #HR#НижнийНовгород 🔥 C++ Party 📅 21 марта / 18:30–20:30 (время Новосибирское, МСК+4) / Новосибирск, Николаева 11, 13 этаж, Точка кипения 💵 Бесплатно 📝 Регистрация тут: https://goo.gl/6weVoM В программе два доклада: об асинхронном коде и инструментах трассирования приложений в Linux. Затем мы сможем обсудить услышанное и просто пообщаться за чашкой чая. 🔗 Программа: https://goo.gl/csB8Ki #Cplusplus#backend#Новосибирск 👍По традиции, рассказываем о полезных каналах из мира ИТ: Интересное из мира Интернета и не только на новом канале https://goo.gl/YaVXTB Уже на канале видео о том, как Яндекс-автомобиль объезжает городские сугробы 🚗❄️. Посмотреть 👀

Семён: Нейросети в каждый дом

@semasci · Post #1435 · 02/02/2026, 05:08 AM

Отличная новость для всех, кто работает с документами! 🚀 На платформе Hugging Face появилась полезная и автономная модель для OCR и анализа документов: NuMarkdown-8B-Thinking. Что интересного: Это первая в мире Reasoning OCR VLM (Vision-Language Model), которая умеет "думать". В чём прорыв? Модель специально обучена превращать сложные документы (PDF, сканы, скриншоты) в идеально структурированные Markdown-файлы. Она идеально подходит для систем RAG (Retrieval-Augmented Generation), особенно если у Вас много неструктурированных данных в виде сканов... Ключевая фишка — "рассуждения": Перед тем как выдать ответ, модель генерирует внутренние "токены размышления" (<think>), чтобы проанализировать структуру документа: заголовки, таблицы, списки, сложное форматирование. Это позволяет ей блестяще справляться с нестандартными макетами. Результаты: В независимых тестах модель обходит GPT-4o и специализированные OCR-решения, а по качеству работы с документами конкурирует с гигантами вроде Gemini 2.5 Pro. При этом модель распространяется по лицензии MIT, что означает минимальные ограничения в использовании, в том числе в коммерческих целях. Попробовать демо и узнать технические детали можно здесь: hugging face Хороший шаг для автоматизации обработки документов. Технология "рассуждающего" ИИ добралась и до OCR. Что думаете? Где бы вы применили такую модель? #ИскусственныйИнтеллект#AI#OCR#Документы#RAG#HuggingFace#ВизуальныеМодели https://t.me/semasci

GitHub Trends

@githubtrending · Post #15265 · 11/03/2025, 12:00 PM

#python#ai#llm#rag#reasoning#retrieval PageIndex is an advanced AI tool that helps you find the most relevant information in long professional documents by thinking and reasoning like a human expert, rather than just matching keywords. It organizes documents into a clear tree structure, similar to a table of contents, and searches through this structure to give precise, trustworthy answers with exact page references. This method avoids the common problems of traditional vector-based search, making it ideal for complex reports, legal texts, or financial filings. You can use it easily via cloud services or run it locally, improving your ability to analyze and understand large documents quickly and accurately. https://github.com/VectifyAI/PageIndex

GitHub Trends

@githubtrending · Post #15041 · 08/09/2025, 11:30 AM

#cplusplus#ai_chat#llm_inference GPT4All lets you run powerful AI language models directly on your own computer without needing internet, cloud services, or special GPUs. This means your data stays private and secure because nothing leaves your device. You can chat with the AI, ask questions, summarize documents, write code, or create content anytime, even offline. It works on Windows, macOS, and Linux with easy installation and supports many popular AI models. You can also customize it and use it with Python or other tools. This gives you full control, privacy, and flexibility for AI tasks without extra costs or dependencies. https://github.com/nomic-ai/gpt4all

Data Science Jobs

@datasciencejobs · Post #2848 · 08/06/2025, 06:04 AM

PhD AI/ML Researcher в крупную международную компанию Формат: офис (с гибкими часами) 🌟 Мы — команда крупной телеком-компании, объединяющая ML-инженеров, PhD-студентов и преподавателей ведущих вузов. Работаем на стыке науки и инженерии, создавая инновационные решения в области NLP и машинного обучения. 🚀 Если вы – PhD-студент или PhD, у вас есть опыт работы с LLM, трансформерами, NLP, умение тренировать и дообучать модели, знание Python и библиотек для ML, опыт парсинга и обработки текстов, готовность изучать новые статьи и внедрять передовые подходы, присоединяйтесь к нашей международной R&D команде в СПб! Также важны: разговорный английский, работа фулл-тайм офис (гибкое начало-окончание рабочего дня). 🔍Основные задачи: • Обучение и адаптация небольших LLM под конкретные задачи • Разработка и оптимизация semantic search на основе sentence transformers • Работа с бенчмарками и эксперименты для оценки качества моделей • Создание RAG-систем и AI-агентов • Разработка модулей автоматической суммаризации проектов (чтобы даже сложные задачи становились понятными) • Участие в научных публикациях • Работа над «проектом-мечтой» — вашей собственной амбициозной задачей в области ИИ! 👉 Вопросы и резюме в Telegram: @daria_hw1 #AI#ML#LLM#Python#RAG#PhD#вакансия#работа#jobs#SPb

↗️Карта российского рынка GenAI: свежее исследование red_mad_robot от ноября 2025 Кратко: рынок GenAI в России выходит из стадии экспериментов и переходит к стратегическомувнедрению. 👇Оригинал в комментариях ________ Вышел крайне полезный материал по рынку GenAI от крутейшей студии ИИ-разработки red_mad_robot. Никакой рекламы, чисто уважение и большая любовь к их работе и отчетам, презентациям, статьям — всегда очень стараются в понятный, четкий и красивый минимализм. Сам придерживаюсь такого подхода в подаче информации. В общем, вот ключевые тезисы из статьи: 1️⃣В B2B-сегменте 70% российских компаний уже используют GenAI. Они фокусируются на сценариях с быстрой окупаемостью: клиентская поддержка, управление внутренними базами знаний и рост производительности труда. 2️⃣Крупный бизнес в России готов к AI-трансформации на уровнеруководства, но ему часто не хватает инфраструктуры и компетенций для масштабирования пилотных проектов. 3️⃣Рынок испытывает острый кадровый дефицит (около 10 тыс. специалистов) и нехватку венчурных инвестиций. Это вынуждает крупные корпорации выкупать экспертизу через M&A-сделки и инвестировать во внутреннее обучение. 4️⃣В B2C-сегменте наблюдается высокая осведомленность о возможностях AI (84%)и смена пользовательских привычек. 29% россиян, включая 47% молодежи, уже используют LLM в качестве поисковых систем. 5️⃣ Российский рынок «зреет» именно в части промышленного внедрения AI. В отличие от стран Запада, где часто покупают подписки на готовые сервисы, российские корпорации строят собственные R&D-центры и инфраструктуру. Санкции создают «окновозможностей», из-за которого российский рынок в практическом применении AI может стать более продвинутым, чем мировой, на горизонте 3-5 лет. ________ 👍 Ни убавить, ни прибавить. Примерно те же выводы делаю я весь 2025 год, а проблему из тезиса 2️⃣ я вообще освещал в своих комментариях на РБК, только в рамках строительной сферы (и с другого ракурса) 😎 Вообще, если интересуетесь темой или работаете с GenAI — советую и их аналитический канал почитывать. Подача та же, пользы — море. ИИ в РФ в 2030 — паровозик, который смог или всё же нет?Давайте обсудим, пишите в комменты ваши мысли🫵 Хэштеговая: #AI#ИИ#нейросети#GenAI#аналитика#redmadrobots#B2B#LLM#tech#тренды2025#RAG

GitHub Trends

@githubtrending · Post #14826 · 06/12/2025, 01:00 PM

#jupyter_notebook#ai#llm#llms#multi_modal#openai#python#rag Retrieval-Augmented Generation (RAG) is a technique that helps improve the accuracy of large language models by fetching relevant information from databases or documents. This approach ensures that the model's responses are based on up-to-date and accurate data, reducing errors and "hallucinations" where the model might provide false information. For users, RAG offers more reliable and trustworthy responses, allowing them to verify the sources used to generate those responses. This method also saves resources by avoiding the need to retrain models with new data. https://github.com/FareedKhan-dev/all-rag-techniques

123456•••910