TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #672 · 28.11

Впервые сделал крупный проект (под NDA, так что не расскажу, какой) на облачных функциях. Впечатления противоречивые. Изначально программисты арендовали компьютер в датацентре: или целиком или кусочек. На нём теоретически можно делать что угодно, но для запуска своих программ нужно было настроить операционную систему, безопасность и авторизацию, установить нужные исполнительные модули, программы для удобства деплоя, мониторинг нагрузки итд. Поэтому появились сервисы, которые это всё делают за тебя, а тебе дают буквально окно, куда можно написать свой код и запускать его удалённо на чужой машине. Конкретно я пользовался решением от Яндекса, чей протокол скопирован напрямую с Amazon Web Services. Причём, в документации не только открыто об этом говорится, но ещё и в некоторых местах перенаправляют на доки от Amazon. И SDK предлагают тоже использовать амазоновский. До санкций я бы сказал, что это не так плохо — можно использовать что-то привычное тем, кто уже работал с Amazon. Но сейчас привязка к американскому сервису выглядит скорее жирным минусом. Не знаю, есть ли у Яндекса ресурсы на какое-то серьёзное разделение. Судя по состоянию документации и платформы в целом — нет. Yandex Cloud кажется системой, которая активно развивалась несколько лет назад, а сейчас подзаброшена. Среда выполнения .NET отстаёт от актуальной на две версии (3.1 вместо 6, четвёртой версии не существует). Изначально мой проект был написан как обычное контейнеризированное приложение на .NET 6, а потом я переводил его на функции. Пришлось пройтись по всему коду и переписать несовместимые куски с C#10 на C#8, это было не слишком приятно. Документации фактически нет, а там, где есть, много путаницы. В примерах написано одно, по факту другое: например в функцию вместо объекта Request приходит просто строка, а разбирать её надо самому. Авторизацию я нашёл только на Stackoverflow. Интересно, что адекватных доков про неё не было ни у Яндекса, ни у Amazon. Функция выполняется и выгружается, поэтому ваша программа не должна рассчитывать на наличие постоянно живущего процесса. Мне пришлось вытащить из неё большой словарь, который грузится при старте, и положить уже подготовленные данные из него в Object Storage — это такое горячее файловое хранилище, там же рядом с функциями. Справедливости ради, работает это всё быстрее, чем я думал. Удалось запихнуть в функции даже сравнительно большой проект с кучей классов, создающий при запуске несколько десятков объектов и производящий загрузку из сети с декомпрессией. Другой важный плюс — бесплатная квота довольно внушительная: миллион вызовов и 10Гб*часов оперативной памяти в месяц. Для пет проекта вы сможете вообще не покупать сервер. Но если сервер у вас всё-таки есть, деплой вы уже настроили, то удобнее будет, конечно, делать как привычно. И гибкости больше. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #embeddings

当前筛选 #embeddings清除筛选
Data Science Jobs

@datasciencejobs · Post #3075 · 17.12.2025 г., 15:00

#вакансия#mlops#engineer#llm#vllm#hugginface#rag#embeddings#k8s#docker#deckhouse#Langfuse#LlamaIndex#remote Вакансия: MLOps-инженер Компания: АО СимбирСофт Формат работы: удалёнка Занятость: полная занятость Ищем MLOps инженера в РФ 👨‍💻 🚀 Нам нужен инженер, готовый развивать инфраструктуру LLM-платформы. Твоими задачами станут поддержка и развитие сервисов для больших языковых моделей, интеграция инструментов, настройка мониторингов и обеспечение безопасности данных. 🔍 Опыт работы с: - Большими языковыми моделями (vLLM, TGI, Hugging Face) - Python (FastAPI, скрипты, CLI) - Архитектурой RAG и embedding-моделями - Prometheus/Grafana - Система аутентификации (Keycloak, JWT) - Kubernetes, Docker, CI/CD 💡 Будут полезны знания: - Deckhouse или других дистрибутивов Kubernetes - Langfuse, LlamaIndex, PostgreSQL Vector, Chroma - Принципов MLOps и интеграции сторонних API ✅Условия: - Удаленный формат работы. - Гибкое начало рабочего дня. - Широкий технологический стек, сотни проектов. Можно разрабатывать IT-решения для разных отраслей, пробовать новые технологии. - Помогаем прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком. - Имеем развитую систему наставничества, проходим сертификацию за счет компании, участвуем в конференциях. Активно обмениваемся опытом, проводим внутренние и внешние митапы, прокачиваем hard и soft skills. Присоединяйся к нам!✨ Если заинтересовала вакансия, буду рада обсудить в тг: https://t.me/gulnara_s28 ʕ ᵔᴥᵔ ʔ

GitHub Trends

@githubtrending · Post #15556 · 12.03.2026 г., 12:30

#typescript#ai#ai_agents#coding#deno#embeddings#insforge#nextjs#oauth2#pgvector#postgresql#realtime#vectors#websockets InsForge is an open-source backend platform for AI coding agents, offering easy auth, Postgres database, S3 storage, edge functions, and model gateway via a simple semantic layer. Agents fetch context, configure services, and inspect state to build full-stack apps quickly. Set up locally with Docker or use cloud deploys. It boosts agent accuracy 1.7x, speed 1.6x, and cuts tokens 30% vs. rivals, letting you prototype and ship AI-driven apps faster with less hassle and cost. https://github.com/InsForge/InsForge

GitHub Trends

@githubtrending · Post #14800 · 07.06.2025 г., 11:30

#java#anthropic#chatgpt#chroma#embeddings#gemini#gpt#huggingface#java#langchain#llama#milvus#ollama#onnx#openai#openai_api#pgvector#pinecone#vector_database#weaviate LangChain4j helps you add powerful AI to your Java applications by making it easy to use Large Language Models (LLMs). It provides a simple way to switch between different LLMs and embedding stores without needing to learn each one's specific API. This means you can easily experiment with different models and tools, making your development process faster and more flexible. LangChain4j also offers many examples and tools to help you build complex AI applications quickly, such as chatbots and retrieval systems. This simplifies the integration of AI into your projects, allowing you to focus on creating better applications. https://github.com/langchain4j/langchain4j

GitHub Trends

@githubtrending · Post #15253 · 30.10.2025 г., 12:30

#go#agent#agentic#ai#chatbot#chatbots#embeddings#evaluation#generative_ai#golang#knowledge_base#llm#multi_tenant#multimodel#ollama#openai#question_answering#rag#reranking#semantic_search#vector_search WeKnora is a powerful tool that helps you understand and find answers in complex documents like PDFs and Word files. It uses advanced AI to read documents, understand what they mean, and answer your questions in a simple way. This tool is useful for businesses and researchers because it can quickly find information from many documents, making it easier to manage knowledge and make decisions. It also supports multiple languages and can be used privately, ensuring your data stays safe. https://github.com/Tencent/WeKnora