TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #239 · 3 мај

Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML. Из плюсов такого подхода стоит отметить вот что: 🔸 готовый, повсеместно используемый и поддерживаемый формат 🔸 простой и понятный файл, удобочитаемый для человека 🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек Но есть и минусы 🔹 затраты времени при записи файла (кодирование данных в нужный формат строки) 🔹 затраты времени при чтении файла (декодирование данных в Python объекты) 🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...) 🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда) 🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи. Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳. 🔸 очень быстрая запись 🔸 чтение значительно быстрей чем JSON, YAML итд 🔸 размер файла значительно меньше, так как нет разметки 🔸 можно записывать данные по мере поступления не загружая всё в память 🔸 можно извлечь любую часть данных независимо Из минусов 🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата) 🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию. 🔹 не так-то просто создать такой файл без специальной библиотеки В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии. (Это не означает что нельзя записать данные разного типа, просто это будет не так удобно) Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого f15d cd29 a564 4578 ... 09e2 9bc4 a696 1253 ... 84e9 4de1 3b23 c24a ... 2534 5161 28e0 709d ... ... Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла. К чему это я? Читайте в следующем посте... #tricks#basic

Резултати

Пронајдени 2 слични објави

Пребарај: #aiengineer

当前筛选 #aiengineer清除筛选
Data Science Jobs

@datasciencejobs · Post #3167 · 03.03.2026 г., 10:41

#AI#VoiceTech#DS#AIEngineer Привет, это Voximplant! Сейчас мы ищем AI Engineer для задач в направлении voice/text. 💻Мы международная SaaS компания в области облачных коммуникаций. Если быть точнее CPaaS - Communication Platform as a Service. Мы создаём платформу, которая позволяет компаниям по всему миру строить клиентские коммуникации внутри своих продуктов и бизнес-процессов. Через нашу инфраструктуру бизнесы запускают голосовые сервисы, контакт-центры, омниканальные коммуникации, автоматизацию взаимодействия с клиентами и решения на базе AI. У нас есть 2 направления бизнеса: B2B и B2D. B2B - облачные контакт-центры, B2D (business to developers) - платформа-лего для разработчиков, внутри которой можно строить свою собственную коммуникационную платформу. О Voximplant в 2026 году: С 2013 года на рынке облачных коммуникаций; 300+ сотрудников; 30 000 клиентов по всему миру; 3 млрд звонков обрабатываем в год. 🔖Задачи: Проектировать архитектуру голосовых ботов: многокомпонентные сервисы, API-интерфейсы, инструменты управления и автоматизации; Интегрировать RAG-решения, включая векторный поиск, чанкование, embedding; Погружаться в детали проектов, анализировать ограничения и выбирать подходы к реализации; Прототипировать интеграции с поставщиками (ASR, TTS, LLM, Turn Detector, Noise filter); Проводить бенчмаркинг поставщиков (latency, throughput, cost); Улучшать технические метрики продуктов (latency, количество ошибок); Развертывать модели в облаках и оборачивать их в сервисы; Развивать подходы к автотестированию в тексте и голосе; Вместе с продактом и технической командой работать над развитием продукта; Сопровождать запуски проектов для клиентов; 🖇Ожидания от будущего коллеги: Опыт проектирования комплексных LLM-систем или AI-платформ; Опыт интеграции моделей разных вендоров: OpenAI, Qwen и других; 🖇Опыт работы с ASR/TTS: управление потоками речи в реальном времени, корректное восстановление контекста после прерывания, согласование таймингов между распознаванием, ответом и синтезом речи; Понимание современных подходов к RAG, включая: работу с векторными базами данных, разработку и настройку embedding-пайплайнов. Опыт работы с function calling, tools, agents и понимание архитектуры цепочек промптов; Опыт участия, внедрения или создания внутренних инструментов для работы с LLM-инструментарием, а также их мониторинга; Уверенные навыки программирования на Python: построение пайплайнов, интеграция с API LLM и векторными базами, автоматизация процессов. Умение четко излагать технические идеи, документировать архитектурные решения и менторить коллег. ⌨️Будет плюсом: Опыт разработки платформенных решений, SDK или low-code инструментов для AI-ассистентов и поддержки команд; Знания и опыт работы с ML-мониторингом, логированием, observability и CI/CD для LLM-инструментов; Навыки проектирования мультимодальных систем: обработка текста, аудио и интеграция мультимодальных моделей. 🖱Предлагаем: Мы - продуктовая компания, которая создает технически сложный и востребованный продукт для бизнеса; Гибкое начало рабочего дня;; Работа в аккредитованной IT-компании; Одна из 2-х льгот на выбор за счет компании (с возможностью воспользоваться другой на корпоративных условиях): ДМС (Лучи), Корпоративное обучение английскому/испанскому языку до 2-х раз в неделю; Корпоративные скидки от BestBenefits; Удалённый формат работы, при желании гибрида — Московский офис находится в пяти минутах от метро Тульская, рядом с Даниловским рынком; Современные и удобные инструменты, софт и оборудование для работы. Процесс найма: Скрининг с HR; Техническое интервью; Оффер. Резюме ждёт Ольга @olgas_itrec

Data Science Jobs

@datasciencejobs · Post #2658 · 10.04.2025 г., 12:00

#вакансия#remote#AIengineer#LLM#RAG#hiring AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности. Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом. Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick. Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы. 🌍 Формат: удаленно 🧠 Уровень: Middle / Senior / Deep Thinker 💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker 📍 Гео: неважно, главное -- мышление О проекте На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ. Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение. Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности. 🔧 Технологический стек: [ ] LangChain, LlamaIndex [ ] Реализация высоконадежного Retrieval-Augmented Generation [ ] RAG, который работает в условиях реального давления, а не в демке [ ] Валидация источников и данных в реальном времени [ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья 👀 Мы ищем человека, который: [ ] Знает, что такое инженерия рассуждений, а не просто промпты [ ] Понимает, что эпистемология важнее вайрфреймов [ ] Может строить пайплайны, которые думают, а не просто индексируют [ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков) Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh