TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #1084 · 9.04

В общем, была задача на оптимизацию плана работ: есть набор заказов, и в каждом N тасков. Таски могут зависеть друг от друга или нет, имеют длительность и тип. Ещё есть M работников, каждый из которых может выполнять таски только определённых типов, причём, у каждого своя скорость. Если все таски в заказе выполнены, фирма получает сколько-то денег. У заказа есть дедлайн, за просрочку штраф (за каждый день просрочки), который вычитается из цены заказа. И ещё фирма тратит деньги за каждый день своей работы независимо от того, как загружены её сотрудники (то есть просто платит зарплаты по сути). Ещё важен учёт праздников и выходных. Нужно заработать на определённом наборе заказов и работников как можно больше денег. Полный текст задачи и код программы проверки есть в репозитории. Эта задача является изменённым заказом, который мы с напарником решали в реальной жизни: оптимизация работы печатных станков для типографии. Правда, тогда и мы справились так себе, и заказчик в итоге сначала захотел всё вручную сам делать, а потом и вовсе похоронил проект при смене директора. !!! Не читайте дальше, если хотите сначала попробовать решить самостоятельно, потому что я сейчас опишу эффективные подходы и результаты. ________________________________________ Так вот. Мы с другим экспертом Андреем сразу сели и написали разные варианты, чтобы задать шкалу, по которой будем оценивать решения команд. За пару часов я собрал примитивный жадный алгоритм, который сортировал заказы по прибыльности и укладывал в сетку кое-как, это дало нам нижнюю оценку. Мой алгоритм заработал ~75 млн виртуальных рублей, мы решили для оценки поставить нижней границей 40 млн. То есть всё, что ещё ниже, оценивалось в ноль баллов за качество оптимизации. Затем Андрей закрылся дома на три дня и вышел на свет со сложным жадным алгоритмом, который очень хитро сортировал заказы и очень хитро укладывал их в сетку, попутно выбирая разные способы этой укладки в зависимости от конкретного заказа. Это позволило заработать ~275 млн рублей. Мы сделали верхней границей для оценки 280 млн. К сожалению, в итоге только две команды из десяти прошли нижнюю границу, заработав, соответственно, ~91 и ~105 млн. К верхней границе не приблизился никто. И у четырёх команд алгоритм вообще не смог уложить без нарушений задачи в сетку (то есть, например, произвольно менял длительности, накладывал задачи друг на друга, давал одному работнику две задачи в один момент и так далее). Важной ошибкой команд, на мой взгляд, являлся тот факт, что никто не воспользовался возможностью запустить алгоритм на несколько минут и дать ему поработать. По условиям задания, можно было тянуть до 5 минут на одну оптимизацию, но по факту решения команд отрабатывали за единицы и десятки секунд. На самом конкурсе, пока команды работали, я решил попробовать сделать быстрое (по времени написания) но эффективное решение. Сначала попробовал жадную сортировку + доведение до лучшего варианта методом имитации отжига. В качестве нового состояния я просто менял местами заказы целиком. Этот вариант работал пару минут и дал мне около ~200 млн дохода. К слову, команда-лидер использовала такой же подход, просто не докрутила число итераций и температуру. Ну и потом я взял готовую либу по реализации классической генетики с особями и скрещиванием. Особью был массив с приоритетами заказов (которые конечно же нужно было аккуратно уложить чистым алгоритмом). Тип скрещивания: scattered. Всего 15 поколений по 20 особей, и это за минуту-полторы давало ~230-240 млн. Считаю, что для конкурса это самый лучший выбор: пишется одним человеком за день и даёт почти максимум, при этом легко настраивается на нужную длительность работы, легко параллелится. Ну а потом уже дома я посидел и накодил свой вариант сложного жадного с плавающим окном перебора отсортированных заказов и плавающей же укладкой по работникам. Такая штука за две минуты зарабатывает ~281 млн. Но за три дня в условиях стресса я бы такое не сделал, скорее всего. #dev

Hashtags

Резултати

Намерени 97 подобни публикации

Търсене: #apps

当前筛选 #apps清除筛选
Newlearnerの自留地

@NewLearnerChannel · Post #14513 · 15.07.2025 г., 10:04

#Apps 🧠Braintrust: LLM 开发运维多合一,测试,评估,开发,日志 Braintrust 是一个专为构建 LLM 应用设计的开发运维平台,它通过集成评估、监控与实验管理,加速 Prompt 从原型到生产环境的开发。 ✨特点 - 评估引擎:自定义标准,量化 LLM 输出质量。 - Prompt:版本化 Prompt,跟踪其性能变化,并与生产代码库同步。 - 评分器:通过代码函数或自然语言指令编写自定义评分标准,从简单的启发式规则到利用 LLM 评估。 - 数据集:将来自生产环境的用户交互数据或测试样例整合成可版本化、可扩展的测试数据集,作为评估基准。 - 日志:和主流框架结合,记录模型,Token,成本 - 追踪:生成 LLM 交互的详细执行记录,可视化展示嵌套的工具调用、检索操作和模型调用。 👨🏻‍💻使用场景 - 迭代和优化 LLM 应用:系统性地回答“修改 Prompt 后哪些案例效果变差了?”或“换用新模型后表现如何?”等问题,用工程化方法取代凭感觉的调优。 - 连接生产反馈与测试:将生产环境中的真实用户交互数据(例如用户点赞/点踩的记录)自动沉淀为评估数据集,形成持续改进的闭环。 Notion 的 AI 问答:Notion 使用 Braintrust 为其 Q&A 功能创建了数百个专项功能测试集。通过建立连接生产日志和测试数据集的持续评估流程,其问题修复能力从每天 3 个提升至 30 个。 💬 社区评价 “Braintrust 填补了评估非确定性 AI 系统这个关键且缺失的环节。” — Mike Knoop, Cofounder/Head of AI @ Notion “我从未见过像这样将‘评估’融入‘Prompt 工程’流程的工作流变革。这太惊人了。” — Malte Ubl, CTO @ Vercel “我们把所有东西都记录到 Braintrust。他们让发现和修复问题变得非常容易。” — Simon Last, Cofounder @ Codium 💰定价 - 免费:免费套餐,每月包含 100 万次追踪 和 1 万次评分,适合个人开发者和初期原型验证。 - Pro:$249/月,每月包含 5GB 处理数据和 5 万次评分,无追踪次数限制。 频道:@NewlearnerChannel

Hashtags

TONlines – News

@tonlines · Post #7117 · 08.05.2025 г., 18:42

⚡️Trending Apps: New Voting System in Telegram Apps Center #Telegram#Apps Trending Apps announces that users can now influence the ranking of Mini Apps through a new voting system in the Telegram Apps Center. Active participants will be rewarded with exclusive SBTs and Telegram Gifts. Source: link @tonlines

TONlines – News

@tonlines · Post #7012 · 01.05.2025 г., 14:51

⚡️Trending Apps: Upcoming Feature in Apps Center #Telegram#Apps Trending Apps announced a new feature in the Apps Center, aiming to enhance user engagement by allowing users to influence developments directly. This innovative approach is set to launch within the next 30 days, with more details to be revealed gradually. Source: link @tonlines

AppPie

@AppPie · Post #2062 · 08.07.2024 г., 04:03

#Apps 海棠诗社 —— 古诗词的数字桃源 🔗GitHub 特点 • 按诗集、朝代、诗人、诗词等方式检索,内容丰富,信息齐全 • 按选集、主题、节日、节气、词牌、时令、地理等方式精选分类 • 响应式布局,支持深色模式 许可证 项目采用 MIT License。 #GitHub 📮 频道 @AppPie

Hashtags

123•••89
ПредишнаСтр. 1 от 9Следваща