TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #1084 · 9.04

В общем, была задача на оптимизацию плана работ: есть набор заказов, и в каждом N тасков. Таски могут зависеть друг от друга или нет, имеют длительность и тип. Ещё есть M работников, каждый из которых может выполнять таски только определённых типов, причём, у каждого своя скорость. Если все таски в заказе выполнены, фирма получает сколько-то денег. У заказа есть дедлайн, за просрочку штраф (за каждый день просрочки), который вычитается из цены заказа. И ещё фирма тратит деньги за каждый день своей работы независимо от того, как загружены её сотрудники (то есть просто платит зарплаты по сути). Ещё важен учёт праздников и выходных. Нужно заработать на определённом наборе заказов и работников как можно больше денег. Полный текст задачи и код программы проверки есть в репозитории. Эта задача является изменённым заказом, который мы с напарником решали в реальной жизни: оптимизация работы печатных станков для типографии. Правда, тогда и мы справились так себе, и заказчик в итоге сначала захотел всё вручную сам делать, а потом и вовсе похоронил проект при смене директора. !!! Не читайте дальше, если хотите сначала попробовать решить самостоятельно, потому что я сейчас опишу эффективные подходы и результаты. ________________________________________ Так вот. Мы с другим экспертом Андреем сразу сели и написали разные варианты, чтобы задать шкалу, по которой будем оценивать решения команд. За пару часов я собрал примитивный жадный алгоритм, который сортировал заказы по прибыльности и укладывал в сетку кое-как, это дало нам нижнюю оценку. Мой алгоритм заработал ~75 млн виртуальных рублей, мы решили для оценки поставить нижней границей 40 млн. То есть всё, что ещё ниже, оценивалось в ноль баллов за качество оптимизации. Затем Андрей закрылся дома на три дня и вышел на свет со сложным жадным алгоритмом, который очень хитро сортировал заказы и очень хитро укладывал их в сетку, попутно выбирая разные способы этой укладки в зависимости от конкретного заказа. Это позволило заработать ~275 млн рублей. Мы сделали верхней границей для оценки 280 млн. К сожалению, в итоге только две команды из десяти прошли нижнюю границу, заработав, соответственно, ~91 и ~105 млн. К верхней границе не приблизился никто. И у четырёх команд алгоритм вообще не смог уложить без нарушений задачи в сетку (то есть, например, произвольно менял длительности, накладывал задачи друг на друга, давал одному работнику две задачи в один момент и так далее). Важной ошибкой команд, на мой взгляд, являлся тот факт, что никто не воспользовался возможностью запустить алгоритм на несколько минут и дать ему поработать. По условиям задания, можно было тянуть до 5 минут на одну оптимизацию, но по факту решения команд отрабатывали за единицы и десятки секунд. На самом конкурсе, пока команды работали, я решил попробовать сделать быстрое (по времени написания) но эффективное решение. Сначала попробовал жадную сортировку + доведение до лучшего варианта методом имитации отжига. В качестве нового состояния я просто менял местами заказы целиком. Этот вариант работал пару минут и дал мне около ~200 млн дохода. К слову, команда-лидер использовала такой же подход, просто не докрутила число итераций и температуру. Ну и потом я взял готовую либу по реализации классической генетики с особями и скрещиванием. Особью был массив с приоритетами заказов (которые конечно же нужно было аккуратно уложить чистым алгоритмом). Тип скрещивания: scattered. Всего 15 поколений по 20 особей, и это за минуту-полторы давало ~230-240 млн. Считаю, что для конкурса это самый лучший выбор: пишется одним человеком за день и даёт почти максимум, при этом легко настраивается на нужную длительность работы, легко параллелится. Ну а потом уже дома я посидел и накодил свой вариант сложного жадного с плавающим окном перебора отсортированных заказов и плавающей же укладкой по работникам. Такая штука за две минуты зарабатывает ~281 млн. Но за три дня в условиях стресса я бы такое не сделал, скорее всего. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #trainingdata

当前筛选 #trainingdata清除筛选
AI & Law

@ai_and_law · Post #750 · 26.01.2026 г., 08:04

🇺🇸TRAIN Act: U.S. Congress Moves Toward Mandatory AI Training Transparency Bipartisan lawmakers have introduced the Transparency and Responsibility for Artificial Intelligence Networks (TRAIN) Act in the U.S. House, aiming to give copyright holders access to AI training records to determine whether their works were used to train generative AI models without consent or compensation. The bill, led by Rep. Madeleine Dean (PA-04) and Rep. Nathaniel Moran (TX-01), follows a Senate version reintroduced by Senators Peter Welch, Marsha Blackburn, Adam Schiff, and Josh Hawley. This is the first time the TRAIN Act has been introduced in the House. The proposal is modeled on enforcement mechanisms used in online piracy cases and responds to the current lack of any clear process for creators to verify whether their content was ingested into training datasets. The bill has support from major creator and rights-holder organizations, including the Recording Industry Association of America (RIAA) and SAG-AFTRA, alongside groups representing musicians, publishers, and copyright licensing. If enacted, the TRAIN Act would shift AI copyright disputes from speculation to evidence by establishing a legal path to training-data disclosure. It would also add pressure on AI companies that do not currently reveal how their models are trained. #AIandLaw#Copyright#TrainingData#Transparency

AI & Law

@ai_and_law · Post #785 · 16.03.2026 г., 07:04

🇪🇺📖Study Finds Limited Availability of AI Training Data Disclosures Under EU AI Act Researchers from Trinity College Dublin report that information about AI training data required under the AI Act is often missing and difficult to locate. The law requires developers to publish summaries explaining how their models were trained, using a disclosure template designed to help copyright holders enforce their rights regarding the use of copyrighted material in AI training. A pre-print study funded by Mozilla found that only a small number of such summaries could be identified. The researchers also found structural issues in accessing the disclosures. The AI Act does not specify where companies must publish the summaries, leaving the decision to developers. As a result, no common publication mechanism exists and practices vary widely. The template created by the European Commission AI Office has led to heterogeneous implementations, making it difficult to determine whether the available documents meet EU transparency requirements. Most of the identified disclosures were produced by smaller organizations, including documentation for Switzerland’s Apertus national model. A document published by Microsoft for one of its open-source models was also reviewed, but the study found that it lacked several required details. Researchers recommend creating a centralized portal for publishing transparency summaries to improve accessibility and support enforcement once the AI Act obligations become applicable in August. #AIAct#AITransparency#TrainingData#Copyright#AIGovernance#AIRegulation#EULaw

Venture Village Wall 🦄

@venturevillagewall · Post #3551 · 20.12.2024 г., 09:32

Fraction AI Raises $6M Fraction AI successfully secured $6M in funding for its groundbreaking project aimed at democratizing access to high-quality training data for artificial intelligence using Web3 technology. The funding round concluded on December 18, 2024. #FractionAI#Funding#AI#Web3#TrainingData#TechInvestment#Innovation#DataDemocratization

AI & Law

@ai_and_law · Post #783 · 12.03.2026 г., 07:04

🇺🇸Court Allows Enforcement of California AI Training Data Disclosure Law A US federal court has denied a request by Elon Musk’s AI company xAI to block enforcement of California Assembly Bill 2013. The law requires AI developers whose models are accessible in California to publicly disclose key information about training datasets, including dataset sources, collection timelines, whether collection is ongoing, and whether datasets contain copyrighted, trademarked, patented, or personal data. Companies must also indicate whether training data was licensed or purchased and the extent of synthetic data used. xAI argued the law would force disclosure of trade secrets, including dataset sources, dataset sizes, and data-cleaning methods. According to the company, such transparency could allow competitors to infer what datasets it uses and replicate its approach. The company warned that compliance could be “economically devastating” and reduce the value of its proprietary data practices. However, US District Judge Jesus Bernal ruled that xAI failed to demonstrate that the law requires disclosure of protected trade secrets. The court found the company’s claims too general and based largely on hypotheticals. The motion for a preliminary injunction was denied, allowing the law—which took effect in January—to remain in force while the lawsuit continues. #AIRegulation#AITransparency#TrainingData#TradeSecrets#AIAct#AIGovernance#TechLaw