TGINSIGHT CHAT
Azizjon Azimi
@aateam7
Business and startupsAll posts reflect my personal opinion. Impossible to reality 🚀 Founder & CEO | zypl.ai Chair | AI Council 🇹🇯 Alum of Stanford (MBA’21) + Harvard (MPP’21) + NYU (BA’16) Forbes 30U30 Asia
Postijiet reċenti
Paġna 3 minn 85 · 1,012 postijiet
Ippubblikat 27 ġurnata ilu
⚡️ Биби настаивает на возобновлении боевых действий против Ирана — ЦАХАЛ в боевой готовности.
Ippubblikat 27 ġurnata ilu
Secretary of War Hegseth has just arrived at the White House, and the meeting has begun.
Ippubblikat 27 ġurnata ilu
The New York Times: Администрация Трампа изолировала Биби от прямых переговоров с Ираном. Биби получает информацию от посредников и разведки, без прямого канала с Трампом.
Ippubblikat 27 ġurnata ilu
⚡️ Военные самолеты ЦАХАЛ пролетают над Ираком и Сирией
Ippubblikat 27 ġurnata ilu
Reuters: The proposed outline is expected to include three stages: A formal end to the war, resolution of the crisis in the Strait of Hormuz, and the start of a 30-day negotiation on a broader agreement, with the option of an extension.
Ippubblikat 27 ġurnata ilu
⚡США и Иран приблизились к продлению режима прекращения огня на 60 дней — FT Условия сделки включают постепенное возобновление работы Ормузского пролива.
Ippubblikat 27 ġurnata ilu
❗️Трамп 24 мая примет решение о возможном возобновлении войны с Ираном — Axios
Ippubblikat 28 ġurnata ilu
Anthropic рассказала о промежуточных результатах Project Glasswing — инициативы по поиску уязвимостей в ПО с помощью модели Mythos. За месяц партнёры компании обнаружили больше 10 тысяч багов с высокой или критической степенью опасности. Ещё около 23 тысяч ошибок Anthropic нашла в репозиторих с открытым ПО. По оценкам компании, крупные игроки стали выпускать «существенно» больше исправлений, чем раньше vc.ru/ai/2944170
Ippubblikat 28 ġurnata ilu
В Иране 2000 часов нет интернета.
Ippubblikat 28 ġurnata ilu
Стратегии test-time scaling вручную подбирать не надо, когда есть автомат. LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling Tong Zheng, Haolin Liu, Chengsong Huang, Huiwen Bao, Sheng Zhang, Rui Liu, Runpeng Dai, Ruibo Chen, Chenxi Liu, Tianyi Xiong, Xidong Wu, Hongming Zhang, Heng Huang Статья: https://arxiv.org/abs/2605.08083 Код: https://github.com/zhengkid/AutoTTS Ревью: https://arxiviq.substack.com/p/llms-improving-llms-agentic-discovery # TL;DR ЧТО сделали: Группа исследователей представила AutoTTS — фреймворк, который использует LLM-исследователя для автоматического поиска и синтеза алгоритмов test-time scaling (TTS). Формулируя распределение вычислений на инференсе как поиск политики в офлайн-среде, система автономно проектирует Python-контроллеры. Эти контроллеры в динамике решают, когда модели нужно создать новую ветку, сделать пробинг, выполнить прунинг или остановиться. ПОЧЕМУ это важно: Сейчас в test-time scaling доминируют ручные эвристики (например, классический self-consistency или раннее завершение). AutoTTS показывает сдвиг парадигмы: авторы создают среду для поиска, а не сам алгоритм. Найденная таким образом стратегия Confidence Momentum Controller описывает оптимальную границу (Pareto frontier) между точностью и стоимостью, снижая расход токенов почти на 70% по сравнению со стандартным self-consistency. А весь процесс автоматического поиска обошёлся менее чем в $40. Для практиков: Вместо того чтобы вручную подбирать пороги для отсечения веток или фиксировать количество генераций, можно собрать офлайн-базу логов генерации и заставить агента написать оптимальный код контроллера, который будет динамически управлять бюджетом токенов под вашу конкретную задачу. Скейлить тут: https://t.me/gonzo_ML_podcasts/3706
Ippubblikat 28 ġurnata ilu
SpaceX успешно испытала «Старшип» — самую большую ракету в мире Американская компания SpaceX провела успешный тестовый запуск сверхтяжелой космической системы «Старшип» с ракетой-носителем Super Heavy V3, создаваемой для пилотируемых миссий на Луну и Марс. Запуск состоялся с космодрома в Бока-Чика в штате Техас в 17:30 22 мая (01:30 субботы по московскому времени). Изначально старт планировался на четверг, но в последний момент его отложили на сутки из-за технической неполадки. Спустя семь минут после старта ускоритель отделился от «Старшипа» и приводнился в Мексиканском заливе. Сам корабль сделал неполный виток вокруг Земли, выведя на орбиту 20 спутников-имитаторов и два модифицированных спутника Starlink. После этого «Старшип» сошел с орбиты и совершил посадку в заранее запланированной зоне приводнения в Индийском океане. Весь полет занял 65 минут. Этот полет стал 12-м для «Старшипа» и первым для третьего поколения ракеты, названного V3 и оснащенного усовершенствованными двигателями Raptor. Из предыдущих 11 пусков шесть были признаны успешными. Многоразовая ракетно-космическая система «Старшип» V3 — самая большая и мощная ракета в истории человечества. Ее высота составляет 124 метра. Фото: SpaceX @meduzalive
Ippubblikat 28 ġurnata ilu
Cerebras запустили Kimi K2.6 на скорости в тысячу токенов в секунду Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам. Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI. @ai_newz