TGTGInsighttelegram intelligenceLIVE / telegram public index
Back to channels
AML avatar

TGINSIGHT CHAT

AML

@MachineLearningResearch

Technologies

ALGORITHMS MACHINE LEARNING

Subscribers136Current channel subscribers
Tracked posts812Indexed post count
Recent reach1,953Sum of recent post views
Recent posts

Recent posts

Page 65 of 68 · 812 posts

Posted May 17

Никто ведь не сомневается в точности результатов, получаемых при вычислениях с мнимыми количествами, хотя они представляют собой только алгебраические формы и иероглифы нелепых количеств

25 views

Posted May 16

https://teletype.in/@romanus_otiosus/vector-DB?utm_source=teletype&utm_medium=telegram&utm_campaign=notice_article

29 views

Posted May 14

Со-основатель Hugging Face говорит о новом тренде в ИИ - Low Tech AI Low Tech AI — это будущее, где мощный ИИ становится доступным, простым и легко интегрируемым в существующие технологии, что может радикально изменить общество в кратчайшие сроки Основные тренды: 1. Уменьшение размера моделей ML при сохранении производительности: - Размер моделей ML не растёт или уменьшается Современные модели ML (например, Llama или Qwen) показывают производительность, сравнимую с моделями, которые год назад были в 2–10 раз больше по размеру Это значит, что для достижения высокого уровня интеллекта требуется меньше параметров - Доступ к вычислительным мощностям дешевеет За ту же цену пользователи получают всё больше вычислительных ресурсов (многоядерные процессоры и т.д.) В итоге - высокий уровень ML становится всё более доступным по цене и вычислительным ресурсам 2. Низкая сложность ML: - Современные ML-модели и их рабочие процессы проще, чем многие традиционные программы для CPU или прошлые архитектуры ML ML сегодня — это технология с «низкой сложностью ветвления» (low branching complexity). - Это упрощает и аппаратное обеспечение для ML (например, TPUs, AI-ускорители от Etched, Fractile, GROQ, Cerebras и др.), делая его менее сложным, чем традиционное оборудование для вычислений 3. Интеграция в существующий софт. - ML создаётся на основе человеческих данных и поэтому всё лучше интегрируется в текущий стек ПО, созданного людьми - Это означает, что для внедрения ML в существующие системы потребуется минимальная модернизация API и программного стека Возможные последствия: Эти тренды ведут к появлению «Low Tech AI» — ML, интегрированного в дешёвые и простые технологические стеки Примеры: 1. Чип мощностью 5 Вт, работающий с высокоэффективным алгоритмом (модель с миллиардами параметров), с низкой задержкой и энергопотреблением, превосходящая по интеллекту GPT-3/4, особенно с использованием инструментов 2. Бизнес, использующий устаревший софт 2000-х годов, может практически мгновенно стать ML-ориентированным с минимальными изменениями в технологиях, но с радикальным улучшением возможностей Комбинация этих трендов может привести к масштабным и быстрым изменениям в обществе MLможет распространиться повсеместно за короткое время, подобно тому, как смартфоны в некоторых странах заменили настольные компьютеры и ноутбуки, обойдя их широкое распространение В случае с ML влияние может быть ещё более значительным

35 views

Posted May 14

Проблема ограниченной памяти у нейронок решена — появился MCP-плагин OpenMemory, который объединяет память Cursor, Claude, Windsurf и любых MCP Он сохраняет 100% инфы из всех тулз и сеансов в одно место Так Cursor легко вспомнит то, о чём вы общались с Claude, и наоборот Можно добавлять, удалять и находить любые воспоминания — все они удобно распределены в общей базе Она полностью локальная и доступна только вам Установить в один клик — тут

23 views

Posted May 13

Рост галлюцинаций до 48 % ставит под сомнение будущее LLM Рекомендации исследователей сводятся к осторожности Нараянан предлагает применять LLM только там, где проверка ответа занимает меньше времени, чем самостоятельный поиск Бендер советует полностью отказаться от использования чат-ботов для получения фактов «Эти системы не созданы для генерации знаний — они имитируют речь», — пояснила она Ситуация ставит под вопрос будущее LLM Если раньше считалось, что галлюцинации исчезнут с развитием технологий, то теперь эксперты признают: ошибки останутся неотъемлемой частью работы моделей https://www.ixbt.com/news/2025/05/12/rost-galljucinacij-do-48-stavit-pod-somnenie-budushee-llm.html

471 views

Posted May 13

Создана платформа для ML-агентов, чтобы они учились решать задачи машинного обучения как профессионалы, с возможностью масштабирования и интеграции новых данных MLE-Dojo — это платформа, которая позволяет ML-агентам учиться решать сложные задачи, такие как анализ данных, настройка моделей, отладка кода и прогнозирование временных рядов Она основана на 200+ реальных задачах с Kaggle, охватывающих табличные данные, компьютерное зрение,обработку текста и многое другое Ключевые возможности : 1. Работает как тренажер для агентов, где они могут итеративно тестировать гипотезы, получать обратную связь и совершенствоваться 2. Поддерживает тонкую настройку и обучение с подкреплением с детальной историей действий агента и среды 3. структура позволяет легко добавлять новые задачи, инструменты и действия через удобный API 4. Метрика HumanRank Score сравнивает результаты агентов с достижениями людей на лидерборде Kaggle, обеспечивая честную оценку 5. Результаты тестирования 8 современных LLM (например, o3-mini, DeepSeek-r1, Gemini-2.5-Pro) доступны в реальном времени MLE-Dojo помогает: - Разрабатывать умных агентов, которые могут самостоятельно решать задачи MLE - Сравнивать производительность LLM в реальных сценариях - Ускорять исследования в области автономного машинного обучения - Обучать и тестировать новые подходы в безопасной и воспроизводимой среде

22 views

Posted May 13

OpenAI представила новый стандарт оценки мед ML Компания представила HealthBench —открытый набор данных и оценочный инструмент, созданный для тестирования LLM на их способность обрабатывать медицинские диалоги Он включает 5.000 реалистичных медицинских разговоров, которые охватывают 26 медицинских специальностей, таких как нейрохирургия и офтальмология, и поддерживает 49 языков, включая ахмарский и непальский Эти разговоры моделируют реальные сценарии взаимодействия между пациентами и врачами, что делает бенчмарк уникальным в своей реалистичности и масштабе Основная цель HealthBench — оценить, насколько точно и безопасно ML-модели могут отвечать на запросы, связанные со здоровьем Каждый ответ модели оценивается по специально разработанным рубрикам, созданным врачами, которые учитывают клиническую точность, полноту и соответствие медицинским стандартам Рубрики содержат 48.562 уникальных критерия, что позволяет проводить глубокую и детализированную оценку Запуск HealthBench вызвал интерес не только в медицинской и ML-сферах, но и в криптовалютном секторе Некоторые аналитики предполагают, что стандартизация оценки медицинских ML-моделей может стимулировать спрос на блокчейн-решения в здравоохранении, особенно для управления медицинскими данными и обеспечения прозрачности Несмотря на новаторский характер HealthBench, эксперты подчеркивают, что бенчмарк не является исчерпывающим Реальная клиническая практика сложнее, чем смоделированные диалоги, и требует дополнительного тестирования в реальных условиях Некоторые эксперты выражают скептицизм относительно заявлений, что ML в 4 раза превосходит врачей, указывая на необходимость критической оценки таких утверждений

24 views

Posted May 12

Университет Цинхуа выяснил, как заставить ИИ генерировать собственные данные для обучения, и превзошла по производительности модели, обученные на данных, отобранных экспертами-людьми

423 views

Posted May 12

Ex-Google создали новую архитектуру ИИ с интуицией Новая архитектура заимствует ключевой аспект функционирования биологических нейронов — временную синхронизацию Компания Sakana AI, созданная ex-Google Brain, DeepMind, представила Continuous Thought Machine (CTM) Это попытка переосмыслить основы работы искусственных нейронных сетей, приблизив их к биологическим аналогам CTM показала интерпретируемое, человекоподобное поведение, которое возникает естественным образом из архитектуры, а не программируется специально Это может привести к созданию ИИ с лучшей объяснимостью решений и возможностью переноса знаний между задачами Ключевые особенности CTM: 1. Модель обрабатывает данные через "внутренние тики", создавая пространство, в котором "разворачивается мышление" независимо от входных данных 2. Новый тип нейронов Каждый нейрон имеет собственную мини-сеть (MLP), обрабатывающую историю своих прошлых активаций 3. Синхронизация как основной механизм Представление информации основано на паттернах синхронизации между нейронами, а не только на их активациях При тестировании CTM на различных задачах были обнаружены удивительные эмерджентные свойства: Интуитивное решение лабиринтов Пошаговое распознавание изображений При классификации изображений CTM изучает разные части изображения последовательно, напоминая человеческое зрительное внимание Адаптивные вычисления. Модель может регулировать количество "мыслительных шагов" в зависимости от сложности задачи, тратя меньше усилий на простые изображения Память через нейронную организацию CTM способна запоминать числа и выполнять операции над ними, используя только организацию и синхронизацию нейронов Статья GitHub Tutorial

481 views

Posted May 12

Луддиты — участники стихийных протестов первой четверти XIX века против внедрения машин в ходе промышленной революции в Англии Когда автоматизация производства привела к росту безработицы, рабочие увидели источник зла в машинах Появление луддитов в Англии является хорошим примером сопротивления общества структурным изменениям, которые, в долгосрочной перспективе, улучшают положение всех ее членов Промышленная революция в Англии в конце 18-го – начале 19 века тяжело сказалась на рабочих Массовое внедрение фабриками, особенно шерстяными и хлопкообрабатывающими, нового оборудования резко сократило потребность в старой рабочей силе и множество людей оказались буквально выброшенными на улицу А поскольку социальных гарантий в то время практически не было, то их участь была весьма печальной Многие рабочие обвинили во всем новые машины Им казалось, что именно они отняли у них работу и, уничтожив их, можно вернуть потерянные рабочие места Недовольство постепенно вылилось в серии стихийных протестов против использования машин Активней всех выступали ткачи, поскольку их специальность требовала долгого срока обучения, а работы была весьма высококвалифицированной Ткацкие станки сделали их знания ненужными В 1768 году толпа ткачей разрушила мастерскую изобретателя прядильной машины Джеймса Харгривса, в 1792 году манчестерские ткачи сожгли первое предприятие с силовыми установками Эдмунда Картрайта К 1811 году протесты приняли массовый характер Восставшие нападали на фабрики, ломали и жгли ненавистные им машины Они называли себя луддитами, по имени Неда Лудда, возможно вымышленного рабочего, который одним из первых уничтожил чулочные станки Дело закончилось столкновением бунтовщиков с правительственными войсками Восстание было подавлено, а уничтожение машин было объявлено преступлением, карающимся смертной казнью

368 views

Posted May 12

Считается, что немецкую шифровальную машину Энигма взломал Тьюринг, и "Бомбу" тоже построил он Но до Тьюринга были польские математики Генрик Зыгальский, Мариан Реевский и Ежи Ружицкий, из книги Turing's Vision от MIT Press И в Википедии есть Они первые начали взламывать шифры Энигмы, Реевский первым создал свою Бомбу, а Тьюринг делал уже последующую для усложнённого шифра Энигмы В Познани, всё это и происходило, и здесь отличный музей Энигмы, где подробно рассказывается история этих польских математиков

25 views

Posted May 10

https://teletype.in/@romanus_otiosus/MoE

27 views
12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••636465666768