TGTGInsighttelegram intelligenceLIVE / telegram public index
← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Harbor, cargo port, ships #AI#artificial_Intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

AI & Law

@ai_and_law · Post #547 · 11/04/2025 07:04

🇺🇸“Stop AI Theft”: US Publishers Launch Coordinated Call for Legislative Action This week, a coalition of major US publishers — including The New York Times, The Washington Post, and The Guardian — launched a national campaign urging lawmakers to step in and regulate how generative AI systems use copyrighted content. Through full-page ads in print and digital, the “Support Responsible AI” initiative demands compensation and attribution for the use of journalistic work in AI training and output. The campaign follows recent lobbying by OpenAI and Google, who requested permission to continue training their models on copyrighted materials. In response, publishers are pushing for legislative requirements that would mandate payment and transparency when AI platforms use creative content. “This is not anti-AI,” says News/Media Alliance CEO Danielle Coffey, “but a call for a fair and responsible system.” #AI#Copyright#ResponsibleAI#FairUse#BigTech

Machinelearning

@ai_machinelearning_big_data · Post #8754 · 13/10/2025 20:10

🔥 Сенсей Карпаты выложил новый репозиторий - полный пайплайн обучения LLM с нуля В проекте есть всё, чтобы собрать свой ChatGPT-клон за $100 и 4 часа: > • токенизатор (написан на Rust) > • pretraining > • SFT (supervised fine-tuning) > • RL (reinforcement learning) > • оценка модели (eval) Всего 8 000 строк кода, без лишних зависимостей - идеальный учебный пример, чтобы понять, как реально устроено обучение больших языковых моделей. 💡 Это проект из его нового грядущего курса LLM101n, и отличная возможность прокачать свои ML-навыки на практике. Можно арендовать GPU в облаке и запустить всё самому - код уже готов к запуску. Если запустить обучение модели nanochat на облачном GPU-сервере (например, 8×H100), то примерно через 12 часов обучения (стоимость ~300–400 $) модель достигает уровня GPT-2 по качеству на тестовых наборах (CORE-score). А если тренировать около 40 часов (затраты ~1000 $), решает простые задачи по математике и коду, набирая: - 40+ на MMLU - 70+ на ARC-Easy - 20+ на GSM8K 🧠 Это бесплатная практика топ уровня от мастера, которую не стоит упускать. 🟠GitHub:https://github.com/karpathy/nanochat 🟠Технические детали:https://github.com/karpathy/nanochat/discussions/1 @ai_machinelearning_big_data #LLM#nanochat#MachineLearning#DeepLearning#AI#GPT

我喜欢你

@BDovo_Channel · Post #14681 · 24/02/2026 04:07

Gemini AI 图像去水印: 基于浏览器本地计算的无损去水印工具 • 采用反向 Alpha 混合算法,针对常见水印场景实现高质量还原,尽量保留原图细节 • 全流程在浏览器前端本地处理,图片不上传服务器,兼顾隐私安全与合规需求 • 支持 JPG、PNG、WebP 等主流格式,拖拽即用,毫秒级响应,适合快速批量处理 网站: https://banana.ovo.re UserScript: https://banana.ovo.re/userscript/gemini-watermark-remover.user.js #图像去水印#图像处理#浏览器本地处理#隐私安全#Gemini#AI

科技&趣闻&杂记

@kejiqu · Post #3638 · 16/07/2025 02:30

微软打造 AI 新工具:每月辅助审查 60 万条 PR,占比超 90% 微软公司宣布其内部使用的 AI 智能代码审查助手已扩展应用,每月审查超过 60 万条 Pull Requests (PR) 请求,占比超过 90%。该助手旨在提升开发者生产力和代码质量。现有 PR 审查过程中,审查者常花费时间在低价值反馈上,该助手可解决此问题。其改进包括自动检查和评论、提出改进建议、生成 PR 摘要以及互动问答。该助手融入现有工作流程,在 PR 创建时自动激活。微软表示,该助手缩短了审查周期,提高了代码质量,并具有可定制性和可扩展性。IT之家 🏷#微软#AI#代码审查#PR 📢频道👥群组📝投稿

Machinelearning

@ai_machinelearning_big_data · Post #8459 · 05/09/2025 13:00

🌟InfoSeek: синтез данных для deep‑research с формализацией HCSP. BAAI представила InfoSeek — открытую методику синтеза данных и учебный контур для глубоких исследований. Задачи такого класса выходят за рамки обычного извлечения фактов: модель должна раскладывать вопрос на подзадачи, координировать многошаговое рассуждение и проверять ответы по источникам. Эти задачи формализуются как HCSP — иерархические задачи удовлетворения ограничений, решение которых возникает только при последовательном сужении кандидатов на нескольких уровнях, где каждый внутренний узел сам является подзадачей, а зависимость между узлами образует дерево исследования. Базовая идея проста: данные строятся вокруг древа исследования. Вершины - сущности или атомарные факты, ребра - проверяемые отношения из Википедии и открытых страниц. Алгоритм синтеза явно управляет структурой, чтобы исключить недоопределенность или ранние "короткие замыкания". В HCSP ответ формально равен пересечению множеств, заданных текущими ограничениями и рекурсивными подвопросами; в терминах дерева корень — финальный ответ. Такой подход не только задаёт глубину и ширину рассуждения, но и делает каждый промежуточный шаг проверяемым по конкретным утверждениям. 🟡Синтез выполняет связка из 2 агентов. Планировщик контролирует глобальную сложность, выбирая цель и тип расширения, а Браузер добывает факты и ссылки из страницы сущности. 4 операции покрывают весь жизненный цикл: 🟢Инициализация из "якоря"; 🟢"Размытие родителя" - добавление нескольких независимых условий, которые в совокупности определяют уникальный ответ без включений между кандидатами; 🟢Вертикальное углубление по гиперссылке для увеличения высоты дерева; 🟢Генерация текста вопроса лишь после того, как каждый узел имеет достаточный набор проверяемых ограничений и достигнуты заданные метрики сложности. Качество контролируется по 2 осям: сложность и проверяемость. Сначала вопросы прогоняются "в лоб": если мощная базовая модель отвечает правильно без поиска, образец исключается, так было отсеяно около 2%. Затем проверяется решаемость на фиксированном наборе страниц с примесями-дистракторами и все двусмысленное удаляется. Итог: датасет с 50 тыс. пар вопрос–ответ и 16,5 тыс. траекторий размышлений с метками извлечения. 🟡Эксперименты. Тесты показали, что InfoSeek переносится за пределы домашнего домена. На классических наборах для извлечения фактов и мульти‑hop вопросов компактная модель InfoSeeker‑3B опережает типовые RAG и агентные пайплайны. На BrowseComp‑Plus с фиксированным корпусом 100K страниц и BM25 точность достигает 16,5% при среднем 8,24 обращения к поиску, что выше, чем у Gemini 2.5 Flash, Sonnet 4 и GPT‑4.1 и значительно выше Qwen3‑32B и Search‑R1‑32B. Замена обучающего набора NQ+HQA на InfoSeek поднимает точность с 3,0% до 16,5% и делает запросы осмысленно более частыми. ▶️ Из готового у проекта есть датасет, техотчет, конструктор древа данных и код для SFT- трейна. В планах - код RL и публикация весов InfoSeeker‑3B. 📌Лицензирование: Apache 2.0 License. 🟡Датасет 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#DeepResearch#Dataset#InfoSeek

AI & Law

@ai_and_law · Post #630 · 07/08/2025 07:04

📖Inside the AI Mind: Anthropic Maps the Neural Roots of Personality Drift Anthropic researchers have uncovered "persona vectors" — distinct neural activations linked to AI models' behavioral shifts. By comparing activation patterns in responses (e.g., sycophantic vs. neutral, evil vs. non-evil), they’ve begun to isolate and suppress undesirable traits like hallucination, sycophancy, and even racism at the network level. This study marks a rare convergence of interpretability and safety. As AI systems increasingly interact with the public and shape decisions, understanding why they deviate from intended behaviors is no longer academic—it's operationally essential. Anthropic’s work may become a blueprint for preemptively mitigating behavioral drift across general-purpose models. #AI#AISafety#Anthropic#TrustworthyAI

Machinelearning

@ai_machinelearning_big_data · Post #9075 · 25/11/2025 17:34

⚡️ Релиз Flux 2 Модель получила значительный апгрейд . Теперь она учитывает до десяти референсов сразу, лучше понимает свет, материалы и оптику, аккуратнее рендерит текст и выдаёт качество до 4k. Генерации выглядят ровнее и реалистичнее, без пластикового блеска. Можно генерировать, редактировать и совмещать изображения. Веса открытые, так что при желании можно запускать локально (65 ГБ). 🟠Demo: https://playground.bfl.ai/image/generate 🟠Weights: https://huggingface.co/black-forest-labs 🟠HF: https://huggingface.co/black-forest-labs/FLUX.2-dev @ai_machinelearning_big_data #AI#Flux2#ImageGeneration#AIGraphics

Machinelearning

@ai_machinelearning_big_data · Post #8675 · 02/10/2025 15:11

🔦Генерация изображений на свете, а не на GPU Исследователи из UCLA представили оптическую генеративную модель (Optical Generative Model). Она использует свет и линзы вместо вычислительных блоков - то есть картинки рождаются не на чипах, а в физике. 🔬 Как это работает: 1. Лёгкий цифровой энкодер превращает случайный шум в фазовый узор. 2. Этот узор загружается на оптический модулятор света. 3. Свет проходит через дифракционный декодер и прямо на сенсоре формируется изображение. ✔️ Авторами проведены реальные эксперименты: с помощью видимого света и SLM показаны результаты генерации: - Созданы цифры, лица, бабочки и даже картины в стиле Ван Гога. - Качество сравнимо с современными диффузионными моделями. - Есть две версии: мгновенная (один проход) и итеративная (несколько шагов, как у диффузии). ⚡ Чем интересен такой подход - Подход не требует никакой вычислительной нагрузки. - Супербыстрая генерация: физика света выполняет то, что GPU делает миллиардами операций. - Это открывает путь к энергоэффективному ИИ для edge-устройств: AR/VR, мобильные камеры, компактные сенсоры. ⚠️ Ограничения: - Сложно выравнивать оптические системы. - Ограничения по точности фазовых масок. - Зависимость от качества оборудования (шум, битовая глубина). Но даже с этими проблемами, это первый шаг к новому классу ИИ, где вычисления заменяются чистой оптикой. Nature: https://www.nature.com/articles/s41586-025-09446-5 @ai_machinelearning_big_data #AI#OpticalComputing#Photonics#GenerativeA

Machinelearning

@ai_machinelearning_big_data · Post #9203 · 08/12/2025 13:50

📌Адвент-календарь по ML и DL. Towardsdatascience запустил декабрьский Адвент-календарь "Machine and Deep Learning", котором предлагает разобраться, что под капотом у ML-процессов. Фреймворки, например scikit-learn, сделали нас ленивыми. Вызов model.fit стал настолько обыденным, что в эпоху Gen AI кажется, будто обучение модели -это просто подбор параметров. ML-инженеры жонглируют моделями со сложностью, которая растет в геометрической прогрессии, но при этом они не всегда способны вручную пересчитать и объяснить результаты даже самых простых алгоритмов: линейной регрессии или классификатора. Модели превратились в "черные ящики", и это огромная проблема, ведь знание, что стоит за каждой функцией, критически важно для понимания процесса. Фишка в том, что весь материал разбирается в Excel. Звучит диковато, но в этом и есть гений. В отличие от кода, где операции скрыты за функциями, в Excel каждая формула, каждое число, каждый расчет - всё на виду. Никаких "черных ящиков". Уже вышло 7 статей: 🟢День 1 : k-NN Regressor 🟢День 2 : k-NN Classifier 🟢День 4 : GNB, LDA и QDA 🟢День 5 : GMM (Gaussian Mixture Model) 🟢День 6 : Decision Tree Regressor 🟢День 7 : Decision Tree Classifier Цикл поможет ответить на вопросы, которые часто остаются за кадром: как грамотно обрабатывать категориальные признаки, когда масштабирование не является правильным решением, и как измерять важность признаков, интерпретируя их напрямую с моделью, минуя модель-агностические пакеты LIME и SHAP. Серия будет полезна студентам для осмысления формул, и менеджерам для понимания какой ML-метод необходим для бизнеса. А для разработчиков это шанс наконец-то понять теорию. В общем, это маст-рид для тех, кто хочет перестать быть оператором библиотек и по-настоящему понять, как работает ML-движок. 🔜 Мониторить выход новых статей можно тут, обещают публикацию до конца декабря в формате "один день - одна статья". @ai_machinelearning_big_data #AI#ML#DL#Tutorial#Excel

Libreware

@libreware · Post #1513 · 09/10/2025 01:05

AI-Video-Transcriber #AI#Video#Transcriber is a powerful video transcription and summarization tool with support for over 30 platforms such as #YouTube and #TikTok. It offers multilingual support and intelligent transcription with high accuracy through Faster-Whisper. The tool also provides automatic text optimization and #summary#translation using GPT-4. AI-Video-Transcriber is also compatible with mobile devices, making it easy to use. https://github.com/wendy7756/AI-Video-Transcriber ================ @open_source_friend

12•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••676677678679680•••700•••750•••800•••838839