TGTGInsighttelegram intelligenceLIVE / telegram public index
← Newlearnerの自留地

TGINSIGHT SIMILAR POSTS

類似コンテンツを探す

ソースチャンネル @NewLearnerChannel · Post #14708 · 9月9日

#APPLE 🍎Apple 2025 秋季发布会看些啥?—— 自留地 の 前瞻盘点 明天凌晨,一年一度的阿果秋季春晚又要来了。老规矩,结合此前种种爆料和信息,我们一起来盘点一下今年可能的看点 📱iPhone 17 系列 - A19 系列处理器 - 推出全新 Air 系列,主打 5.5mm 超薄机身,配备「药丸」后摄模组,预计搭载 12GB RAM、Apple C1 调制解调器和 6.6 英寸显示屏 - Air 首发或暂无国行,因其大概率仅支持 eSIM,需等 eSIM 政策落地 - Pro 系列将采用半玻璃半铝的设计,其中玻璃区域用于 MagSafe 充电,后背还将采用巨大摄影头模组 - Pro 系列有望搭载 A19 Pro 处理器,以及全 48MP 后置三摄 / 最高 8 倍光学变焦 - Pro 机型将提供橙色、深蓝色、灰色、白色和黑色机型 - 数字版将迎来 6.3 英寸显示屏、A19 处理器以及「小药丸」后摄模组,有望带来 ProMotion 功能 - 将采用均热板等手段,进一步改善 iPhone 散热问题 📸 今年升级的亮点,我觉得除了推出轻薄 SKU 取代了 Plus 系列之外,依然是影像。随着国产 Android 品牌以及三星等竞品的不断发力,光学长焦等手机相机体验越来越好,Apple 这几年感受到了压力。去年使得 Pro 和 Pro Max 在影像功能上做到了对等,今年很高兴看到模组增大的同时,有新的功能和变化 像素提升、光学倍数增加,都是我们喜闻乐见的,拍演唱会等场景可以排上大用场。但是,正如我去年说的那样,我们也应该拥有一个「专业模式」来充分发挥这些硬件的实力。此外,对于日常用的中焦焦段的选择,Apple 应该有自己的思考 🧠 去年以为 Apple Intelligence 会在过去的这一年大展拳脚,但其实 Apple 还是在做底层的框架协议,至于落地一直传闻想要通过合作或者收购其他 LLM 来实现。我能理解 Apple 站到了一个十字路口,下一步选择很重要。但去全球化日益明显的今天,Apple Intelligence 在各国的落地也受到诸多法律和监管方面阻碍 从我个人的角度来看,对 Apple Intelligence 的需求也不是太强烈,日常主要还是以电脑使用为主。因此,今年也不排除会继续选择国行。最后,eSIM 或许是接下来一年每个人都要考虑的问题,如果新机真的大规模砍掉双 nano-SIM 卡,变为单卡 + eSIM 的模式,应该怎么处理自己目前的多卡问题 ⌚️Apple Watch 系列 - Apple Watch Ultra 3 将搭载全新 S11 芯片,并支持 5G 网络连接,保留卫星通信功能,略微增大屏幕尺寸 - Apple Watch Series 11 预计延续 Series 10 的设计语言 - Apple Watch SE 3 也可能获得升级,重点是升级芯片 - 目前尚不清楚是否会引入血压监测功能 🎧AirPods - AirPods Pro 3 有望在下半年发布 - 有望取消背部的传统实体配对按键,同时为充电盒正面引入触控操作区 - 耳机盒将变得更小 - 引入心率监测、体温监测等健康功能 - 实时翻译功能可能无法随硬件首发一同提供 之前通过 AC+ 更换的越南产 AirPods Pro 一代,已经快要罢工了,因此我迫切地等待第三代的发布 👀 今年的传闻大致如上所述,期待 iPad 和 Mac 更新的朋友或需要等更迟一些的发布会了。随着年龄增长,逐渐发现即便如 Apple 这样的品牌,也不能做对、做好每一件事,黄金时期的发展掩盖了很多问题,一旦停滞进入瓶颈期便暴露无遗。不管怎样,我还是很怀念那个爆料没有这么发达、发布会还是实时直播的年代 🔗 附上一些国内外媒体长文前瞻:Bloomberg | 9to5Mac | MacRumors | The Verge | sspai * 以上所有前瞻信息来自网络和爆料人,均在早晚报出现过,不一一列举来源。请以最终发布会结果为准,欢迎大家届时进群 @NewlearnerGroup 和我们一同观看 🍿️ 频道:@NewlearnerChannel

Hashtags

結果

188件の類似投稿が見つかりました

検索: #deeplearning

当前筛选 #deeplearning清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8472 · 2025/09/08 14:02

💰Google TPUs - главный конкурент NVIDIA? Аналитики считают: если бы Google выделила бизнес по TPU-чипам вместе с лабораторией DeepMind, то объединённая компания могла бы стоить около $900 млрд. Пока этого не произойдёт, но сама цифра показывает масштаб. 📌Что такое TPU и почему они важны 🟢Чипы, созданные специально для машинного обучения 🟢Их производительность — до 42,5 экзафлопс 🟢Сами чипы сопоставимы с NVIDIA по скорости и энергоэффективности 🟢 За полгода активность разработчиков в Google Cloud выросла на 96% , благодаря собственному железу 🔥Новые поколения чипов - 6-е поколение Trillium уже пользуется высоким спросом - 7-е поколение Ironwood станет первым TPU, ориентированным на крупномасштабный inference — этап, когда модели реально используются после обучения Anthropic и xAI активно рассматривают переход на TPU, так как улучшенная поддержка через JAX делает их использование на больших масштабах заметно проще. Google уже заключила сделку с Fluidstack (Нью-Йорк) и ведёт переговоры с другими облачными провайдерами, которые раньше работали в основном с NVIDIA (например, Crusoe и **CoreWeave**). В итоге Google выходит в прямую конкуренцию с NVIDIA — и впервые за долгое время у «зелёного гиганта» появился серьёзный соперник. 🟢Новость: marketwatch. com/story/google-may-be-sitting-on-a-900-billion-gem-that-could-disrupt-nvidias-dominance-20662ec6 @ai_machinelearning_big_data #google#nvidia#tpu#deeplearning

Machinelearning

@ai_machinelearning_big_data · Post #8865 · 2025/10/27 16:24

⚡️Glyph: масштабирование контекста через визуально-текстовую компрессию В основе модели лежит простая идея : вместо того чтобы кормить модели километровый текст, Glyph превращает его в изображение и обрабатывает через vision-language модель. Используется LLM-управляемый генетический алгоритм, чтобы подобрать наилучшие параметры визуального отображения текста (шрифт, плотность, макет), балансируя между сжатием и точностью. Это радикально снижает вычислительные затраты, сохраняя при этом смысловую структуру текста. При этом точность почти не падает: на задачах с длинным контекстом Glyph работает на уровне современных моделей вроде Qwen3-8B. При экстремальном сжатии VLM с контекстом 128K может эффективно обрабатывать задачи, эквивалентные 1M+ токенов в традиционных LLM. Фактически, длинный контекст становится мультимодальной задачей, а не чисто текстовой. 📄Подробности: arxiv.org/abs/2510.17800 🧩Веса: huggingface.co/zai-org/Glyph 👉Репозиторий: github.com/thu-coai/Glyph @ai_machinelearning_big_data #AI#LLM#Multimodal#Research#DeepLearning

IT Events RU

@iteventsru · Post #283 · 2018/03/15 16:13

✅ Завтра ✅ AI.Hack Москва 📅 16–18 марта / 19:00–22:00 (время МСК) / Москва, проспект Мира, 121 💵 Бесплатно 📝 Регистрация тут: https://goo.gl/3gkRj6 Приглашаем программистов нейросетей, специалистов по machine learning, deep learning, data scientists, computer vision, предпринимателей с опытом развития технологичных бизнесов и всех заинтересованных принять участие!​ Призовой фонд хакатона: 600 000 руб. #MachineLearning#DeepLearning#DataScientists#Москва

Artificial Intelligence AI News

@machinelearningresearchnews · Post #1413 · 2026/04/16 08:38

UCSD and Together AI Research Introduces Parcae: A Stable Architecture for Looped Language Models That Achieves the Quality of a Transformer Twice the Size The core idea is to recast the looped forward pass as a nonlinear time-variant dynamical system over the residual stream. By analyzing the linearized form of this system, the research team shows that prior injection methods — addition and concatenation-with-projection — produce marginally stable or unconstrained parameterizations of the state transition matrix Ā. Parcae fixes this by constraining Ā via discretization of a negative diagonal parameterization, guaranteeing ρ(Ā) < 1 at all times. Two additional training fixes accompany the architectural change: a normalization layer on the prelude output to prevent late-stage loss spikes, and a per-sequence depth sampling algorithm that corrects a distributional mismatch bug in prior recurrence sampling methods. On results: → Parcae reduces validation perplexity by up to 6.3% over parameter- and data-matched RDMs at 350M scale → A 770M Parcae model matches the Core benchmark quality of a 1.3B standard Transformer → At 1.3B parameters, Parcae outperforms the parameter-matched Transformer by 2.99 points on Core and 1.18 points on Core-Extended On scaling laws: → Compute-optimal training scales mean recurrence µ_rec and tokens D in tandem following power laws (µ_rec ∝ C^0.40, D ∝ C^0.78) → Test-time looping follows a saturating exponential decay — gains plateau near the training recurrence depth µ_rec, setting a hard ceiling on inference-time scaling → A unified law predicts held-out model loss within 0.85–1.31% average error Pretrained models from 140M to 1.3B are available on Hugging Face. Full analysis: https://www.marktechpost.com/2026/04/16/ucsd-and-together-ai-research-introduces-parcae-a-stable-architecture-for-looped-language-models-that-achieves-the-quality-of-a-transformer-twice-the-size/ Paper: https://arxiv.org/pdf/2604.12946 Technical details: https://www.together.ai/blog/parcae Models: https://huggingface.co/collections/SandyResearch/parcae #MachineLearning#NLP#LLM#DeepLearning#AIResearch

Repositorio data science

@repo_science · Post #3467 · 2023/07/24 05:22

​​Paper Review: Llama 2: Open Foundation and Fine-Tuned Chat Models Introducing Llama 2, a cutting-edge ensemble of large language models ranging from 7 to 70 billion parameters! These models, specially fine-tuned for dialogue use cases, not only outperform existing open-source chat models but also showcase exemplary performance in safety and helpfulness. Llama 2 creators have opened the door for AI community, sharing their detailed approach to inspire further advancements in the development of responsible AI. Project link: https://ai.meta.com/llama/ Model link: https://github.com/facebookresearch/llama Paper link: https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/ A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-llama2 #deeplearning#nlp#safetyai#responsibleai

Data Science Jobs

@datasciencejobs · Post #1359 · 2023/03/11 06:20

#вакансия#job#ML#datascience#deeplearning#MLOps#MLEngineer#remote Role: ML Engineer at Data Monsters Fully remote, flexible work hours Remuneration: $1,1-2,5K Contact: @mipt_nz We are seeking a highly motivated Machine Learning Developer to join our team. The successful candidate will be responsible for developing and deploying ML models to solve complex business problems. In particular, the new colleague will work on an algorithm for predicting the cost of services based on a set of factors that influence the price. The ideal candidate should be familiar with handling large datasets, have strong knowledge of Python, SQL, and experience working with NN and classical ML algorithms. Responsibilities: - Develop, test, and deploy ML models to solve complex business problems. - Collect and preprocess large datasets to ensure data quality. - Use SQL to extract data from databases, manipulate data, and perform data analysis. - Develop and implement NN models to improve the accuracy of predictions. - Develop, test, and implement classical ML algorithms such as linear regression, decision trees, and k-means clustering. - Collaborate with cross-functional teams to understand business requirements and provide insights. - Monitor and evaluate model performance and make adjustments as necessary. - Stay up-to-date with the latest ML and data science techniques. Requirements: - At least 2 years of experience in ML development. - Strong knowledge of SQL, and experience working with databases such as PostgreSQL, MySQL. - Python and popular data science libraries such (NumPy, Pandas, Scikit-learn, etc.) - Knowledge of NN architectures such as Convolutional NN, Recurrent NN, and Deep NN. - Strong knowledge of basic ML algorithms (linear regression, decision trees, and k-means clustering, etc.). - Experience with data visualization tools such as Matplotlib and Seaborn - English speaking equivalent to at least B2. As a plus: - Experience with cloud-based ML platforms such as AWS or GCP and MLOps. If you are a passionate ML developer willing to work with cutting-edge technology, and looking for a new challenge, we would love to hear from you 👍🏻 please DM @mipt_nz

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #2983 · 2025/04/22 06:23

🔊【#深度解读】 他曾因迷茫而离开校园去学木工,却后来用“玻尔兹曼机”刷新机器学习范式;如今又凭神经网络理论斩获 2024 年诺贝尔物理学奖,被誉为“AI 教父”​。 想知道 Geoffrey Hinton 如何把好奇心炼成颠覆时代的科学革命?点击下方长文链接,跟我一起解锁这段从「木匠」到「诺奖」的脑洞旅程!#GeoffreyHinton#NobelPrize#AI#DeepLearning#TechRevolution 👉阅读全文

Добро пожаловать в мир главного ит тренда - машинного обучения: @machinelearning_ru В канале вы найдете : 📃Статьи , 📚Книги 👨‍💻Код 🔗Ссылки 🦾Вакансии и много другой полезной информации #ArtificialIntelligence#DeepLearning #MachineLearning#DataScience #Python 1 канал вместо тысячи учебников и курсов 👇👇👇 🤖@machinelearning_ru

Добро пожаловать в мир главного ит тренда - машинного обучения: @machinelearning_ru В канале вы найдет : 📃Статьи , 📚Книги 👨‍💻Код 🔗Ссылки и много другой полезной информации #ArtificialIntelligence#DeepLearning #MachineLearning#DataScience #Python 1 канал вместо тысячиучебников и курсов👇👇👇 🤖@machinelearning_ru

Machinelearning

@ai_machinelearning_big_data · Post #8608 · 2025/09/22 15:35

🚀 Новая китайская модель LongCat-Flash-Thinking 🧠 Это модель для рассуждений, которая показала SOTA-результаты среди open-source решений. ⚡ Основное: - Архитектура MoE, 560B параметров, из них 27B активируются. - Эффективность: требует на **64,5% меньше токенов**( чем другим открытым моделям того же класса), чтобы достичь топ-результатов на AIME25 (с нативным использованием инструментов,). - Контекст: 128k, обучение с усилением на задачах рассуждений и кода, многоэтапное пост-тюнинг обучение с мультиагентным синтезом. - Инфраструктура: асинхронный RL даёт 3x ускорение по сравнению с синхронными фреймворками. ⚙️ Оптимизации для продакшена: - Свои оптимизированные ядра для работы с MoE и специальные приёмы распределённого обучения, - KV-cache reduction, квантование, chunked prefill, - статическая/эластичная маршрутизация, peer-to-peer cache transfer, heavy-hitter replication и PD-disaggregation. - Поддержка SGLang и vLLM для эффективного деплоя. 📊 Бенчмарки: - Лидирует в tool use (**τ²-Bench, VitaBench**) - Хорошие результаты по instruction following (**IFEval, COLLIE, Meeseeks-zh**). Китайцы стабильно удерживают лидерство в reasoning-моделях. 🟠HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking @ai_machinelearning_big_data #AI#LLM#Reasoning#MoE#DeepLearning#OpenSource

Machinelearning

@ai_machinelearning_big_data · Post #8754 · 2025/10/13 20:10

🔥 Сенсей Карпаты выложил новый репозиторий - полный пайплайн обучения LLM с нуля В проекте есть всё, чтобы собрать свой ChatGPT-клон за $100 и 4 часа: > • токенизатор (написан на Rust) > • pretraining > • SFT (supervised fine-tuning) > • RL (reinforcement learning) > • оценка модели (eval) Всего 8 000 строк кода, без лишних зависимостей - идеальный учебный пример, чтобы понять, как реально устроено обучение больших языковых моделей. 💡 Это проект из его нового грядущего курса LLM101n, и отличная возможность прокачать свои ML-навыки на практике. Можно арендовать GPU в облаке и запустить всё самому - код уже готов к запуску. Если запустить обучение модели nanochat на облачном GPU-сервере (например, 8×H100), то примерно через 12 часов обучения (стоимость ~300–400 $) модель достигает уровня GPT-2 по качеству на тестовых наборах (CORE-score). А если тренировать около 40 часов (затраты ~1000 $), решает простые задачи по математике и коду, набирая: - 40+ на MMLU - 70+ на ARC-Easy - 20+ на GSM8K 🧠 Это бесплатная практика топ уровня от мастера, которую не стоит упускать. 🟠GitHub:https://github.com/karpathy/nanochat 🟠Технические детали:https://github.com/karpathy/nanochat/discussions/1 @ai_machinelearning_big_data #LLM#nanochat#MachineLearning#DeepLearning#AI#GPT

123•••10•••1516
前へ1ページ / 16ページ中次へ