@Iwantmyforeskinback · Post #9811 · 08/09/2025, 09:30 AM
#transformer
Hashtags
TGINSIGHT SIMILAR POSTS
Source channel @FengChingLocalization · Post #79 · Aug 8
#MacOS 仅限 Mac 设备使用
Hashtags
Search: #transformer
@Iwantmyforeskinback · Post #9811 · 08/09/2025, 09:30 AM
#transformer
Hashtags
@gradovbar · Post #516 · 09/13/2024, 05:19 PM
Мы начали второй день фестиваля #2дняДжаза с выступления чувственных #Transformer - сборная музыкантов из Москвы и Рязани! Великолепный вечер, который может стать вашим, главное заглянуть в #ГрадовБар
Hashtags
@githubtrending · Post #15476 · 02/07/2026, 12:30 PM
#python#abliteration#llm#transformer Heretic is an automated tool that removes safety restrictions from AI language models while preserving their intelligence and capabilities. It uses advanced mathematical techniques called directional ablation to identify and disable the "refusal mechanisms" that prevent models from answering certain questions. The key benefit is that anyone can use it with a simple command—no technical expertise needed. Unlike manual methods that often damage model quality, Heretic achieves the same level of censorship removal with significantly better preservation of the original model's reasoning abilities, as measured by lower KL divergence scores. This means you get an uncensored model that still thinks clearly and produces high-quality responses. https://github.com/p-e-w/heretic
@ai_machinelearning_big_data · Post #7989 · 07/09/2025, 11:00 AM
VGGT: Visual Geometry Grounded Transformer Долгие годы создание трехмерных моделей из набора фотографий было уделом сложных и медленных алгоритмов вроде Structure-from-Motion. Этот процесс напоминает многоэтапный конвейер: найти ключевые точки, сопоставить их между кадрами, триангулировать, а затем долго и мучительно оптимизировать геометрию всей сцены. Инженеры из компании Марка Цукерберга и Оксфордского университета решили, что пришло время отдать всю эту работу одной нейросети. И, кажется, у них получилось. Их разработка, VGGT (Visual Geometry Grounded Transformer), и это, по сути, первая настоящая фундаментальная модель для 3D-реконструкции. Она не просто ускоряет старые процессы, а полностью меняет парадигму, превращая сложный многоступенчатый пайплайн в вызов одной функции. Вы просто скармливаете ему от одной до сотен фотографий, а модель за несколько секунд выдает полный набор 3D-атрибутов: точные параметры каждой камеры, карты глубины, плотное облако точек и даже траектории движения точек по всей последовательности изображений. И все это за один проход, без какой-либо итеративной оптимизации. Под капотом у VGGT - трансформер на 1.2 миллиарда параметров с механизмом попеременного внимания. Модель то «всматривается» в детали каждого отдельного кадра, то «окидывает взглядом» всю сцену целиком, анализируя связи между разными ракурсами. Это позволяет ей одновременно понимать и локальный контекст, и глобальную геометрию. Даже в «сыром» виде, без постобработки, VGGT опережает DUSt3R и MASt3R: 0.2 секунды против почти 10 секунд. Но самое интересное начинается, когда на выходные данные VGGT «накладывают» быструю классическую оптимизацию Bundle Adjustment. Этот гибридный подход бьет все рекорды, устанавливая новый стандарт качества в задачах оценки поз камер и реконструкции. ⚠️ На одной H100 с Flash Attention 3 обработка 1 входного изображения занимает 0.04 сек при потреблении VRAM 1.88 ГБ, 10 изображений - 0.14 сек и 3.63 ГБ, 50-ти - всего 1.04 сек при 11.41 Гб, а 200 изображений - 8.57 сек с 40.63 Гб. 📌Лицензирование: CC-BY-NC-4.0 License. 🟡Страница проекта 🟡Модель 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Transformer#3DRecon#VGGT
Hashtags
@dimzine · Post #29 · 02/25/2024, 12:27 AM
life2vec:一个将丹麦统计局提供的人生事件序列进行向量编码和预测的项目 Using Sequences of Life-events to Predict Human Lives https://www.nature.com/articles/s43588-023-00573-5 / https://arxiv.org/abs/2306.03009 这是丹麦统计局和国家社交网络项目支持的一项研究,数据源未公开,基于 Transformer 网络。该网络最后能够将每个人一生的事件序列编码为一个单一向量,随后使用了 TCAV 概念激活向量测试,即手动挑选具有给定特征不同值的数据样本形成一个概念向量并验证其是否激来进行模型含义的解释。 模型仅仅通过 NLP 方法,在没有任何预先知识的情况下最终生成了有效的概念编码和概念集群(如图),并且能够理解文本化的数值字符串之间的严格邻近和正负关系。对于健康、职业等概念也有有意义的结果。 模型进行了预测死亡率和死亡年龄的尝试。模型在年轻和女性人群中预测效果更好,生活事件的数量对模型的影响并不明显。另外,该模型能够预测人格细微差别,包括内向性和外向性。 #论文#机器学习#人工智能#Transformer#NLP
Hashtags
@githubtrending · Post #15263 · 11/02/2025, 12:30 PM
#python#deep_learning#inference#llm#nlp#pytorch#transformer Nano-vLLM is a small, fast, and easy-to-understand tool for running large language models offline. It matches the speed of bigger systems like vLLM but uses only about 1,200 lines of clean Python code, making it simple to read and modify. It includes smart features like prefix caching and tensor parallelism to boost performance. You can install it easily and run models like Qwen3-0.6B on your own GPU. This tool is great if you want fast, efficient AI inference without complex setups, ideal for learning, research, or small deployments on limited hardware. https://github.com/GeeeekExplorer/nano-vllm
@ai_machinelearning_big_data · Post #8733 · 10/09/2025, 12:04 PM
AI21 представила Jamba 3B - компактную модель, которая обошла Qwen 3 4B и IBM Granite 4 Micro по качеству рассуждений. Более высокая эффективность, в сравнении с AI21 - 2–5× улучшение в производительности по сравнению с конкурентами за счёт меньшего KV-кэша и гибридной архитектуры. Секрет в архитектуре: 🔹 сочетание Transformer attention и Mamba state-space слоёв. 🔹 Mamba-часть эффективно обрабатывает длинные последовательности без тяжёлых attention-кэшей, 🔹 а Transformer-слои сохраняют способность к сложным рассуждениям. Результат, модель кушает меньше памяти, выдает высокую скорость и плавно работает даже на ноутбуках, GPU и мобильных устройствах. 📏 Контекст: до 256K токенов. ⚡ Скорость: около 40 токенов/сек даже на длинных контекстах, тогда как другие модели резко замедляются. На графике “интеллект против скорости” Jamba 3B опережает Gemma 3 4B, Llama 3.2 3B и Granite 4.0 Micro, демонстрируя высший интеллект и более быструю генерацию. 🟢Подробнее: huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B @ai_machinelearning_big_data #AI#LLM#Jamba3B#AI21#Mamba#Transformer#DeepLearning
@githubtrending · Post #15385 · 01/02/2026, 12:30 PM
#python#deep_learning#inference#openai#quantization#speech_recognition#speech_to_text#transformer#whisper Faster-Whisper is a fast version of OpenAI's Whisper that transcribes audio up to 4x quicker with the same accuracy, using less memory on CPU or GPU—benchmarks show it beats original Whisper (e.g., 1m03s vs 2m23s for 13-min audio on GPU). Install via `pip install faster-whisper`, no FFmpeg needed, and use simple Python code like `WhisperModel("large-v3").transcribe("audio.mp3")` for segments with timestamps. You benefit by getting quick, efficient speech-to-text for real-time apps, saving time and resources on long files or batches. https://github.com/SYSTRAN/faster-whisper
@githubtrending · Post #15362 · 12/23/2025, 03:30 PM
#python#audio_generation#diffusion#image_generation#inference#model_serving#multimodal#pytorch#transformer#video_generation vLLM-Omni is a free, open-source tool that makes serving AI models for text, images, videos, and audio fast, easy, and cheap. It builds on vLLM for top speed using smart memory tricks, overlapping tasks, and flexible resource sharing across GPUs. You get 2x higher throughput, 35% less delay, and simple setup with Hugging Face models via OpenAI API—perfect for building quick multi-modal apps like chatbots or media generators without high costs. https://github.com/vllm-project/vllm-omni
@githubtrending · Post #14845 · 06/20/2025, 11:30 AM
#jupyter_notebook#ai#artificial_intelligence#chatgpt#deep_learning#from_scratch#gpt#language_model#large_language_models#llm#machine_learning#python#pytorch#transformer You can learn how to build your own large language model (LLM) like GPT from scratch with clear, step-by-step guidance, including coding, training, and fine-tuning, all explained with examples and diagrams. This approach mirrors how big models like ChatGPT are made but is designed to run on a regular laptop without special hardware. You also get access to code for loading pretrained models and fine-tuning them for tasks like text classification or instruction following. This helps you deeply understand how LLMs work inside and lets you create your own functional AI assistant, gaining practical skills in AI development[1][2][3][4]. https://github.com/rasbt/LLMs-from-scratch
@githubtrending · Post #14659 · 05/01/2025, 03:30 PM
#cplusplus#arm#convolution#deep_learning#embedded_devices#llm#machine_learning#ml#mnn#transformer#vulkan#winograd_algorithm MNN is a lightweight and efficient deep learning framework that helps run AI models on mobile devices and other small devices. It supports many types of AI models and can handle tasks like image recognition and language processing quickly and locally on your device. This means you can use AI features without needing to send data to the cloud, which improves privacy and speed. MNN is used in many apps, including those from Alibaba, and supports various platforms like Android and iOS. It also helps reduce the size of AI models, making them faster and more efficient. https://github.com/alibaba/MNN
@githubtrending · Post #14863 · 06/24/2025, 01:30 PM
#other#automl#chatgpt#data_analysis#data_science#data_visualization#data_visualizations#deep_learning#gpt#gpt_3#jax#keras#machine_learning#ml#nlp#python#pytorch#scikit_learn#tensorflow#transformer This is a comprehensive, regularly updated list of 920 top open-source Python machine learning libraries, organized into 34 categories like frameworks, data visualization, NLP, image processing, and more. Each project is ranked by quality using GitHub and package manager metrics, helping you find the best tools for your needs. Popular libraries like TensorFlow, PyTorch, scikit-learn, and Hugging Face transformers are included, along with specialized ones for time series, reinforcement learning, and model interpretability. This resource saves you time by guiding you to high-quality, actively maintained libraries for building, optimizing, and deploying machine learning models efficiently. https://github.com/ml-tooling/best-of-ml-python