В Linux стандартными средствами можно использовать часть оперативной памяти как диск. Для этого требуется указать тип монтирования tmpfs в команде mount
mount -t tmpfs -o size=5G tmpfs /mnt/ram
Теперь путь /mnt/ram можно использовать как обычный каталог. Для чего это может быть нужно?
▫️ Скорость работы с таким каталогом выше чем многие SSD и тем более HDD.
▫️ Если у вас очень быстрый SSD на NVMe M.2 то такой способ особо не прибавит вам скорости, но поможет сохранить ресурс SSD когда требуется обрабатывать очень много мелких файлов и оперативка позволяет выделить нужный объем.
▫️ Оперативка это энергозависимая память, поэтому выключении питания все файлы безвозвратно теряются. Такой "non persistent" каталог гарантирует удаление временных файлов.
Я написал небольшой скрипт для условного теста и сравнения скорости копирования файлов между SSD и RAM.
Вот мои результаты:
Single File Size: 30.0Gb
ssd > ssd: 0:00:12.850 / 2.3Gb/s
sdd > ram: 0:00:06.453 / 4.6Gb/s
ram > ram: 0:00:06.995 / 4.3Gb/s
ram > sdd: 0:00:06.217 / 4.8Gb/s
Dir size: 32.7Gb, File count: 11127
ssd > ssd: 0:00:15.063 / 2.2Gb/s
sdd > ram: 0:00:08.486 / 3.9Gb/s
ram > ram: 0:00:08.032 / 4.1Gb/s
ram > sdd: 0:00:07.026 / 4.7Gb/s
Скрипт для теста ↗️
На моём железе прирост скорости ~2x. Плюс экономия ресурса SSD.
В Windows такой фишки по умолчанию нет, но обязательно найдутся аналогичные решения
#linux#triks
Обновление моделей LlaMa в GPTunneL🦙
⚡️ Мы добавили новую LlaMa 3.1 405b с 405 миллиардами параметров — на сегодняшний день это самая мощная модель ИИ с открытым исходным кодом.
По утверждениям разработчиков, LlaMa 3.1 превосходит такие модели, как GPT-4o и Claude 3.5 Sonnet от Anthropic в различных областях, включая общие знания, кодирование и математику.
〰️ Кроме того, вывели из альфа-версии LlaMa 3.1 70b и LlaMa 3.13.8b, содержащие 70 и 8 миллиардов параметров соответственно. Эти модели стали еще стабильнее, что позволяет вам получать более качественные результаты.
➡️ Переходи в GPTunneL и тестируй модели LlaMa 3.1
🪅 Если захочешь сравнить новинку с другими моделями, загляни в нашу Арену.
#update#llama3
LlaMa 3 — первая open-source LLM-модель в GPTunneL🪅
Мы запустили новейшую модель в альфа-режиме — LlaMa 3 70b и LlaMa 3 8b (70 и 8 млрд параметров соответственно)!
В Meta утверждают, что Llama 3:
➡️ обладает высокой скоростью обучения и эффективно работает с большими объемами данных;
➡️ превосходит конкурентов в точности генерации текста и производительности;
➡️ отлично справляется с программированием.
👍 Протестируй LlaMa 3 в GPTunneL
☝️ LlaMa 3 рекомендована к использованию на английском языке. При работе на русском возможны небольшие галлюцинации.
#update#llama3
#go#gemma3#go#gpt_oss#granite4#llama#llama3#llm#on_device_ai#phi3#qwen3#qwen3vl#sdk#stable_diffusion#vlm
NexaSDK runs AI models locally on CPUs, GPUs, and NPUs with a single command, supports GGUF/MLX/.nexa formats, and offers NPU-first Android and macOS support for fast, multimodal (text, image, audio) inference, plus an OpenAI‑compatible API for easy integration. This gives you low-latency, private on-device AI across laptops, phones, and embedded systems, reduces cloud costs and data exposure, and lets you deploy and test new models immediately on target hardware for faster development and better user experience.
https://github.com/NexaAI/nexa-sdk
#jupyter_notebook#chatglm#chatglm3#gemma_2b_it#glm_4#internlm2#llama3#llm#lora#minicpm#q_wen#qwen#qwen1_5#qwen2
This guide helps beginners set up and use open-source large language models (LLMs) on Linux or cloud platforms like AutoDL, with step-by-step instructions for environment setup, model deployment, and fine-tuning for models such as LLaMA, ChatGLM, and InternLM[2][4][5]. It covers everything from basic installation to advanced techniques like LoRA and distributed fine-tuning, and supports integration with tools like LangChain and online demo deployment. The main benefit is making powerful AI models accessible and easy to use for students, researchers, and anyone interested in experimenting with or customizing LLMs for their own projects[2][4][5].
https://github.com/datawhalechina/self-llm