#other#agent#llm#rag
Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research.
https://github.com/datawhalechina/happy-llm
🎉DeepSeek R1: год спустя
Ровно год назад дебютировала DeepSeek-R1, сделавшая ставку на глубокие рассуждения (reasoning). За это время она заняла прочную нишу в математике, программировании и точных науках, предлагая высокую эффективность и точность.
💎Чем DeepSeek выгоден читателю канала?
➡️Эксперт в логике: Сильнее многих в решении сложных задач, требующих последовательных рассуждений.
➡️Эффективен: Использует не все параметры на запрос, что часто делает ответ быстрее и экономичнее.
➡️Открыт: Модель с открытым исходным кодом.
➡️Бесплатен! Да, это до сих пор странно и приятно, с учётом дикой зависимости всех производителей от огромного парка железа, потребляющего электроэнергию.
🔍Намёк на новое?
Недавно DeepSeek обновили исходную статью о R1: она «выросла» с 22 до 86 страниц. Обновление вышло ровно через год после релиза модели. Это совпадение или тихая подготовка к анонсу R2 (которую ждали в мае, а потом в августе 2025) или другой новинки в этом январе? Ждём.
#DeepSeek#R1#R2#ИИ#AI#LLM
https://t.me/semasci
Found a random cipher puzzle on a YouTube video. It was easy enough that I can figure out how to solve it in a few seconds, but I was lazy to do the math, so I threw it to the “thinking” #LLM s.
Surprisingly, despite how easy it looks, only #ChatGPT#o1 managed to solve it correctly. #DeepSeek#R1 and #Gemini 2.0 Flash Thinking Experimental 01-21 has confused themselves, and reached wrong conclusions.
Prompt:
Please solve the puzzle
The code to decode is:
0820201619://2515212021.0205/42151797290590-224531
The hints provided are:
car: 030118
Apple: 2716161205
1-1: 91-91
Response from GPT o1: https://chatgpt.com/share/67971451-2ee0-8013-9d80-9899543614ae
Response from DeepSeek and Gemini: https://gist.github.com/blueset/828cbc3de9efa9af44a1379dc26e2785
🐟