Π‘ΡΠ΄ΡΡΠΆΠ°Π½ΠΈΠ΅
π Aya Expanse: ΡΠ΅ΠΌΠ΅ΠΉΡΡΠ²ΠΎ ΠΌΡΠ»ΡΡΠΈΡΠ·ΡΡΠ½ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° 32 ΠΈ 8 ΠΌΠ»ΡΠ΄. ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² ΠΎΡ CohereForAI. Π‘Π΅ΠΌΠ΅ΠΉΡΡΠ²ΠΎ Aya Expanse - ΡΡΠΎ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΈΠΉ ΡΠ΅Π»ΠΈΠ· ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ ΡΠ°Π·Π²ΠΈΡΡΠΌΠΈ ΠΌΡΠ»ΡΡΠΈΡΠ·ΡΡΠ½ΡΠΌΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ. Aya Expanse - ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½Π΅Π½ΠΈΡ ΡΠ΅ΠΌΠ΅ΠΉΡΡΠ²Π° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Command Ρ ΠΈΡΠΎΠ³Π°ΠΌΠΈ Π³ΠΎΠ΄ΠΈΡΠ½ΡΡ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠΉ Cohere For AI Π² ΠΎΠ±Π»Π°ΡΡΠΈ Π°ΡΠ±ΠΈΡΡΠ°ΠΆΠ° Π΄Π°Π½Π½ΡΡ , ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΌΠ½ΠΎΠ³ΠΎΡΠ·ΡΡΠ½ΡΠΌ ΠΏΡΠ΅Π΄ΠΏΠΎΡΡΠ΅Π½ΠΈΡΠΌ, Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡΠΈ ΠΈ ΡΠ΅Ρ Π½ΠΈΠΊ ΠΌΠ΅ΡΠ΄ΠΆΠ° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. ΠΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ±ΡΡΠ΅Π½Ρ Π΄Π»Ρ ΠΈΠ½ΡΠ΅ΡΠ΅Π½ΡΠ° Π½Π° 23 ΡΠ·ΡΠΊΠ°Ρ : Π°ΡΠ°Π±ΡΠΊΠΈΠΉ, ΠΊΠΈΡΠ°ΠΉΡΠΊΠΈΠΉ (ΡΠΏΡΠΎΡΠ΅Π½Π½ΡΠΉ ΠΈ ΡΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½ΡΠΉ), ΡΠ΅ΡΡΠΊΠΈΠΉ, Π³ΠΎΠ»Π»Π°Π½Π΄ΡΠΊΠΈΠΉ, Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΈΠΉ, ΡΡΠ°Π½ΡΡΠ·ΡΠΊΠΈΠΉ, Π½Π΅ΠΌΠ΅ΡΠΊΠΈΠΉ, Π³ΡΠ΅ΡΠ΅ΡΠΊΠΈΠΉ, ΠΈΠ²ΡΠΈΡ, Ρ ΠΈΠ½Π΄ΠΈ, ΠΈΠ½Π΄ΠΎΠ½Π΅Π·ΠΈΠΉΡΠΊΠΈΠΉ, ΠΈΡΠ°Π»ΡΡΠ½ΡΠΊΠΈΠΉ, ΡΠΏΠΎΠ½ΡΠΊΠΈΠΉ, ΠΊΠΎΡΠ΅ΠΉΡΠΊΠΈΠΉ, ΠΏΠ΅ΡΡΠΈΠ΄ΡΠΊΠΈΠΉ, ΠΏΠΎΠ»ΡΡΠΊΠΈΠΉ, ΠΏΠΎΡΡΡΠ³Π°Π»ΡΡΠΊΠΈΠΉ, ΡΡΠΌΡΠ½ΡΠΊΠΈΠΉ, ΡΡΡΡΠΊΠΈΠΉ, ΠΈΡΠΏΠ°Π½ΡΠΊΠΈΠΉ, ΡΡΡΠ΅ΡΠΊΠΈΠΉ, ΡΠΊΡΠ°ΠΈΠ½ΡΠΊΠΈΠΉ ΠΈ Π²ΡΠ΅ΡΠ½Π°ΠΌΡΠΊΠΈΠΉ. Aya Expanse - Π°Π²ΡΠΎΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΎΠ½ΡΠ΅ ΡΠ·ΡΠΊΠΎΠ²ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ΅ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ΅ΡΠΎΠ² ΠΈ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠΎΠΌ Π² 128 ΡΡΡ. ΡΠΎΠΊΠ΅Π½ΠΎΠ² Ρ 32b ΠΈ 8 ΡΡΡ. ΡΠΎΠΊΠ΅Π½ΠΎΠ² Ρ 8Π: π’Aya Expanse 32B π’Aya Expanse 8B ΠΠ²Π°Π½ΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π²Π΅ΡΡΠΈΠΈ Π² ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΡΡ ΠΎΡ 2-bit Π΄ΠΎ 16-bit Π² ΡΠΎΡΠΌΠ°ΡΠ΅ GGUF: π Aya Expanse 32B-GGUF π Aya Expanse 8B-GGUF ΠΠ»ΠΎΠΊΠ½ΠΎΡΡ Π½Π° Google Collab ΠΎΡ ΡΠΎΠΎΠ±ΡΠ΅ΡΡΠ²Π° Cohere For AI: π’ΠΠ½ΡΠ΅ΡΠ΅Π½Ρ Π°ΡΡΠΈΡΡΠ΅Π½ΡΠ° ΠΏΠΎ ΡΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ² Π½Π° ΡΠ°Π·Π½ΡΡ ΡΠ·ΡΠΊΠ°Ρ ; π’ΠΠ½ΡΠ΅ΡΠ΅Π½Ρ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΊΡΠ»ΠΈΠ½Π°ΡΠ½ΡΡ ΡΠ΅ΡΠ΅ΠΏΡΠΎΠ² Ρ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΠΌΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ; π’ΠΠ½ΡΠ΅ΡΠ΅Π½Ρ ΠΌΡΠ»ΡΡΠΈΡΠ·ΡΡΠ½ΠΎΠΉ ΡΠΈΡΡΠ΅ΠΌΡ QA Π΄Π»Ρ Π½Π΅ΠΏΠΎΠ»Π½ΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Π½ΡΡ ΡΠΏΠΎΡΡΠΈΠ²Π½ΡΡ ΠΏΡΠ°Π²ΠΈΠ» ΠΏΠΎ ΡΠΎΠ»Π»Π΅Ρ-Π΄Π΅ΡΠ±ΠΈ ; π ΠΠΎΠ΄ Π΄Π»Ρ SFT-ΡΠ°ΠΉΠ½ΡΡΠ½Π° Aya Expanse 8B Π΄Π»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ Π±Π΅Π½Π³Π°Π»ΡΡΠΊΠΎΠΌΡ ΡΠ·ΡΠΊΡ. βΆοΈΠΡΠΈΠΌΠ΅Ρ ΠΈΠ½ΡΠ΅ΡΠ΅Π½ΡΠ° Aya Expanse 8B Π½Π° Transformers : from transformers import AutoTokenizer, AutoModelForCausalLM model_id = "CohereForAI/aya-expanse-8b" tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained(model_id) # Format the message with the chat template messages = [{"role": "user", "content": " %prompt% "}] input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt") ## <BOS_TOKEN><|START_OF_TURN_TOKEN|><|USER_TOKEN|>%prompt%<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|> gen_tokens = model.generate( input_ids, max_new_tokens=100, do_sample=True, temperature=0.3, ) gen_text = tokenizer.decode(gen_tokens[0]) print(gen_text) πΠΠΈΡΠ΅Π½Π·ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅: CC-BY-NC License. π‘ΠΠΎΠ»Π»Π΅ΠΊΡΠΈΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° HF π‘ΠΠ°Π±ΠΎΡ GGUF 32B π‘ΠΠ°Π±ΠΎΡ GGUF 8B π‘Demo @ai_machinelearning_big_data #AI#ML#LLM#CohereForAI#AyaExpanse