HuggingFaceFW/fineweb-edu
Viewer β’ Updated β’ 3.5B β’ 476k β’ 1.15k
MicroLM2-1M Γ© um modelo de linguagem ultrapequeno (~1M parΓ’metros) treinado do zero com foco em inglΓͺs e portuguΓͺs.
Treinado em aproximadamente 4.5 bilhΓ΅es de tokens usando:
por_Latn)O resultado do MicroLM2-1M no BLiMP foi: 0.5422
from transformers import AutoTokenizer, LlamaForCausalLM
tokenizer = AutoTokenizer.from_pretrained(
"CromIA/MicroLM2-1M"
)
model = LlamaForCausalLM.from_pretrained(
"CromIA/MicroLM2-1M"
)
Projeto experimental voltado para: