BERTeus
BERTeus
BERT (Devlin et al., 2019) hizkuntza eredua entrenatu dugu euskararako BMC corpusa (Basque Media Corpus) erabiliz. Entrenamendurako corpusak 224,6 milioi token ditu, eta horietatik 35 milioi Wikipediatik jaso dira.
BERT hitzkuntza eredua euskararako
Ander Barrena
ander.barrena@ehu.eus
Deskarga
Hizkuntza
UPV/EHU
HiTZ zentroa - Ixa taldea
idatzizkoa