BasqueParl: Eusko Legebiltzarreko corpus elebiduna
Transkripzio parlamentarioek baliabide baliotsuak dira errealitatea ulertzeko eta gure gizarteetako gertaera garrantzitsuen berri izateko. Gainera, haietan bildutako eztabaida politikoek diskurtso politikoaren ikerketa errazten dute gizarte zientzien ikuspegitik. Lan honetan Eusko Legebiltzarreko transkripzioen corpus berri baten lehen bertsioa aurkezten dugu. Corpusa euskararen eta gaztelaniaren arteko aldaketen ugaritasuna du bereizgarri: hori dela-eta, inguru eleanitzetan diskurtso politikoa aztertzeko baliabide garrantzitsua da. Transkripzioak hiztunen eta hitzaldien ezaugarriekin erlazionatutako metadatuekin (hizkuntza, generoa, alderdia...) aberastu ditugu eta testuak prozesatu ditugu entitateak eta lemak erauzteko. Lortutako metadatuak corpusaren analisi zehatz bat egiteko erabili dira, ordezkari politikoen hizkuntzaren erabilera aztertzen duena denboran zehar eta alderdien eta generoaren arabera.