Analhitza
ANALHITZAk euskarazko, gaztelaniako edo ingeleseko testu batetik ondorengo informazio linguistikoa erauzten lagunduko dizu:
- izenak, adjektiboak, aditzak, adberbioak...
- pertsona-izenak, leku-izenak...
- binakako, hirunakako eta launakako hitz-sekuentziak
- ... eta gehiago!
Testua fitxategi batean duzuna, hemen bertan kopiatuko duzuna edo web-orri batekoa izan daiteke, baina UTF8 kodeketan egon beharko du.
ANALHITZA erabiltzeko, sartu aztertu nahi duzun testua azpiko 3 aukera hauetakoren bat erabiliz, eta jarraian, testuaren hizkuntza aukeratu (euskara, gaztelania edo ingelesa). Apur bat itxaron ondoren, emaitzak Excel fitxategi batean jasoko dituzu. Horrela, emaitzak modu errazean moldatu ahal izango dituzu zure beharretara.
ANALHITZAk testua automatikoki prozesatzen du ixaKat (euskararako) eta Ixa pipes (gaztelania eta ingeleserako) hizkuntza prozesatzaileen kate modularrak erabiliz.
ANALHITZA, hizkuntza-teknologiak baliatuz, humanitateetako eta giza zientzietako ikertzaileei datu linguistiko fidagarriak eta erraz manipula daitezkeenak eskaintzeko helburuarekin diseinatu da. Hauetako arloren batean zure ikergaia definituta baduzu, testu-multzo bat eskura baduzu eta ANALHITZArekin aztertzeko interesa baduzu, idatzi eta lagunduko dizugu: mikel.iruskieta@ehu.eus
ANALHITZA erabiltzen baduzu zure ikerketaren batean, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:
Otegi, A. Imaz, O. Díaz de Ilarraza, A. Iruskieta, M. Uria, L. 2017 ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research. Procesamiento del Lenguaje Natural 58: 77-84.