« Itzuli albistegira

Hiztegia eta gramatika sarean

2008-05-06  ¦  Ilazki

EHUko Euskara Institutuak (www.ei.ehu.es) badu asmoa zenbait lan interesgarriri ekiteko hurrengo hilabete eta urteetan. Proiektu erraldoi bat du esku artean, Patxi Goenaga, Pello Salaburu eta Ibon Sarasolaren ardurapean.

www.erabil.com

Proiektu horrek bi hanka ditu, beregainak biak, baina elkarrekin lotuak: egungo euskararen euskal hiztegia eta gramatika. Hiztegiaren inguruko lanak Ibon Sarasolaren ardurapean daude, eta gramatikarenak Goenagak eta Salaburuk zuzentzen dituzte. Lan horiek guztiak koordinatuak daude.

Zein dira lanen berezitasunak?

Has gaitezen hiztegiaren kontuarekin. Institutuak sarean jarri nahi du egungo euskal prosaren hiztegi erraldoi bat. Hiztegi honen ezaugarri nagusia da gaurko euskal prosan oinarritzen dela, 2000tik aurrera euskaraz idatzitako prosa aukeratuan, liburuetako eta egunkari-aldizkarietako prosan. Hiztegi honen oinarria Ereduzko Prosa Gaur izeneko corpusa da (http://www.ehu.es/euskara-orria/euskara/ereduzkoa/). Corpus hau EHUk bultzatzen du, Donostiako Udalak eta Gipuzkoako Diputazioak ematen duten dirulaguntzarekin. Azkeneko urteetan haziz joan da pixkanaka corpusa, eta gaur egun han daude bildurik 287 liburu eta testu asko Berria egunkarikoak eta Herria astekarikoak. Denetara 25 milioi hitz baino gehiago biltzen ditu corpus horrek, eta ez dago asmorik liburu gehiago sartzeko, bi arrazoiengatik: hori egingo balitz, pisuegia izango litzateke erosotasunez ongi erabiltzeko, eta ez luke orain dagoena baino askoz ere informazio gehiago emango, gauzak errepikatuko bailirateke. Ideia bat izateko, Orotariko Euskal Hiztegia 5 milioi inguruko hitz kopuruko corpusean oinarritzen da. Testu historikoak dira gehienbat, jakina denez. Ereduzko Prosako Corpusa ez da corpus estatistikoa, baizik aukeratua. Ongi edo gaizki aukeratua, baina aukeratua. Horren arduradunek aukeratu dituzte 2000-2006ko epean euskara txukunean idatzitako testuak, erreferentziakoak izan daitezkeenak.

Hiztegi Batua Euskal Prosan (http://www.ehu.es/ehg/)

Orain landu nahi den hiztegia corpus horretan oinarritzen da. Hori dela eta, hiztegiaren ezaugarriak argiak dira: hiztegiak gaur egun erabiltzen den lexikoa bildu nahi du, erreferentziakoak izan daitezkeen idazleek zinez eta egiaz erabiltzen duten lexikoa. Badira corpuseko liburu horien artean itzulpenak, noski, baina literatura itzulpenak dira batez ere, corpusean ez baita administrazioko euskara (buletinetakoa, esan nahi dut) bildu. Euskal testu aukeratuak hartu dira kontuan, helburu horrekin sortu zen corpusa. Gaurko euskaraz ari garela esan daiteke, hortaz.

Baina delako hiztegi horren ezaugarriak azaldu aurretik, esan dezadan lana ez dela hutsetik hasi. Euskara Institutuko talde batek zenbait urte daramatza lanean Euskaltzaindiak 2000. urtean argitaratu zuen Hiztegi Batua eta gaurko euskaran benetan erabiltzen den hiztegia konparatu nahirik. Interesgarria baita, gure ustez, jakitea nolako desberdintasunak dauden. Pentsatzekoa da % 90etik goiti hitzak berdinak izango direla, baina interesgarria da, bestetik, beste mota honetako informazioak ere izatea, Hiztegi Batua gehiago oinarritzen baita informazio historikoan, egungo euskaran baino. Eta hala behar ere, gurdia bere tokian ikusi nahi badugu. Badira Hiztegi Batuan bai, baina egungo idazleek erabiltzen ez dituzten hitzak? Badira idazleek erabiltzen dituzten hitzak, baina Hiztegi Batuan ageri ez direnak? Badira, amaitzeko, Euskaltzaindiak modu batera, baina idazleek beste modu batera nahiago dituzten hitzak? Galdera horiei erantzun nahi die Euskara Institutuak. Eta lan hori egin du, hain zuzen ere, sarean dagoen bere Hiztegi Batua Euskal Prosan izeneko hiztegian. Hau egin nahi den hiztegi handiagoaren oinarria besterik ez da, ezinbesteko oinarria. Hiztegi Batua Euskal Prosan (http://www.ehu.es/ehg/) da, hain zuzen ere, Euskara Institutuak hurrengo urteetan egin nahi duen beste hiztegi zabalago batena. Une honetan, "F" letratik hasita 12 letra daude dagoeneko kontsultatzeko moduan oinarrizko hiztegi horretan. Eta hitza bilatuz gero, han ikusten da, sarrera bakoitzean, Hiztegi Batuan dagoen edo ez, Hiztegi Batuan egonik ere idazleek erabiltzen dituzten edo ez, eta abar. Goiko galderei ematen zaie erantzuna. Eta, aldi bakoitzean, zein idazlek zein hitz erabiltzen duen ikus daiteke. Lan hau, esan bezala, osorik egina egongo da hurrengo hilabeteetan (hile bakoitzean 3 letra gaineratzen dira, gutxi gorabehera).

Egungo Euskararen Hiztegia (http://www.ehu.es/eeh/)

Baina, esan bezala, Hiztegi Batua Euskal Prosan izeneko lana, beste hiztegi baten aurrekaria besterik ez da. Hiztegi hori, euskara-euskara hiztegia, Egungo Euskararen Hiztegia deitu dugu. Hiztegi klasikoa da, nahi bada, sarrera bakoitzean definizioa ematen baita, eta dituen esanahi guztiak lerroan ageri baitira, adibide mordo batekin azalduak. Urte batzuk beharko dira hiztegi hau bukatzeko, nahiz dagoeneko % 10 baino gehiago sarean kontsulta daitekeen. Sarrera bakoitzaren definizio eta erabileraz gain, adibide asko ematen dira, esan bezala, eta hitz multzoen inguruko informazioa ere. Gainera, bi hiztegiak (aurrean aipatu duguna eta azkeneko hau) loturik daude. Hiztegi honetan sartuak daude dagoeneko F, G eta H letrak, kontsultatzeko moduan. Neurria dela eta, kontuan hartu behar da hiru letra horien inguruan 80.000 adibide bildu direla, adibide aukeratuak, noski, informazio diferentea ematen dutenak, testuingurua errepikatu gabe. Urtea bukatu baino lehen letra gehiago sartuko da, eta hor dagoen informazioa osatuko da hitz teknikoekin eta gramatika hitzekin, beste fase batean. Historiari buruzko informazioa ere sartuko da. Informazio hori guztia askea da, eta nahi duenak saretik deskarga dezake bere ordenagailuan.

Sareko Euskal Gramatika (SEG)

Hau da proiektuaren beste hanka, aurrekoarekin lotua. Lantalde handi bat ari da gramatika hau lantzen. Oinarrizko taldean daude, besteak beste, eta hiru zuzendariez gain, Miren Azkarate, Itziar Idiazabal, Joseba Lakarra, Lourdes Oņederra, Koldo Zuazo, Beņat Oiartzabal, Jon Ortiz de Urbina, Jose Ignacio Hualde, Xabier Alberdi, Itziar Laka, Igone Zabala, Iņaki Ugarteburu, eta abar. Ikusten denez, erakunde askotako ikertzaileak dira: EHU, Deustuko Unibertsitatea, CNRS, Chicagoko Unibertsitatea, eta abar. Beste lagun askok ere hartuko dute parte, oinarrizko talde honetaz gain, lan honetan, horretan interesa izan dezakeen jendea inplikatu nahi baitugu.

Gramatika hau egungo euskaran oinarrituko da nagusiki, eta orain kontsulta daitezkeen gainerako gramatikekin erkaturik, beste ezaugarri batzuk ditu. Hasteko, sareko gramatika da, paperera eramango ez dena. Sarean jartzeko diseinatua, alegia. Horrek beste antolaketa mota bat eskatzen du, jakina. Gutxi dira munduan, oker ez bagara, holako gramatikak, egia esateko. Bat ezagutzen dugu Quebec-en, frantsesez. Baina gure asmoa askoz ere zabalagoa da hura baino. Zabalago, gai motak hartzen badira kontuan, eta zabalago, gai bakoitzaren tratamenduan ere. Gaiei dagokienez, ohikoak diren gaiekin batera (perpausa, izen sintagmak, perpaus elkartuak, eta abar) hain ohikoak ez diren gaiak ere ukituko dira (fonetika eta fonologia, hizkuntzaren jabekuntza, hizkuntzaren prozesamendua, dialektologia, datu soziolinguistikoak, eta abar). Bestetik, tratamenduari dagokionez, maila bat baino gehiago izango du gramatikak. Batetik, azalpen zabalak, behar diren adibideekin. Zalantzak ere bilduko dira, eta kanpotik jendeak parte hartzeko aukera izango du, neurri batean bederen, gramatika irekia egin nahi baitugu. Baina, azalpen horiez gain, beste azalpen sakonagoak ere bilduko ditu, interes bereziko puntuak, eta abar. Horiek sinatuak joango dira, eta edozein hizkuntzatan idatziak izango dira. Asmoa da azalpen zabal horiek (sinatu gabe daudenak, lantaldeari dagozkionak), beste hizkuntzetara itzultzea hurrengo urteetan. Oraindik ez da jarri ezer ere sarean, asmoa baita behin jarriz gero atal garrantzizko batzuk batera jartzeko.

Lan hau MEC-en laguntzarekin egiten da, aurrera ateratzeko 320.000 euro eman baititu.

Beraz, hauek dira proiektu handi honen bi hankak: hiztegia eta gramatika sarean. Urte batzuk beharko dira guztia bukatzeko. Baina uste dugu erabiltzaileentzat mesedegarria izango dela guztiz, lanabes baliosoa paratuko baitugu sarean, nahi duenak modu askean erabil dezan.

(PELLO SALABURU ETXEBERRIA hizkuntzalaria eta euskaltzaina da)