Ny utgåve av nynorsk–bokmål i Apertium

Eg lasta just opp ei ny utgåve av nynorsk–bokmål-språkparet i Apertium, du kan òg prøva det på apertium.org frå og med no. Det er snart fem år sidan sist gong, så det var vel på tide. Eg trur ikkje det er dei heilt store endringane i kvaliteten, utanom at me har lagt inn eit par fleire ord og retta nokre småfeil – hovudsakleg funne og rapportert av brukarane våre 🙂

Forskjellane er helst på utviklarsida: Datafilene er no omorganisert slik at dei einspråklege filene er i eigne pakker, for å unngå at andre språkpar mot dei same språka må ha sine eigne nesten-identiske kopiar av ordbøker og liknande. Dette er noko eg har jobba av og på med ein stund, sidan det kravde eit par endringar i byggsystemet i Apertium og at me tilpassar dei einspråklege ordbøkene til språkparet ved FST-kompilering. Til gjengjeld er det noko som alle språkpar i Apertium kan ha nytte av (og alle nye språkpar er laga på denne måten; dei gamle krev litt manuelt arbeid først).

Elles er det litt kult at det nye omsetjingsverktøyet til Wikipedia (Content Translation) no gir omsetjingsforslag med hjelp av Apertium:

Det var jo litt motiverande. Kanskje på tide å sjå om ikkje me kan få noko ut av norsk–engelsk.

Eller ikkje. Vel, prøv gjerne nye nynorsk–bokmål og gi ein kommentar her eller på IRC om du finn fleire rare omsetjingar 🙂

Motivasjon

apertium-sme-nob, januar 2010:

*– Bare tør mindre #tall fremme meninger #dette av sak , \@dat stund når \@eanas menneske av samfunn og #spesielt \@at , de tar \@vuostá muslimer med #åpen \@giehta . Jeg #bli også \@mo Tromsø av kommune kunne vi ser #dette sak slik med #lett \@miella når de gjør. \@Ii *jáhke dem #sann du forstår \@mii \@olu vanskelig *moskéa og \@eambbo #muslim kan #bringe til Norge , den #avrunde *Røyset. *Røyset den vraker pretensjon at *FMI organisasjon er #rasistisk .

 

apertium-sme-nob, juli 2010:

– Bare mindretallet tør å fremme meninger på denne saken, mens de fleste folk på samfunnet og spesielt kristne, de tar mot muslimene med åpne hender. Jeg forundres også hvordan på Tromsøs kommune kan de se denne saken slik med et lett sinn da du gjorde. Jeg tror ikke dem sanne å forstå som de mange problemenes *moskéa og de #mer muslimene kan bringe til Norge, han avslutter #Røyset. #Røyset vraker pretensjonen at *FMI organisasjonen er #rasistisk.

 

Originaltekst:

– Dušše unnitlohku duostá ovddidit oaiviliid dán áššis, dan botta go eanas olbmot servvodagas ja erenoamážit risttalaččat, váldet muslimaid vuostá rabas gieđaiguin. Mun imaštalan maiddái mo Romssa gielddas sáhttet geahččat dán ášši nu gehppes mielain go dahket. In jáhke sin duođaid áddet man olu váttisvuođaid moskéa ja eambbo muslimat sáhttet buktit Norgii, loahpaha Røyset. Røyset hilgu čuoččuhusa ahte FMI organisašuvdna lea rasisttalaš.

 

*, # og @ er debug-symbol, og vil seia at ordet manglar frå samisk-, bokmåls- eller omsetjingsordboka, høvesvis.