From d6f01891f6d3c71fb1d97bf9221b4c2cab4a8d10 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Karen=20Langg=C3=A5rd?= Date: Thu, 14 Nov 2024 17:36:25 +0100 Subject: [PATCH] x --- src/cg3/dependency.cg3 | 30 ++++++++++++++--- src/cg3/disambiguator.cg3 | 52 ++++++++++++++++++++++++----- src/cg3/functions.cg3 | 44 +++++++++++++++--------- src/fst/morphology/stems/nouns.lexc | 2 +- 4 files changed, 100 insertions(+), 28 deletions(-) diff --git a/src/cg3/dependency.cg3 b/src/cg3/dependency.cg3 index 7f09d32e3..e783043c8 100644 --- a/src/cg3/dependency.cg3 +++ b/src/cg3/dependency.cg3 @@ -47,6 +47,7 @@ SETPARENT:M_parentes01B9 @N< + (*) IF (1 ("\)")) (NEGATE 0 CONJ-C + $$KASUS LINK *-1 $$KASUS BARRIER (*) - PUNCT)#Grafikeri oqaloqatigalugu Canva (ALLALUUNNIIT) atorlugu ilusilerneqartarnissaanut siunnersortinnissaq pisariaqarsoraara. + TO (-2 (*)); #Narsaamanerit tarajuusut Brajasømi (saamerl.) Hundesømilu (talerperl.). ##taamaali+CONT vist altid CL-ADVL når i position 1 og endnu mere sandsynligt altid hvis sammen med LU, men tagges ofte fejlagtigt som i-ADVL til følgende verbalnomen @@ -370,6 +371,10 @@ SETPARENT:M_tidlig0101A @i-ADVL> + Ins IF (NOT p (*)) TO (1 Ins + CONJ-LU OR CONJ-LUUNNIIT LINK 1A (/"periar"\ Gram/IV\ VIK\ Der/vn\ SSAQ\ Der/nn\ N/l)) ;#- Najukkami ilinniarnissaMIK suliffittaarnissamilluunniit periarfissat killeqartuusinnaapput, imaluunniit ilinniakkamik naammassinninnissaq ajornakusoorsinnaalluni. +SETPARENT:M_tidlig0101A1 @ADVL> + Trm IF +(NOT p (*)) +TO (1 NIQ LINK *1 (/"periar"\ Gram/IV\ VIK\ Der/vn\ SSAQ\ Der/nn\ U\ Der/nv\ Gram/IV/l)+ V BARRIER V - CONT );#Piffissami qaninnerusumi qaqugukkut piffissaqarnersusi tusarfigerusupparput, qaqugukkut qanorilisumilu (nalunaaqutaq) *ilissinnut naapinnissaq periarfissaasinnaavamita? + SETPARENT:M_tidlig0101B @i-ADVL> + Prop + Lok IF (NOT p (*)) TO (1 Der/vn + VIK + N - CONJ-LU - Lok) ;#NarsaMI neqileriffik maajip aallaqqaataani nutaamik pisortaqalissaaq Kunuk Albrechtsen ukiorpassuarni aalisakkerinermi misilittagaqartoq pisortanngussammat. @@ -487,7 +492,7 @@ SETPARENT:M_tidlig0190 @i-ADVL> + MAANED + Abs IF (-1 Num) TO (1A NIQ LINK NEGATE *1 V); #Atorfik qinnuteqarfigisimavaa neriorsorneqarlunilu 1. APRIILI atorfininnissaminik. -SETPARENT:M_tidlig0195 @i-ADVL> + MAANED + Abs IF +SETPARENT:M_tidlig0194 @i-ADVL> + MAANED + Abs IF (NOT p (*)) TO (*1A (N NIQ) BARRIER (*) - OBLIQUE LINK NEGATE *1 V); #Periarfissaqarpugut TALLIMANNGORNEQ 19. august Eqaluit Paarlernut angallassinissamut. @@ -541,6 +546,7 @@ SETPARENT:M_tidlig0220A @i-ADVL> + Trm IF #Amarngivat siulersuisuini ilaasortaas (NEGATE -1 Trm LINK 1 _TARGET_ + Der/vn OR LIK LINK *1 HTR BARRIER V OR Der/vn)#Kommunini qinikkat kommunip aningaasaataanik agguaaleraangamik inunnut NAPPARSIMASUNUT isumaginninnissartik puigortarpaat. (NEGATE 0 ADJEKTIVISK + $$KASUS OR Der/vn + $$KASUS LINK -1 $$KASUS)#Napparsimasut napparsimmavimmi napparsimasunut ALLANUT tunillaannginnissaat pissutigalugu aggiinnassanngillat. + TO (1A NIQ LINK 1 V) ; @@ -1017,7 +1023,9 @@ SETPARENT:M_tidlig0797 @ADVL> + (/"aallar"\ Gram/IV\ QQAAR\ Der/vv\ Gram/IV\ UTE (NOT p (*)) TO (*1 VFIN OR Cau OR Con) ;#Aallaqqaammut alapernaarsuineq ullut tamaasa nalunaaqutaq 6 aamma 8 akornanni ingerlanneqartassaaq septembarip naanerata tungaanut. - +SETPARENT:M_tidlig0798 @N< + (/Gram/IV\ TUQ\ Der/vn\ N\ Abs/l) + $$NUMERUS IF +(NOT p (*)) +TO (1 ("\)") LINK -1 _TARGET_ LINK -*1 ("\(") LINK -1A Abs + $$NUMERUS );#Sandgreen (Oqaasileriffiunngooq normuata ujarnissaa eqiagilerlugu mobilinnut sianertoq) aperivoq nersussuaq miluumasullu suunersut. @@ -5502,6 +5510,10 @@ SETPARENT:OrObl0020x @ADVL> + CONT IF (-1 BOS) (NOT p (*)) TO (1A ORATIOOBLVERB + VFIN LINK *1 Par OR Cont) ;#Arlaleriarlutami tusartarparput, Naalakkersuisut patajaatsuunissaq pingaartikkaat. +SETPARENT:ORObl0020x1 @ + CONT IF (NOT p (*)) @@ -5611,6 +5623,10 @@ SETPARENT:OrObl0152 @CL- + CONT IF (*-1 ("aamma") LINK *-1 @CAU>) +(NOT p (*)) +TO (*1 VFIN) ; +#Qitigissat rockit nutaajunerpaat nipitoorujussuarmik kipissaanngitsumillu båndini kaavitinneqarmata aammalu oqallittut illartullu nipangissanatik, torlulaanngikkaanni tusaasaqarfiunngillat. + SETPARENT:1332 @ TARGET Ins IF (1 (/"periar"\ Gram/IV\ VIK\ Der/vn\ SSA MAP:M_tidlig0101A @i-ADVL> TARGET Ins IF (1 Ins + CONJ-LU OR CONJ-LUUNNIIT LINK 1 (/"periar"\ Gram/IV\ VIK\ Der/vn\ SSAQ\ Der/nn\ N/l)) ;#- Najukkami ilinniarnissaMIK suliffittaarnissamilluunniit periarfissat killeqartuusinnaapput, imaluunniit ilinniakkamik naammassinninnissaq ajornakusoorsinnaalluni. +MAP:M_tidlig0101A1 @ADVL> TARGET Trm IF (1 NIQ LINK *1 (/"periar"\ Gram/IV\ VIK\ Der/vn\ SSAQ\ Der/nn\ U\ Der/nv\ Gram/IV/l)+ V BARRIER V - CONT );#Piffissami qaninnerusumi qaqugukkut piffissaqarnersusi tusarfigerusupparput, qaqugukkut qanorilisumilu (nalunaaqutaq) *ilissinnut naapinnissaq periarfissaasinnaavamita? + MAP:M_tidlig0101B @i-ADVL> TARGET Prop + Lok IF (1 Der/vn + VIK + N - CONJ-LU - Lok) ;#NarsaMI neqileriffik maajip aallaqqaataani nutaamik pisortaqalissaaq Kunuk Albrechtsen ukiorpassuarni aalisakkerinermi misilittagaqartoq pisortanngussammat. MAP:M_tidlig0101Bx @i-ADVL> TARGET Prop + Lok IF (-1 Rel + Sg) (1 Der/vn + VIK + N + 3SgPoss - CONJ-LU ) ;#Inissiaatileqatigiiffiup INI-p Nuummi immikkoortortaqarfiani Atertami inissianik attartortut ineqarnerminnut ukiuni arfineq-marlunni akiliivallaartarsimapput. @@ -377,7 +380,8 @@ MAP:M_tidlig0180 @MIK-OBJ> TARGET Trm + HUMAN IF (*1 Ins + NON_HUMAN BARRIER V L #tidsangivelser i Abs er lidt uforudsigelige MAP:M_tidlig0190 @i-ADVL> TARGET MAANED + Abs IF (-1 Num)(1 NIQ LINK NEGATE *1 V); #Atorfik qinnuteqarfigisimavaa neriorsorneqarlunilu 1. APRIILI atorfininnissaminik. -MAP:M_tidlig0195 @i-ADVL> TARGET MAANED + Abs IF (*1 (N NIQ) BARRIER (*) - OBLIQUE LINK NEGATE *1 V); #Periarfissaqarpugut TALLIMANNGORNEQ 19. august Eqaluit Paarlernut angallassinissamut. +MAP:M_tidlig0194 @i-ADVL> TARGET MAANED + Abs IF (*1 (N NIQ) BARRIER (*) - OBLIQUE LINK NEGATE *1 V); #Periarfissaqarpugut TALLIMANNGORNEQ 19. august Eqaluit Paarlernut angallassinissamut. + MAP:M_tidlig0196 @>N TARGET Num + Gram/Ord IF (1 ("klasse") ) ;#Tassa inuusuttut 15-16-inik ukiullit 10. klassimi soraarummeernersiorlutik nuannassuataartut. @@ -414,7 +418,7 @@ MAP:M_tidlig0220A @i-ADVL> TARGET Trm IF (1 NIQ LINK 1 V) #Amarngivat siulersuis (NEGATE 0 NIQ LINK 1 NIQ + LU)#Taamaattoqassappat, aningaasanut inatsisitigut immikkoortinneqartartut umiarsualivinnut minnernut ANINGAASALEEQQINNERNUT iluarsartuussinernullu atorneqarsinnaalissapput. (NEGATE 0 ADJEKTIVISK + $$NUMERUS LINK -1 Trm + $$NUMERUS)#Umiarsualivinni annerni atuisunut akiliisitsisalernissaq taakkunani aningaasartuutinut matussusiisinnaassaaq, taavalu umiarsualivinnut MINNERNUT nutarterinissamut akissaqartoqalerluni. (NEGATE -1 Trm LINK 1 _TARGET_ + Der/vn OR LIK LINK *1 HTR BARRIER V OR Der/vn)#Kommunini qinikkat kommunip aningaasaataanik agguaaleraangamik inunnut NAPPARSIMASUNUT isumaginninnissartik puigortarpaat. -(NEGATE 0 ADJEKTIVISK + $$KASUS OR Der/vn + $$KASUS LINK -1 $$KASUS)#Napparsimasut napparsimmavimmi napparsimasunut ALLANUT tunillaannginnissaat pissutigalugu aggiinnassanngillat. +(NEGATE 0 ADJEKTIVISK + $$KASUS OR Der/vn + $$KASUS LINK -1 $$KASUS)#Napparsimasut napparsimmavimmi napparsimasunut ALLANUT ; MAP:M_tidlig0220Ax @i-ADVL> TARGET Num + Abl IF (-1 ("ulloq") + Rel LINK -1 MAANED + Rel) (1 MAANED + Rel LINK 1 ("ulloq") LINK 1 Num + Rel LINK 1 (/"tunge"\ N\ Trm/l) + @i-ADVL> LINK 1 NIQ + N LINK 1 V) ;#Kunngikkut Savalimmiunut tikeraarnissaraluannik taamaatitsineq nunatsinnut juunip ulluisa 29-annit juulip ulluisa arfineq-pingajuata tungaanut tikeraarnissaanut sunniuteqassaanngilaq. @@ -714,7 +718,8 @@ MAP:M_tidlig0796 @ADVL> TARGET (/"taamaali"\ Gram/IV\ V\ Cont/l) IF (*1 V LINK N MAP:M_tidlig0797 @ADVL> TARGET (/"aallar"\ Gram/IV\ QQAAR\ Der/vv\ Gram/IV\ UTE\ Der/vn\ N\ Trm\ Sg/l) IF (*1 VFIN OR Cau OR Con) ;#Aallaqqaammut alapernaarsuineq ullut tamaasa nalunaaqutaq 6 aamma 8 akornanni ingerlanneqartassaaq septembarip naanerata tungaanut. - +MAP:M_tidlig0798 @N< TARGET (/Gram/IV\ TUQ\ Der/vn\ N\ Abs/l) + $$NUMERUS IF (1 ("\)") LINK -1 _TARGET_ LINK -*1 ("\(") LINK -1 Abs + $$NUMERUS );#Sandgreen (Oqaasileriffiunngooq normuata ujarnissaa eqiagilerlugu mobilinnut sianertoq) aperivoq nersussuaq miluumasullu suunersut. + ########################################################################################################## ## Underafdeling af tidlig til løsning af/ forberedelse af løsning af koncessivsætninger uden KONCESSIV ## @@ -4061,6 +4066,8 @@ MAP:OrObl0020 @CL-ADVL> TARGET (/"ili"\ Gram/IV\ V\ Cont/l) IF (*-1 BOS BARRIER ###en regel med ADVL> + oroblverb + or obl MAP:OrObl0020x @ADVL> TARGET CONT IF (-1 BOS) (1 ORATIOOBLVERB + VFIN LINK *1 Par OR Cont) ;#Arlaleriarlutami tusartarparput, Naalakkersuisut patajaatsuunissaq pingaartikkaat. +MAP:ORObl0020x1 @ TARGET CONT IF (-1 BOS LINK *1 Abs LINK *1 ORATIOOBLVERB + TRANSVERB + VFIN BARRIER VFIN) (NEGATE 0 (/[12][SP][gl]/r) LINK *1 Con + ORATIOOBLVERB - (/[34][SP][gl]/r))#TAAMAALIORNIARLUSI aalajangerussi atuartitasi nammineerlusi ilisimatilaarumaarpasi. @@ -4151,6 +4158,9 @@ MAP:OrObl0152 @CL- TARGET Cau IF (*1 V - CONT - Gram/Gaanni OR CONT + DERTEMPORAL MAP:M1412 @ TARGET CONT + CONJ-LU IF (*1 @CAU> BARRIER (*) - OBLIQUE LINK * (NEGATE 0 Cont + 4Pl + CONJ-LU LINK *-1 Ind + 3Pl BARRIER (*) - KOMMA LINK *1 _TARGET_ LINK 1 Cau + 3Sg)#- Taakku imminnut ilisarisimasuusimapput, *erngussimallutillu pisoqarmat pigaartut pisortaat oqarpoq. ; #Anerpaluinnartoq tuaviinnaq matu silarleq parnaariartorpara, PARNAAREERLUGULU uterama ineeqqat tamaasa aqqusaaqattaarlugit misissorlugit allanik inoqarnersut. -MAP:M1331C @CAU> TARGET CONT IF (*-1 ("aamma") LINK *-1 @CAU>); +MAP:M1331C @CAU> TARGET CONT IF (*-1 ("aamma") LINK *-1 @CAU>) (*1 VFIN) ; #Qitigissat rockit nutaajunerpaat nipitoorujussuarmik kipissaanngitsumillu båndini kaavitinneqarmata aammalu oqallittut illartullu nipangissanatik, torlulaanngikkaanni tusaasaqarfiunngillat. MAP:M1333 @ IF (1 @N<) ; # Hvis det er en CL-CIT, er der ikke et adnominalt adled til højre for det. I så fald er det et objekt, eller det ord der er tagget som @N< er CL-CIT. Naasorli ajortuusoq paasigaanni. -SELECT:9970A (@CL-CIT>) IF (*1 ORATIOOBLVERB + V BARRIER V-NOT-Par LINK NOT 1 ("\:") LINK NOT -2 ("taama"))(NEGATE 0 Abs + Sg + Der/nv LINK -1 Sg + Abs)(NEGATE 0 Abs + Pl + Der/nv LINK -1 Sg + Pl)#Uden NEGATE hit på adled til objekt -(NEGATE *-1 @SUBJ> + Pl LINK 1 _TARGET_ LINK *1 ORATIOOBLVERB + NIQAR ) #Ilaqutaasut ikiorneqarumasut sumut saaffiginnissinnaanerannik paasitinneqareerput. Reglen ikke helt vandtæt, men næsten jf. Lene Espersenip timmisartuani aquttut Kabul-imut missinnaanngitsut paasitinneqarput -(NEGATE *1 ORATIOOBLVERB LINK *-1 Par + &&IV_SUBJ& LINK *-1 _TARGET_ + Abs + &&IV_SUBJ&)#Kalaallit meerartaat 1.000-it missaanni ITTUT inooqatigiinnikkut ilungersunartunik ajornartorsiuteqartut , immikkut ilisimasallit naliliipput . -(NEGATE 0 HUMAN + &&IV_SUBJ& LINK *1 humverb + &&IV_SUBJ& BARRIER (*) - Sem/Hum - KOMMA)#Kalaallit Nunaalli eqqarsarluartariaqartoq, nunanut allanut tunngasunut MINISTERIUSIMASOQ, Martin Lidegaard mianersoqqusivoq. -(NEGATE 0 Abs LINK 1 Abs + LU LINK *1 3PlO BARRIER (*) - OBLIQUE)#Kaffisortillutik nalinginnaq oqaloqatigiipput, palasip Juaap nakorsaq AALLARTOQ nulialu eqqartorneruai, nulia Sofia qallunaatut aamma oqaluttarpoq ileqqunillu kusanartunik aamma ilikkarsimalluni inuusuttuulluni qallunaani kiffaanikuugami. -(NEGATE 0 Abs + Pl LINK NEGATE *-1 VFIN + 3Pl LINK *1 VFIN + 3Pl BARRIER VFIN)#Upernavimmi angallannikkut periarfissat ajungaarmata Upernavimmi INNUTTAASUT Kalaallit Nunaata sinneranit avinngarusimasumiittutut mattussaasimasutullu misigisimapput, knr.gl allappoq. -(NEGATE 0 &&IV_SUBJ& + LINK NOT *-1 Abs + &&IV_SUBJ&)#Politiit ikuallattoqarneranut PISSUTAASOQ paasinialerpaat. -(NEGATE *1 TIMENOUN + Rel LINK *1 Num + Lok BARRIER (*) - TIMENOUN LINK *1 PASSIV + VFIN + 3Sg BARRIER V)#Pauline Kleist Deichmannip Aqqutaani PISUTTOQ januaarip ulluisa 19-ianni kingullermik takuneqarpoq, kingornalu Sisimiut illoqarfittaani, nunataani immamilu annertuumik ujaarineqarluni. +##KL:# 20241110 - diverse i disamb ændret efterfølgende +#SELECT:9970A (@CL-CIT>) IF (*1 ORATIOOBLVERB + V BARRIER V-NOT-Par LINK NOT 1 ("\:") LINK NOT -2 ("taama"))(NEGATE 0 Abs + Sg + Der/nv LINK -1 Sg + Abs)(NEGATE 0 Abs + Pl + Der/nv LINK -1 Sg + Pl)#Uden NEGATE hit på adled til objekt +#(NEGATE *-1 @SUBJ> + Pl LINK 1 _TARGET_ LINK *1 ORATIOOBLVERB + NIQAR ) #Ilaqutaasut ikiorneqarumasut sumut saaffiginnissinnaanerannik paasitinneqareerput. Reglen ikke helt vandtæt, men næsten jf. Lene Espersenip timmisartuani aquttut Kabul-imut missinnaanngitsut paasitinneqarput +#(NEGATE *1 ORATIOOBLVERB LINK *-1 Par + &&IV_SUBJ& LINK *-1 _TARGET_ + Abs + &&IV_SUBJ&)#Kalaallit meerartaat 1.000-it missaanni ITTUT inooqatigiinnikkut ilungersunartunik ajornartorsiuteqartut , immikkut ilisimasallit naliliipput . +#(NEGATE 0 HUMAN + &&IV_SUBJ& LINK *1 humverb + &&IV_SUBJ& BARRIER (*) - Sem/Hum - KOMMA)#Kalaallit Nunaalli eqqarsarluartariaqartoq, nunanut allanut tunngasunut MINISTERIUSIMASOQ, Martin Lidegaard mianersoqqusivoq. +#(NEGATE 0 Abs LINK 1 Abs + LU LINK *1 3PlO BARRIER (*) - OBLIQUE)#Kaffisortillutik nalinginnaq oqaloqatigiipput, palasip Juaap nakorsaq AALLARTOQ nulialu eqqartorneruai, nulia Sofia qallunaatut aamma oqaluttarpoq ileqqunillu kusanartunik aamma ilikkarsimalluni inuusuttuulluni qallunaani kiffaanikuugami. +#(NEGATE 0 Abs + Pl LINK NEGATE *-1 VFIN + 3Pl LINK *1 VFIN + 3Pl BARRIER VFIN)#Upernavimmi angallannikkut periarfissat ajungaarmata Upernavimmi INNUTTAASUT Kalaallit Nunaata sinneranit avinngarusimasumiittutut mattussaasimasutullu misigisimapput, knr.gl allappoq. +#(NEGATE 0 &&IV_SUBJ& + LINK NOT *-1 Abs + &&IV_SUBJ&)#Politiit ikuallattoqarneranut PISSUTAASOQ paasinialerpaat. +#(NEGATE *1 TIMENOUN + Rel LINK *1 Num + Lok BARRIER (*) - TIMENOUN LINK *1 PASSIV + VFIN + 3Sg BARRIER V)#Pauline Kleist Deichmannip Aqqutaani PISUTTOQ januaarip ulluisa 19-ianni kingullermik takuneqarpoq, kingornalu Sisimiut illoqarfittaani, nunataani immamilu annertuumik ujaarineqarluni. #Uhyre vanskelig at disambiguere. Det er vel kun tidsangivelsen der sandsynliggør, at Kleist blev set og ikke '*Den dato så man sidst, at Kleist gik' -; +#; + REMOVE:9970B Par + @CL- + &&IV_SUBJ& LINK *1 VFIN + &&IV_SUBJ&) (NEGATE *-1 Abs + &&IV_SUBJ& BARRIER KOMMA)#.. unnugu arfineq pingasut missaanni Nuummut tikinnissaat, Air Greenlandip timmisartunik AQUTSISOQARFIANEERSOQ, Hans Baadsgård oqaluttuarpoq. (NEGATE *-1 ORATIOOBLVERB - 3Sg - 3Pl BARRIER (*) - CONT - Adv)#Nalunngilara sangiakujulluni qinngasaaraluni taamatut OQALUTTOQ, Eskild oqarpoq, diff --git a/src/fst/morphology/stems/nouns.lexc b/src/fst/morphology/stems/nouns.lexc index efcaabe1c..61c503638 100644 --- a/src/fst/morphology/stems/nouns.lexc +++ b/src/fst/morphology/stems/nouns.lexc @@ -6663,7 +6663,7 @@ minillalasoq Z1Zmorf ; minillalasorsuusoq Z1Zmorf ; minisoq Z1Zmorf ; minisorujussuusoq Z1Zmorf ; -ministereqarfik Z2-Zmorf ; +!ministereqarfik Z2-Zmorf ; ministerium+OLang/DAN+Err/Sub:ministeeria Z1VZmorf ; ministerium+OLang/DAN+Err/Sub:ministeria Z1VZmorf ; minitaaneq Z2Zmorf ;