KabyleNLP

The project is now maintained on GitLab https://gitlab.com/belkacem77/KabyleNLP/tree/master

KabyleNLP

Natural language processing for the kabyle language

Deux algorithmes principaux:

le premier, générera uniquement le modèle d'apprentissage. Ce qui permettra de le ré-exécuter pour générer plusieurs modèles à partir de plusieurs corpus étiquetés manuellement et les sauvegarder sur le disque. Nous pourrons ensuite partager ces modèles en lignes pour les besoins des solutions.
Le deuxième est l'algorithme qui permettra de charger un modèle pour étiqueter un texte nouveau.
Correction et amélioration du corpus.
Amélioration de l'algorithme de tokenization intégré lors de l’exécution de l'algorithme d'étiquetage.
mise à jour du corpus des affixes pour les besoins de tokenization (segmentation.

Lors du POS tag: à partir du fichier brut_text.txt, l'algorithme d'étiquetage générera deux fichiers: Un fichier segmenté non étiqueté et un autre étiqueté.

Contribution:

Téléchargez le corpus, ajoutez vos modifications, testez puis envoyez.

Name		Name	Last commit message	Last commit date
Latest commit History 134 Commits
.circleci		.circleci
POSTAG		POSTAG
Tatoeba-corpus		Tatoeba-corpus
checksentences		checksentences
collector-stats		collector-stats
copus		copus
corpus		corpus
grammar-analysis		grammar-analysis
kerras		kerras
language-detection		language-detection
lemmatisation-racinisation		lemmatisation-racinisation
orthographica		orthographica
pretraitement		pretraitement
statistiques		statistiques
tatoeba/audio		tatoeba/audio
tokenization-syllabation		tokenization-syllabation
README.md		README.md
tatoebaKab-Audio-Download.py		tatoebaKab-Audio-Download.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

KabyleNLP

About

Releases

Packages

Languages

MohammedBelkacem/KabyleNLP

Folders and files

Latest commit

History

Repository files navigation

KabyleNLP

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages