explosion spaCy Language Support · Discussions · GitHub

Sort by: Latest activity

Language Support Discussions

Discuss the language data and training models for new languages

Pinned to Language Support

Adding models for new languages master thread
enhancement Feature requests and improvements lang / all Global language data new language Adding support for new languages to spaCy.
ines started Dec 16, 2018 in Language Support

141

Discussions

You must be logged in to vote

Ancient Greek language
feat / lemmatizer Feature: Rule-based and lookup lemmatization lang / grc Ancient Greek language data and models new language Adding support for new languages to spaCy.
jmyerston started Dec 21, 2020 in Language Support

16
You must be logged in to vote

Help on building Akkadian language model from scratch
feat / tokenizer Feature: Tokenizer feat / morphologizer Feature: Morphologizer new language Adding support for new languages to spaCy.
megamattc started Sep 18, 2022 in Language Support

32
You must be logged in to vote

Using Udify with spacy versus spacy's built-in transformer capabilities for custom language (Akkadian)
feat / transformer Feature: Transformer new language Adding support for new languages to spaCy.
megamattc started Oct 1, 2022 in Language Support

2
You must be logged in to vote

WordNet for English Transformer models
lang / en English language data and models models Issues related to the statistical models
kanayer started Sep 30, 2022 in Language Support

1
You must be logged in to vote

Hungarian language
lang / hu Hungarian language data and models
novabum started Sep 15, 2022 in Language Support

1
You must be logged in to vote

"|" not set as is_punct
lang / da Danish language data and models lang / nb Norwegian (Bokmål) language data and models
lise-brinck started Aug 10, 2022 in Language Support

1
You must be logged in to vote

Procedure on adding alpha support for Maltese
new language Adding support for new languages to spaCy.
drvenabili started Jul 22, 2022 in Language Support

2
You must be logged in to vote

Custom tokenization based on the sentence structure
feat / tokenizer Feature: Tokenizer
orglce started Jul 5, 2022 in Language Support

4
You must be logged in to vote

Hindi Language support
lang / hi Hindi language data and models v2 spaCy v2.x
jaggadas started Jun 20, 2022 in Language Support

3
You must be logged in to vote

Spanish lemmatizer doesn't work for future tense verbs
lang / es Spanish language data and models feat / lemmatizer Feature: Rule-based and lookup lemmatization
buhrmann started Feb 24, 2022 in Language Support

5
You must be logged in to vote

Custom NER for other languages.
training Training and updating models feat / ner Feature: Named Entity Recognizer
Sujith1909 started Jun 10, 2022 in Language Support

1
You must be logged in to vote

Add a custom language to spacy
enhancement Feature requests and improvements
Mujerry started May 20, 2022 in Language Support

4
You must be logged in to vote

Ukrainian model proposal
enhancement Feature requests and improvements lang / uk Ukrainian language data and models new language Adding support for new languages to spaCy.
kurnosovv started Mar 28, 2022 in Language Support

8
You must be logged in to vote

Lemmatization is not working for Chinese language
lang / zh Chinese language data and models feat / lemmatizer Feature: Rule-based and lookup lemmatization
nikhil-sec started Feb 28, 2022 in Language Support

4
You must be logged in to vote

Addition of "entity_ruler" in spacy 3.2 - Portuguese
lang / pt Portuguese language data and models feat / matcher Feature: Token, phrase and dependency matcher
pmoniz7 started Feb 7, 2022 in Language Support

4
You must be logged in to vote

Does spacy_hunspell support multiple languages?
third-party Third-party packages and services
mikeallen7 started Dec 29, 2021 in Language Support

1
You must be logged in to vote

List of definition token.lemma, token.dep abbrev used in doc/token
docs Documentation and website feat / doc Feature: Doc, Span and Token objects
js-compilatrum started Dec 4, 2021 in Language Support

3
You must be logged in to vote

French model : tense of a verb is removed in version 3.x.
models Issues related to the statistical models lang / fr French language data and models feat / morphology Feature: Morphology and MorphAnalysis
paulo05100 started Nov 29, 2021 in Language Support

2
You must be logged in to vote

Lemmatization for Indonesian Language support
lang / id Indonesian language data and models feat / lemmatizer Feature: Rule-based and lookup lemmatization
k4waiiiii started Nov 28, 2021 in Language Support

2
You must be logged in to vote

How to train lemmatizer? Are lookup tables required?
feat / lemmatizer Feature: Rule-based and lookup lemmatization
vistamou started Nov 20, 2021 in Language Support

2
You must be logged in to vote

Wrapping independently trained Pytorch model with Thinc
🔮 thinc spaCy's machine learning library Thinc
kanayer started Nov 23, 2021 in Language Support

7
You must be logged in to vote

French and Italian noun chunks, contributors are welcomed!
lang / it Italian language data and models lang / fr French language data and models
DuyguA started Nov 15, 2021 in Language Support

0
You must be logged in to vote

Training data for English language models
lang / en English language data and models
thiippal started Oct 24, 2021 in Language Support

3
You must be logged in to vote

German lemmatizer confused by capitalization
lang / de German language data and models feat / lemmatizer Feature: Rule-based and lookup lemmatization
giopina started Oct 14, 2021 in Language Support

1