Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Sugestão: usar "analyze: char" como parâmetro do "intent_featurizer_count_vectors" #585

Open
dielsonsales opened this issue Oct 31, 2019 · 1 comment

Comments

@dielsonsales
Copy link

Não há como garantir que a performance seja melhor para todos os casos, mas eu sugiro que vocês testem esse parâmetro disponível no featurizer que vocês estão usando:

- name: "intent_featurizer_count_vectors"
  analyzer: 'char'
  min-ngram: 3
  max-ngram: 3

Essa abordagem permite que o featurizer do Rasa use caracteres ao invés de palavras inteiras e, dessa forma, fique mais robusto contra variações da escrita ou escrita errada. Geralmente esse tipo de coisa funciona melhor para o português por conta de termos muitas variações para verbos, gênero etc.

@RochaCarla
Copy link
Member

Obrigada pela sugestão @dielsonsales. Testamos aqui e realmente é melhor.. vamos commitar e colocar na próxima versão de produção :P

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants