Prof. Walmes Marques Zeviani
25 Abr 2017
tm
: Text Mining, framework para aplicações de mineração de texto com o R.RWeka
: linkagem com o Weka, métodos de machine learning feito em Java: tokenização, stemming
.openNLP
: linkagem para o Apache OpenNLP feito em Java, recursos de Natural Language Processing, POS tagging, reconhecimento de entidades, etc.kernlab
: métodos de machine learning baseados em kernel.lsa
: análise semantica latente.woldcloud
e wordcloud2
: núvem de palavras.languageR
: datasets e funções para análise de texto.tidytext
: processamento de texto e análise de sentimentos.koRpus
: variação léxica, legibilidade de texto, detecção de idioma, etc.RKEA
: linkagem com o KEA, extração de keyphrases.maxent
: implementação com baixo consumo de RAM (C++) de modelos de máxima entropia.wordnet
: interface para acesso a base de dados léxica do inglês.tokenizers
: recursos para tokenização de texto.topicmodels
: interface para a alocação latente de Dirchlet e modelos de tópicos correlacionados.lda
: implementa a alocação latente de Dirchlet.Mais informações: https://cran.r-project.org/web/views/NaturalLanguageProcessing.html.