Prof. Walmes Marques Zeviani
25 Abr 2017
tm: Text Mining, framework para aplicações de mineração de texto com o R.RWeka: linkagem com o Weka, métodos de machine learning feito em Java: tokenização, stemming.openNLP: linkagem para o Apache OpenNLP feito em Java, recursos de Natural Language Processing, POS tagging, reconhecimento de entidades, etc.kernlab: métodos de machine learning baseados em kernel.lsa: análise semantica latente.woldcloud e wordcloud2: núvem de palavras.languageR: datasets e funções para análise de texto.tidytext: processamento de texto e análise de sentimentos.koRpus: variação léxica, legibilidade de texto, detecção de idioma, etc.RKEA: linkagem com o KEA, extração de keyphrases.maxent: implementação com baixo consumo de RAM (C++) de modelos de máxima entropia.wordnet: interface para acesso a base de dados léxica do inglês.tokenizers: recursos para tokenização de texto.topicmodels: interface para a alocação latente de Dirchlet e modelos de tópicos correlacionados.lda: implementa a alocação latente de Dirchlet.Mais informações: https://cran.r-project.org/web/views/NaturalLanguageProcessing.html.