- No passado, as profissões/negócios correram para incorporar o uso dos computadores. Hoje o mesmo acontece com os dados.
- Ciência de dados:
- Data driven intensive projects.
- Utilizam ML e STAT para análise de dados.
24 de Abril de 2018 · Data Science MeetUp
14 de Maio de 2018 · LEG/UFPR
Um entendimento incorreto das diferenças fatuais pode levar rapidamente a falsos julgamentos, péssimas escolhas e conclusões ruins.
Baseado em danielmiessler.com/blog/differences-similarities-machine-learning-statistics/.
Fazem consumo de dados para extrair conhecimento.
Descritiva | Diagnóstica | Preditiva | Prescritiva |
---|---|---|---|
\(+\) usada | \(-\) usada | ||
retrospect. | retrospect. | prospect. | prospect. |
compreender | examinar | prever | otimizar |
Baseado em www.kdnuggets.com/2017/07/4-types-data-analytics.html.
Feito pelo autor.
Machine learning is essentially a form of applied statistics.
Machine learning is glorified statistics.
– The Elements of Statistical Learning
Machine learning is statistics scaled up to big data.
Machine learning is Statistics minus any checking of models and assumptions.
– Brian D. Ripley
Extraído de www.svds.com/machine-learning-vs-statistics/.
Machine learning is a field of computer science that uses statistical techniques to give computer systems the ability to "learn" (e.g., progressively improve performance on a specific task) with data, without being explicitly programmed.
Machine learning is a type of AI that allows software applications to become more accurate in predicting outcomes without being explicitly programmed. The basic premise of machine learning is to build algorithms that can receive input data and use statistical analysis to predict an output value within an acceptable range.
Statistics – as defined by the ASA – is the science of learning from data, and of measuring, controlling and communicating uncertainty.
Statistics is using data and knowledge about randomness to condense, communicate, and contextualize information and provide insight into the setting from which the data came.
Statistics provides a coherent framework for thinking about random variation, and tools to partition data into signal and noise.
Leitura recomendada: https://www.stat.uci.edu/what-is-statistics/.
Ambos estão preocupados com a mesma questão: como aprender com os dados.
– Larry Wasserman, Prof. em Carnegie Mellon.
Minha tentativa em resumir o objetivo comum:
A partir dos dados criar um modelo cujas quantidades desconhecidas são determinadas pela otimização de uma métrica e os resultados desse modelo são usado para tomar decisões.
Estatística | Machine learning |
---|---|
Variável resposta | Variável alvo |
Variáveis preditoras | Características |
Registro, caso | Objeto, instância |
Modelo | Rede, grafos, algorítmo |
Parâmetro | Peso |
Ajustar | Aprender, treinar |
Regressão/classificação | Aprendizado supervisionado |
Agrupamento, estimação de densidade | Aprendizado não supervisionado |
Capacidade preditiva | Generalização |
Função objetivo (verossimilhança) | Função custo |
Baseado e estendido de https://brenocon.com/blog/2008/12/statistics-vs-machine-learning-fight/.
Estatística
Machine learning
Estatística
Machine learning
Estatística
Machine learning
Adaptado do livro The Elements of Statistical Learning.
Estatística
Machine learning
Estatística
Machine learning
ML biggest advatage is self improvement based on exposure to data.
– Daniel Miessler
Baseado no cenário colocado por Pedro Domingos em The Master Algorthm.
Boulesteix, A. L., Schmid, M. (2014). Machine learning versus statistical modeling. Biometrical Journal, 56(4), 588–593. https://doi.org/10.1002/bimj.201300226
Estatísticos quanto a inferência e níveis de suposição:
Machine learners quanto ao aprendizado segundo Pedro Domingos:
Extraido do livro The Master Algorithm do Prof. Pedro Domingos.
Estatística
Machine learning
Estatística
Machine learning
Feito pelo autor.
Analogias feitas em svds.com/machine-learning-vs-statistics/ e www.sharpsightlabs.com/blog/difference-machine-learning-statistics-data-mining/.
Referências em ordem alfabética da URL. Acesso entre 20 e 23/04/2018.
Venha participar do R Day!
Walmes Zeviani
walmes@ufpr.br
walmes
@walmeszeviani
Laboratório de Estatística e Geoinformação (LEG)
+55 41 3361 3573