Artigo desenvolvido com a colaboração de Mariana Ribeiro.
Você já se perguntou como as lojas virtuais apresentam ofertas de produtos que possam te interessar, mesmo sem você nunca ter acessado aquele site antes? Ou como os bancos respondem rapidamente aos seus pedidos de crédito?
Tudo isso acontece porque as empresas utilizam o Machine Learning (no português, Aprendizado de Máquina) para treinar algoritmos que vão selecionar e mostrar os produtos que você tem maior probabilidade de gostar. Mas como isso é possível? A gente te explica!
O que é Machine Learning?
O Machine Learning é um método de análise de dados da área da Inteligência Artificial que automatiza a criação de modelos analíticos. Por meio de algoritmos que aprendem a partir de diversas bases de dados e de experiências acumuladas, o Machine Learning possibilita a predição e o aprendizado de certos padrões e comportamentos automaticamente, sem a intervenção humana.
“… [machine learning é] uma área de Inteligência Artificial que tem como objetivo desenvolver técnicas computacionais que permitam a predição e o aprendizado de determinados comportamentos ou padrões automaticamente a partir de experiências acumuladas por exemplos e problemas anteriores.” (Mitchell, 1997).
A ideia básica do Machine Learning é permitir que máquinas desenvolvam modelos e façam predições sem a necessidade de que sejam reprogramadas para isso. E conforme vão sendo expostas a novos dados, elas vão aprendendo mais e se adaptando de forma independente, para:
- fornecerem resultados mais rapidamente;
- gerarem resultados mais confiáveis e reproduzíveis;
- contribuírem para melhores tomadas de decisão e a realização de ações inteligentes em tempo real.
Thomas H. Davenport, um autor norte-americano que escreve livros sobre sistemas de informação, disse ao The Wall Street Journal que “as pessoas normalmente criam um ou dois bons modelos por semana, enquanto que o Machine Learning cria milhares de modelos por semana”. E é isso que permite tomar decisões e realizar ações mais inteligentes e em tempo real.
Pode parecer “coisa de ficção científica”, mas o Machine Learning já está presente em várias das tecnologias que usamos hoje em dia. Só para citar algumas:
- resultados de pesquisa nos buscadores;
- filtragem de spams;
- sistema de recomendações (filmes, livros, músicas, conexões em redes sociais, etc);
- reconhecimento de voz e facial;
- automação residencial;
- previsão de falhas em equipamentos;
- análise de sentimentos baseada em textos;
- pontuação de crédito;
- predições da Bolsa de Valores.
Existem dois tipos de aprendizado: o supervisionado e o não supervisionado.
O supervisionado é responsável pela maior parte do Machine Learning. Existem também outros tipos menos utilizados, como o semisupervisionado e o por reforço.
Veja como funciona os dois principais:
Aprendizado supervisionado
Por meio de um conjunto de exemplos, os algoritmos aprendem um modelo para poderem prover a variável de interesse, baseando-se em variáveis dependentes.
Esse tipo de aprendizado envolve a participação de um ‘agente externo’, e é geralmente utilizado em aplicações nas quais os dados históricos preveem possíveis acontecimentos futuros (como as chances de um segurado acionar a apólice ou de uma transação do cartão de crédito ser fraudulenta).
Aprendizado não supervisionado
A partir de medições em variáveis de interesse, o algoritmo apresenta alguma estrutura baseando-se em similaridade.
Esse tipo de aprendizado funciona perfeitamente em dados transacionais. Ele pode identificar, por exemplo, segmentos de clientes com características semelhantes que podem ser abordados de modo parecido em campanhas de marketing.
O aprendizado não supervisionado também pode ser utilizado na recomendação de produtos e serviços e na identificação de valores discrepantes de dados.
Machine Learning e Estatística
Quando falamos em Machine Learning, estamos também falando de estatística. Isso porque o Aprendizado de Máquina só pôde ser criado graças à ampla variedade de técnicas estatísticas desenvolvidas nos últimos tempos.
Veja as técnicas estatísticas que são geralmente aplicadas em cada tipo de aprendizado:
- Aprendizado Supervisionado: Árvores de Classificação, Suport Vector Machine (SVM), classificação (Regressão Logística, KNN-K vizinhos mais próximos), regressão (Regressão Linear, Splines, Árvores de Regressão, Redes Neurais);
- Aprendizado Não Supervisionado: redução de dimensionalidade (Análise de Componentes Principais, Escalonamento Multidimensional), análise de agrupamento (K-médias, Métodos Hierárquicos), regras de associação, sistemas de recomendação.
Graças ao aumento do poder de processamento dos computadores, as abordagens estatísticas e matemáticas evoluíram ao ponto de permitir o uso em Machine Learning.
E devido aos incríveis resultados que o Machine Learning tem gerado até agora, os profissionais e especialistas da área estão buscando aplicá-lo em projetos mais complexos, como em diagnósticos médicos e em vários outros problemas sociais e empresariais relevantes.
E para isso, eles estão combinando um rico conhecimento em estatística com os novos avanços da computação para desenvolver modelos estatísticos que forneçam resultados melhores mais rapidamente.
Ainda sobraram dúvidas sobre o assunto? Lembra de mais alguma coisa que não falamos por aqui? Deixe seu comentário aqui em baixo que a gente responde!
2 comentários em “Qual a relação entre Machine Learning e a Estatística?”
A apresentação ficou clara. Obrigado
Nós que agradecemos pelo comentário!