Quem (não) se lembra da imagem abaixo? Isto não é mais do que o supercomputador Deep Blue, desenvolvido pela IBM, a vencer o mestre de xadrez Garry Kasparov. Foi um marco histórico da Inteligência Artificial em 1997, pois foi a primeira vez que um computador venceu um campeão mundial de xadrez numa competição oficial. O Deep Blue venceu 2 partidas, empatou 3 e perdeu uma para o Kasparov.
Um outro grande feito ocorreu com o AlphaGo, um programa de computador desenvolvido pela empresa DeepMind através de algoritmos de Machine Learning por Reforço (explicado mais adiante), que bateu em 2016 o coreano Lee Sedol, o segundo melhor jogador de Go do mundo. O Go é um jogo muito popular em países como a Coreia do Sul, a China e o Japão. Esta vitória foi também um marco histórico da Inteligência Artificial e até gerou um excelente documentário na Netflix.
Estes exemplos mostram que os algoritmos de Inteligência Artificial e de Machine Learning não foram inventados agora. Alguns têm dezenas de anos de existência. O que mudou foi o avanço na capacidade de processamento dos computadores, a disponibilização de grandes coleções de dados (o chamado “big data”) e a capacidade de armazenamento da informação e computação dos modelos na nuvem (cloud). Estes fatores têm impulsionado avanços significativos em áreas como o processamento de linguagem natural, o reconhecimento de escrita e fala, a visão computacional, a realidade aumentada, a robótica, o diagnóstico médico, os motores de busca, os sistemas de recomendação, a deteção de fraude, entre outros.
O ML abrange uma ampla variedade de algoritmos e ferramentas de IA que são usadas para resolver essencialmente problemas de regressão, classificação e segmentação (ou clustering). Os algoritmos de ML podem ser categorizados em aprendizagem supervisionada, aprendizagem não supervisionada, aprendizagem semi-supervisionada e aprendizagem por reforço.
Na aprendizagem supervisionada, os algoritmos são treinados com grandes conjuntos de dados de entrada (inputs) e saída (output) rotulados para prever ou classificar com precisão dados novos. Por exemplo, podemos estar interessados em prever o preço de uma casa em função das suas características (área de implantação, idade, número de assoalhadas, número de suites, localização, etc.) ou classificar uma operação bancária de concessão ou não de um empréstimo bancário em função dos dados socioeconómicos e demográficos de um cliente.
Na aprendizagem não supervisionada, os algoritmos são treinados com dados não rotulados com o objetivo de identificar semelhanças (ou dissemelhanças) nos dados e criar grupos homogéneos (clusters) com base nos seus padrões de comportamento. Por exemplo, podemos ter interesse em segmentar os clientes de um banco, de uma seguradora ou de um operador de comunicações móveis com base na sua idade, género, estado civil, localização geográfica, salário e padrões de consumo.
A aprendizagem semi-supervisionada combina elementos de aprendizagem supervisionada e não supervisionada, em que o modelo é treinado com um conjunto de dados rotulados e não rotulados. Por exemplo, podemos ter um conjunto de imagens rotuladas e não rotuladas (pessoas, animais ou objetos) e usar algoritmos semi-supervisionados para treinar os dados rotulados e usá-los para reconhecer os dados não rotulados.
Na aprendizagem da máquina por reforço, os algoritmos aprendem a tomar decisões por tentativa e erro de modo a maximizar as recompensas. Por exemplo, um agente de reforço (robô) aprende a estacionar um veículo autónomo ou a jogar xadrez num ambiente desconhecido, recebendo recompensas ou penalizações pelas suas ações e tomando decisões que maximizam as recompensas.
No mundo atual, os dados são fundamentais para a tomada de decisão informada em diversos setores de atividade, como banca, seguros, retalho e indústria, passando pela segurança e meio ambiente, até à medicina e indústria farmacêutica, sendo a base para a Inteligência Artificial. Os dados podem ajudar as empresas a personalizar e melhorar a experiência com os seus clientes, a otimizar processos, a reduzir custos e melhorar a produtividade, a extrair padrões e correlações, e a prever comportamentos e tendências futuras. Ao adotar o Machine Learning, pode-se transformar grandes volumes de dados em insights valiosos, revolucionando a forma como as decisões são tomadas e proporcionando uma vantagem competitiva significativa.
Adaptado do livro do autor: Caiado, J. (2024), Python e Exploração de Dados, Edições Sílabo, Lisboa.