Cartilha de Inteligência Artificial

Inteligência Artificial e Aprendizado de Máquina são as tecnologias que estão na vanguarda do que está sendo chamado de 4th revolução Industrial. Desde o início da raça humana, o homem tem se esforçado para melhorar a eficiência com que vivemos e trabalhamos. No início, os humanos dependiam de trabalho manual simples e engenhosidade. Acreditamos que é assim que o homem produziu coisas como as pirâmides, a Grande Muralha da China e Stonehenge. Então veio a primeira revolução industrial, que introduziu a mecanização, o vapor e a energia hidráulica e trouxe avanços na produção, viagens e urbanização. A segunda revolução foi deflagrada pelas invenções da produção em massa e da eletricidade. A introdução de tecnologias eletrônicas e digitais marcou a terceira revolução e coisas como computadores e a internet. Hoje estamos entrando em uma nova era possibilitada por avanços massivos e aplicação prática da Inteligência Artificial e Aprendizado de Máquina.

 

HOMEM vs. MÁQUINA

A inteligência artificial visa ajudar os humanos a operar com mais eficiência, reduzindo drasticamente o tempo, o dinheiro e a inteligência humana necessária para realizar tarefas de rotina. Em suma, os computadores estão recebendo recursos de autoaprendizagem para que possam prever resultados com precisão, identificar padrões e fazer ajustes automaticamente, com base em informações passadas e atuais. A máquina começa a se tornar mais eficiente e inteligente como a raça humana em alguns casos.

 

O potencial de os computadores se tornarem tão inteligentes quanto (ou até mais espertos que) os humanos na realização de certas tarefas levanta o debate “homem versus máquina”. Independentemente da crença de cada um, uma coisa com a qual todos podemos concordar é que os humanos têm algo que os computadores provavelmente nunca terão: emoção, intuição e instinto.

 

Quando as pessoas debatem o tópico de inteligência artificial, frequentemente discutem sobre quais categorias ou algoritmos de aprendizado de máquina são os melhores. Os algoritmos de aprendizado de máquina são geralmente categorizados em 3 tipos, não supervisionados sem conhecimento prévio dos rótulos (dados rotulados), supervisionados com algum conhecimento dos rótulos (dados rotulados) e reforço, que está entre os dois tipos. Existem algoritmos mais específicos dessas categorias, como KNN, K-means, Decision Tree, SVM, Artificial Neural Networks, Q-learning, etc. Então, qual é o melhor? Bem, como tudo na vida, tudo tem prós e contras, e quando se trata de aprendizado de máquina, tendo a não debater o modelo em si, mas sim redirecionar a conversa para a qualidade dos dados. Os modelos de aprendizado de máquina são executados sobre os dados e sem as quantidades e qualidade apropriadas de dados e tipos de dados, o modelo de aprendizado de máquina pode se tornar inútil, não importa o quão bom seja em teoria. Isso não diminui o impacto da seleção dos algoritmos de aprendizado de máquina corretos. Os dados e os algoritmos devem se complementar para resolver casos de uso específicos.

 

DADOS SÃO PARAMOUNT

At Stellar Cyber começamos nossa empresa com a missão prioritária de coletar dados - muitos dados - e, mais importante, o certo tipos de dados para resolver o problema de detecção de violações. Depois que os dados são coletados, nós os higienizamos realizando a desduplicação, a normalização e várias outras coisas. Em seguida, correlacionamos os dados com outros bits de informação, como a inteligência de ameaças, a disposição do download de um arquivo, a localização geográfica de um endereço IP e muito mais. Esse enriquecimento fornece um contexto melhor para o conjunto de dados como um todo. O resultado desse processo produz dados limpos enriquecidos com contexto. Somente após a conclusão dessas tarefas importantes, realizamos o aprendizado de máquina.

 

AI COM DADOS LIMITADOS VS COMPLETOS

Vejamos mais de perto um exemplo de como os bancos realizam detecção de fraude de cartão de crédito. Se um cliente normalmente usa seu cartão de crédito apenas em San Jose, Califórnia, mas viaja para Tóquio, Japão, pela primeira vez e tenta usar este cartão, alguns bancos sinalizam isso como uma anomalia e desativam o cartão de crédito. Muitas vezes, isso deixa o cliente constrangido e frustrado quando um comerciante diz que o cartão foi recusado. Embora isso realmente possa ser uma anomalia de “aprendizado por máquina”, pode não justificar a desativação do cartão de crédito, pois isso pode ser um uso legítimo do cartão.

 

A raiz do problema acima normalmente surge porque os dados em si são singulares (local de uso do cartão apenas) e não têm contexto, como a hora em que o cartão foi usado pela última vez, onde foi usado ou como foi usado. Se um sistema correlacionasse outras informações, como horário, local, distância entre locais, reputação de um local ou como foi usado (terminal de cartão ou site da Web, por exemplo), um algoritmo de aprendizado de máquina poderia determinar melhor a fraude real.

 

Veja outro exemplo de cartão sendo usado em San Jose, Califórnia, às 4h PST, mas usado novamente em uma pequena cidade na Ucrânia às 00h PST do mesmo dia. A probabilidade de ser uma fraude seria muito maior do que no exemplo anterior. Os pedaços de dados correlacionados para chegar a uma conclusão como esta, seriam os tempo levaria para viajar o distância ao Ucrânia, após seu uso em São José, e o uso ou o cartão em uma pequena cidade (reputação pequena cidade não freqüentada) na Ucrânia.

 

CONSIDERAÇÕES FINAIS

Isso ilustra como a Inteligência Artificial pode ser muito útil para completar tarefas repetitivas envolvendo muitos dados que os humanos se cansam de executar e analisar esses dados para resolver problemas. Mas a tecnologia substituirá os humanos? Tenho tendência a pensar que não. A IA pode levar você a mais de 90% na resolução de tarefas repetitivas, mas 10% + do esforço sempre será necessário para tomar a decisão final de um problema. Além disso, como acontece com outros avanços em eficiência, podemos reutilizar nosso tempo liberado para fazer ainda mais trabalho do que antes. Um algoritmo de aprendizado de máquina é melhor do que outro? Acredito que a resposta está na compreensão do problema que se está tentando resolver, e também acredito que a qualidade dos dados é tão importante quanto o próprio algoritmo.

 

John Peterson

Vice-presidente sênior de gerenciamento da linha de produtos

Stellar Cyber

Voltar ao Topo