L'intelligence artificielle et l'apprentissage automatique sont les technologies qui sont à la pointe de ce que l'on appelle le monde 4th révolution industrielle. Depuis le début de la race humaine, l'homme s'est efforcé d'améliorer l'efficacité avec laquelle nous vivons et travaillons. Au début, les humains comptaient sur un travail manuel simple et sur l'ingéniosité. Nous pensons que c'est ainsi que l'homme a produit des choses comme les Pyramides, la Grande Muraille de Chine et Stonehenge. Puis vint la première révolution industrielle, qui introduisit la mécanisation, la vapeur et l'énergie hydraulique et apporta des progrès dans la production, les voyages et l'urbanisation. La deuxième révolution a été déclenchée par les inventions de la production de masse et de l'électricité. L'introduction des technologies électroniques et numériques a marqué la troisième révolution et des choses comme les ordinateurs et Internet. Aujourd'hui, nous entrons dans une nouvelle ère rendue possible par les progrès massifs et l'application pratique de l'intelligence artificielle et de l'apprentissage automatique.
L'HOMME contre LA MACHINE
L'intelligence artificielle vise à aider les humains à fonctionner plus efficacement en réduisant considérablement le temps, l'argent et l'intelligence humaine nécessaires pour effectuer des tâches de routine. En un mot, les ordinateurs sont dotés de capacités d'auto-apprentissage afin de pouvoir prédire avec précision les résultats, identifier les modèles et effectuer automatiquement des ajustements, en fonction des informations passées et actuelles. La machine commence à devenir plus efficace et aussi intelligente que la race humaine dans certains cas.
Le potentiel des ordinateurs de devenir aussi intelligents (voire plus intelligents que) les humains dans l'exécution de certaines tâches soulève le débat «homme contre machine». Indépendamment de sa croyance, une chose sur laquelle nous pouvons tous être d'accord est que les humains ont quelque chose que les ordinateurs n'auront probablement jamais: l'émotion, l'intuition et les instincts.
Lorsque les gens débattent du sujet de l'intelligence artificielle, ils se demandent souvent quelles catégories ou quels algorithmes d'apprentissage automatique sont les meilleurs. Les algorithmes d'apprentissage automatique sont généralement classés en 3 types, non supervisés sans connaissance préalable des étiquettes (données étiquetées), supervisés avec une certaine connaissance des étiquettes (données étiquetées) et du renforcement, qui se situe entre les deux types. Il existe des algorithmes plus spécifiques de ces catégories, tels que KNN, K-means, arbre de décision, SVM, réseaux de neurones artificiels, Q-learning, etc. Alors, lequel est le meilleur? Eh bien, comme tout dans la vie, tout a des avantages et des inconvénients, et en matière d'apprentissage automatique, j'ai tendance à ne pas débattre du modèle lui-même, mais plutôt à rediriger la conversation vers la qualité des données. Les modèles d'apprentissage automatique fonctionnent au-dessus des données et sans les quantités et la qualité appropriées de données et les types de données, le modèle d'apprentissage automatique peut être rendu inutile, quelle que soit sa qualité en théorie. Il ne s'agit pas de diminuer l'impact de la sélection des bons algorithmes d'apprentissage automatique. Les données et les algorithmes doivent se compléter pour résoudre des cas d'utilisation spécifiques.
LES DONNÉES SONT PARAMÈTRES
At Cyber stellaire nous avons démarré notre entreprise avec une mission prioritaire de collecte de données - beaucoup de données - et, plus important encore, la bien types de données afin de résoudre le problème de détection des violations. Une fois les données collectées, nous les nettoyons en procédant à la déduplication, à la normalisation et à un certain nombre d'autres choses. Ensuite, nous corrélons les données avec d'autres informations, telles que les renseignements sur les menaces, la disposition d'un téléchargement de fichier, l'emplacement géographique d'une adresse IP, etc. Cet enrichissement donne un meilleur contexte à l'ensemble de données dans son ensemble. Le résultat de ce processus produit des données propres enrichies de contexte. Ce n'est qu'une fois ces tâches importantes terminées que nous effectuons un apprentissage automatique.
AI AVEC DES DONNÉES LIMITÉES VS COMPLETES
Examinons de plus près un exemple de la manière dont les banques détectent la fraude par carte de crédit. Si un client n'utilise normalement sa carte de crédit qu'à San Jose, en Californie, mais se rend à Tokyo, au Japon, pour la première fois et essaie d'utiliser cette carte, certaines banques le signaleront comme une anomalie et désactiveront la carte de crédit. Cela laisse souvent le client embarrassé et frustré lorsqu'un commerçant lui dit que la carte est refusée. Bien que cela puisse vraiment être une anomalie «apprise par machine», cela peut ne pas justifier la désactivation de la carte de crédit, car cela peut être une utilisation légitime de la carte.
La racine du problème ci-dessus surgit généralement parce que les données elles-mêmes sont singulières (emplacement de l'utilisation de la carte uniquement) et manquent de contexte, comme l'heure à laquelle la carte a été utilisée pour la dernière fois, où elle a été utilisée ou comment elle a été utilisée. Si un système devait corréler d'autres informations telles que l'heure, l'emplacement, la distance entre les emplacements, la réputation d'un emplacement ou la manière dont il était utilisé (terminal à carte ou site Web par exemple), un algorithme d'apprentissage automatique pourrait mieux déterminer la fraude réelle.
Prenons un autre exemple d'une carte utilisée à San Jose, en Californie, à 4 h 00 PST, puis réutilisée dans une petite ville d'Ukraine à 5 h 00 PST le même jour. La probabilité qu'il s'agisse d'une fraude serait beaucoup plus élevée que l'exemple précédent. Les éléments de données corrélés pour arriver à une conclusion comme celle-ci seraient les Paisible il faudrait pour voyager le distance à la Ukraine, après son utilisation dans San José, et l'utilisation ou la carte dans une petite ville (réputation petite ville peu fréquentée) en Ukraine.
MOT DE CLÔTURE
Cela illustre à quel point l'intelligence artificielle peut être très utile pour effectuer des tâches répétitives impliquant de nombreuses données que les humains se lassent d'exécuter et d'analyser ces données pour résoudre des problèmes. Mais la technologie remplacera-t-elle les humains? J'ai tendance à penser que non. L'IA peut vous aider à résoudre des tâches répétitives à plus de 90%, mais plus de 10% de l'effort sera toujours nécessaire pour prendre la décision finale face à un problème. De plus, comme pour d'autres progrès en matière d'efficacité, nous pouvons réutiliser notre temps libre pour faire encore plus de travail qu'auparavant. Un algorithme d'apprentissage automatique est-il meilleur qu'un autre? Je pense que la réponse réside dans la compréhension du problème que l'on essaie de résoudre, et je crois aussi que la qualité des données est aussi importante que l'algorithme lui-même.
John Peterson
SVP Gestion de la ligne de produits
Cyber stellaire


