Sztuczna inteligencja i uczenie maszynowe to technologie, które znajdują się w czołówce tego, co nazywa się światowym 4th rewolucja przemysłowa. Od początku istnienia ludzkości człowiek dążył do poprawy efektywności życia i pracy. Początkowo ludzie polegali na prostej pracy fizycznej i pomysłowości. Uważamy, że w ten sposób człowiek stworzył takie rzeczy, jak piramidy, Wielki Mur Chiński i Stonehenge. Potem nadeszła pierwsza rewolucja przemysłowa, która wprowadziła mechanizację, parę i energię wodną oraz przyniosła postęp w produkcji, podróżowaniu i urbanizacji. Drugą rewolucję wywołały wynalazki masowej produkcji i elektryczności. Wprowadzenie technologii elektronicznych i cyfrowych oznaczało trzecią rewolucję, a także komputery i internet. Dziś wkraczamy w nową erę, która jest możliwa dzięki ogromnemu postępowi i praktycznemu zastosowaniu sztucznej inteligencji i uczenia maszynowego.
CZŁOWIEK KONTRA MASZYNA
Sztuczna inteligencja ma na celu pomóc ludziom działać wydajniej, radykalnie zmniejszając czas, pieniądze i inteligencję potrzebną do wykonywania rutynowych zadań. Krótko mówiąc, komputery otrzymują możliwości samouczenia się, dzięki czemu mogą dokładnie przewidywać wyniki, identyfikować wzorce i automatycznie wprowadzać korekty na podstawie zarówno przeszłych, jak i bieżących informacji. W niektórych przypadkach maszyna staje się wydajniejsza i równie inteligentna jak rasa ludzka.
Potencjał, że komputery stają się tak inteligentne (lub nawet mądrzejsze od ludzi) w wykonywaniu określonych zadań, wywołuje debatę „człowiek kontra maszyna”. Niezależnie od przekonań, wszyscy możemy się zgodzić, że ludzie mają coś, czego komputery prawdopodobnie nigdy nie będą miały: emocje, intuicję i przeczucia.
Kiedy ludzie debatują na temat sztucznej inteligencji, często spierają się o to, które kategorie uczenia maszynowego lub algorytmy są najlepsze. Algorytmy uczenia maszynowego są ogólnie podzielone na 3 typy, nienadzorowane bez wcześniejszej znajomości etykiet (dane na etykietach), nadzorowane z pewną znajomością etykiet (dane etykietowane) i wzmocnienie, które znajduje się między tymi dwoma typami. Istnieją bardziej szczegółowe algorytmy tych kategorii, takie jak KNN, K-średnie, Drzewo decyzyjne, SVM, sztuczne sieci neuronowe, Q-learning itp. Więc który z nich jest lepszy? Cóż, jak wszystko w życiu, wszystko ma wady i zalety, a jeśli chodzi o uczenie maszynowe, nie debatuję nad samym modelem, ale raczej przekierowuję rozmowę na jakość danych. Modele uczenia maszynowego działają na podstawie danych i bez odpowiednich ilości i jakości danych oraz typów danych, model uczenia maszynowego może stać się bezużyteczny bez względu na to, jak dobry jest w teorii. Nie ma to zmniejszać wpływu wyboru odpowiednich algorytmów uczenia maszynowego. Dane i algorytmy muszą się wzajemnie uzupełniać, aby rozwiązywać określone przypadki użycia.
DANE SĄ NAJWAŻNIEJSZE
At Gwiezdny Cyber rozpoczęliśmy naszą firmę od priorytetowej misji zbierania danych - dużej ilości danych - i, co ważniejsze, plików prawo typy danych w celu rozwiązania problemu z wykrywaniem naruszeń. Po zebraniu danych oczyszczamy je, wykonując deduplikację, normalizację i szereg innych czynności. Następnie korelujemy dane z innymi informacjami, takimi jak informacje o zagrożeniach, dyspozycja pobierania pliku, położenie geograficzne adresu IP i nie tylko. To wzbogacenie zapewnia lepszy kontekst dla zbioru danych jako całości. Rezultatem tego procesu są czyste dane wzbogacone kontekstem. Dopiero po wykonaniu tych ważnych zadań wykonujemy uczenie maszynowe.
AI Z OGRANICZONYMI A PEŁNYMI DANYMI
Przyjrzyjmy się bliżej przykładowi, w jaki sposób banki wykrywają oszustwa związane z kartami kredytowymi. Jeśli klient zwykle używa swojej karty kredytowej tylko w San Jose w Kalifornii, ale po raz pierwszy podróżuje do Tokio w Japonii i próbuje użyć tej karty, niektóre banki oznaczą to jako anomalię i dezaktywują kartę kredytową. To często powoduje, że klient jest zakłopotany i sfrustrowany, gdy sprzedawca mówi mu, że karta została odrzucona. Chociaż rzeczywiście może to być anomalia „wyuczona maszynowo”, może nie uzasadniać dezaktywacji karty kredytowej, ponieważ może to być legalne użycie karty.
Przyczyna powyższego problemu zwykle ujawnia się, ponieważ same dane są pojedyncze (tylko lokalizacja użycia karty) i nie mają kontekstu, takiego jak czas ostatniego użycia karty, miejsce jej użycia lub sposób, w jaki była używana. Jeśli system miałby skorelować inne informacje, takie jak czas, lokalizacja, odległość między lokalizacjami, reputacja lokalizacji lub sposób jej wykorzystania (na przykład terminal kart lub strona internetowa), algorytm uczenia maszynowego mógłby lepiej określić rzeczywiste oszustwa.
Weźmy inny przykład karty używanej w San Jose w Kalifornii o 4:00 czasu PST, a następnie używanej ponownie w małym mieście na Ukrainie o 5:00 czasu PST tego samego dnia. Prawdopodobieństwo, że jest to oszustwo, byłoby znacznie wyższe niż w poprzednim przykładzie. Skorelowane fragmenty danych, aby dojść do takiego wniosku, to czas zajęłoby podróż dystans do Ukraina, po jego użyciu w Święty Józef, i użycie lub karta w małym mieście (reputacja małe, rzadko uczęszczane miasto) na Ukrainie.
UWAGI KOŃCOWE
To ilustruje, w jaki sposób sztuczna inteligencja może być bardzo przydatna w wykonywaniu powtarzalnych zadań obejmujących wiele danych, których wykonywanie i analizowanie przez ludzi jest zmęczonych w celu rozwiązania problemów. Ale czy technologia zastąpi ludzi? Myślę, że nie. Sztuczna inteligencja może zapewnić Ci 90% + w rozwiązywaniu powtarzalnych zadań, ale 10% + wysiłku będzie zawsze potrzebne, aby podjąć ostateczną decyzję dotyczącą problemu. Ponadto, podobnie jak w przypadku innych postępów w wydajności, możemy ponownie wykorzystać wolny czas na wykonanie jeszcze większej ilości pracy niż wcześniej. Czy jeden algorytm uczenia maszynowego jest lepszy od innego? Uważam, że odpowiedź leży w zrozumieniu problemu, który próbujemy rozwiązać, a także uważam, że jakość danych jest równie ważna jak sam algorytm.
John Peterson
SVP Zarządzanie linią produktów
Gwiezdny Cyber


