Ang Artipisyal na Katalinuhan at Pag-aaral ng Makina ay ang mga teknolohiya na nangunguna sa tinatawag na 4 sa buong mundoth rebolusyong pang-industriya. Mula pa noong pagsisimula ng sangkatauhan, ang tao ay nagsikap upang mapabuti kung gaano kahusay ang pamumuhay at pagtatrabaho. Sa una ang mga tao ay umaasa sa simpleng manwal na paggawa at talino sa paglikha. Naniniwala kami na ganito ang paggawa ng tao ng mga bagay tulad ng Pyramids, the Great Wall of China at Stonehenge. Pagkatapos ay dumating ang unang rebolusyong pang-industriya, na nagpakilala sa mekanisasyon, singaw, at lakas ng tubig at nagdala ng mga pagsulong sa produksyon, paglalakbay, at urbanisasyon. Ang pangalawang rebolusyon ay pinukaw ng mga imbensyon ng produksyon ng masa at kuryente. Ang pagpapakilala ng mga elektronikong at digital na teknolohiya ay minarkahan ang pangatlong rebolusyon at mga bagay tulad ng computer at internet. Ngayon ay pumapasok kami sa isang bagong panahon na pinagana ng napakalaking pagsulong at praktikal na aplikasyon ng Artipisyal na Katalinuhan at Pag-aaral ng Makina.
LALAKI kumpara sa MESIN
Nilalayon ng artipisyal na katalinuhan na matulungan ang mga tao na gumana nang mas mahusay sa pamamagitan ng dramatikong pagbawas ng oras, pera, at mga kinakailangang talino ng tao upang magsagawa ng mga gawain sa gawain. Sa madaling sabi, ang mga computer ay binibigyan ng mga kakayahan sa pag-aaral ng sarili upang tumpak nilang mahulaan ang mga kinalabasan, kilalanin ang mga pattern, at awtomatikong magsagawa ng mga pagsasaayos, batay sa parehong nakaraan at kasalukuyang impormasyon. Ang makina ay nagsisimulang maging mas mahusay at kasing talino ng lahi ng tao sa ilang mga kaso.
Ang potensyal ng mga computer na maging kasing talino ng (o kahit na mas matalino kaysa sa) mga tao sa pagsasagawa ng ilang mga gawain ay itinaas ang debate ng "man vs. machine". Hindi alintana ang paniniwala ng isang tao, isang bagay na maaari nating mapagkasunduan lahat ay ang mga tao ay mayroong isang bagay na malamang na hindi magkakaroon ng mga computer: emosyon, intuwisyon, at pakiramdam ng gat.
Kapag pinagtatalunan ng mga tao ang paksa ng artipisyal na katalinuhan, madalas silang nagtatalo tungkol sa kung aling mga kategorya sa pag-aaral ng machine o mga algorithm ang pinakamahusay. Ang mga algorithm sa pag-aaral ng machine ay karaniwang ikinategorya sa 3 uri, hindi sinusuportahan nang walang paunang kaalaman sa mga label (may label na data), pinangangasiwaan ng ilang kaalaman sa mga label (may label na data), at pampalakas, na nasa pagitan ng dalawang uri. Mayroong mas tiyak na mga algorithm ng mga kategoryang ito, tulad ng KNN, K-ibig sabihin, Tree Decision, SVM, Artipisyal na Neural Networks, Q-pag-aaral, atbp. Kaya, alin ang mas mahusay? Kaya, tulad ng anupaman sa buhay, ang lahat ay may kalamangan at kahinaan, at pagdating sa pag-aaral ng makina, malamang na hindi ko debate ang modelo mismo, ngunit ibalik ang pag-uusap sa kalidad ng data. Ang mga modelo ng pag-aaral ng makina ay tumatakbo sa tuktok ng data at nang walang naaangkop na halaga at kalidad ng data at mga uri ng data, ang modelo ng pag-aaral ng makina ay maaaring gawing walang silbi kahit gaano ito kahusay sa teorya. Hindi ito upang bawasan ang epekto ng pagpili ng tamang mga algorithm sa pag-aaral ng machine. Ang data at ang mga algorithm ay dapat na umakma sa bawat isa upang malutas ang mga partikular na kaso ng paggamit.
ANG DATA AY PARAMOUNT
At Stellar Cyber sinimulan namin ang aming kumpanya na may isang priyoridad na misyon ng pagkolekta ng data - maraming data - at, higit sa lahat, ang karapatan mga uri ng data upang malutas ang problema sa pagtuklas ng paglabag. Kapag nakolekta ang data, nalilinis namin ito sa pamamagitan ng paggawa ng pagdidoble, normalisasyon, at maraming iba pang mga bagay. Susunod, naiuugnay namin ang data sa iba pang mga piraso ng impormasyon, tulad ng intelligence intelligence, ang disposisyon ng isang pag-download ng file, ang heyograpikong lokasyon ng isang IP address, at higit pa. Ang pagpapayaman na ito ay nagbibigay ng mas mahusay na konteksto sa dataset bilang isang kabuuan. Ang resulta ng prosesong ito ay magbubunga ng malinis na data na napayaman sa konteksto. Pagkatapos lamang makumpleto ang mahahalagang gawain na ito, nagsasagawa kami ng pag-aaral ng makina.
AI MAY LIMITED VS COMPLETE DATA
Tingnan natin nang mas malapit ang isang halimbawa kung paano nagsasagawa ang mga bangko ng pagtuklas ng pandaraya sa credit card. Kung ang isang customer ay karaniwang gumagamit lamang ng kanilang credit card sa San Jose, California, ngunit naglalakbay sa Tokyo, Japan, sa kauna-unahang pagkakataon, at sinusubukang gamitin ang kard na ito, ibabandera iyon ng ilang bangko bilang isang anomalya at i-deactivate ang credit card. Kadalasan ay iniiwan nito ang customer na napahiya at nabigo kapag sinabi sa kanila ng isang mangangalakal na tinanggihan ang card. Habang ang tunay na ito ay maaaring maging isang "natutunan sa machine" na anomalya, maaaring hindi ito magagarantiya ng pag-deactivate ng credit card, dahil maaaring ito ay lehitimong paggamit ng card.
Ang ugat ng problema sa itaas ay karaniwang lumilitaw dahil ang data mismo ay isahan (lokasyon ng paggamit ng card lamang) at walang konteksto, tulad ng oras na huling ginamit ang card, kung saan ito ginamit, o kung paano ito ginamit. Kung ang isang sistema ay upang maiugnay ang iba pang mga piraso ng impormasyon tulad ng oras, lokasyon, distansya sa pagitan ng mga lokasyon, reputasyon ng isang lokasyon, o kung paano ito ginamit (halimbawa ng card terminal o web site,) ang isang machine learning algorithm ay maaaring mas mahusay na matukoy ang tunay na pandaraya.
Kumuha ng isa pang halimbawa ng isang kard na ginamit sa San Jose, California, sa 4:00 PM PST, ngunit pagkatapos ay ginamit muli sa isang maliit na lungsod sa Ukraine ng 5:00 PM PST sa parehong araw. Ang posibilidad ng pagiging pandaraya na ito ay magiging mas mataas kaysa sa nakaraang halimbawa. Ang magkakaugnay na mga piraso ng data upang makakuha ng sa isang konklusyon tulad nito, ay ang oras aabutin ito upang maglakbay sa layo sa Ukraine, pagkatapos ng paggamit nito sa San Jose, at ang paggamit o kard sa isang maliit na lungsod (reputasyon maliit na walang gaanong lungsod) sa Ukraine.
MGA PANARALINGAN SA PAG-CLOSING
Ito ay naglalarawan kung paano ang Artipisyal na Katalinuhan ay maaaring maging lubhang kapaki-pakinabang sa pagkumpleto ng paulit-ulit na mga gawain na kinasasangkutan ng maraming data na pagod na pagganap at pag-aralan ng data ang mga data upang malutas ang mga problema. Ngunit papalitan ba ng teknolohiya ang mga tao? May posibilidad akong mag-isip hindi. Maaaring makuha ka ng AI ng 90% + doon sa paglutas ng mga paulit-ulit na gawain, ngunit ang 10% + ng pagsisikap ay palaging kinakailangan upang makagawa ng pangwakas na desisyon sa isang problema. Bukod dito, tulad ng iba pang mga pagsulong sa kahusayan, maaari nating magamit muli ang aming napalaya na oras upang gumawa ng mas maraming trabaho kaysa dati. Mas mahusay ba ang isang algorithm ng pag-aaral ng machine kaysa sa iba? Naniniwala ako na ang sagot ay nakasalalay sa pag-unawa sa problema na sinusubukang lutasin, at naniniwala rin ako na ang kalidad ng data ay kasinghalaga ng algorithm mismo.
John Peterson
Pamamahala ng Linya ng Produkto ng SVP
Stellar Cyber


