Mga Diskarte sa Pamamahala ng Data: Schema-on-Read vs. Schema-on-Write

Ang epektibong cybersecurity ay nagsisimula at nagtatapos sa data.

Dahil maaaring i-deploy ng mga attacker ang kanilang mga payload sa loob ng ilang segundo, ang pagtiyak na hindi naghihintay ang iyong security team ng ilang minuto o oras para mapansin ng kanilang platform ng mga operasyong panseguridad ang isang pag-atake ay maaaring mangahulugan ng pagkakaiba sa pagitan ng isang nakahiwalay na banta at isang malawakang kompromiso. Bagama't ang karamihan sa mga modernong produkto ng cybersecurity ay mabilis na nakakadetect ng mga banta, ang makakaapekto sa kanilang pangkalahatang pagganap ay ang mga pagpipilian sa disenyo na ginawa nang maaga sa proseso ng pagbuo ng produkto, partikular kung paano pinangangasiwaan ng produkto ang pamamahala at pagproseso ng data. Sa blog na ito, tatalakayin ko kung paano maaaring gumana ang pagtuklas ng pagbabanta na hinimok ng AI sa bawat diskarte gamit ang isang kathang-isip na organisasyon na nagtatrabaho sa limampung iba't ibang produkto ng seguridad at limampung iba't ibang mapagkukunan ng data upang ma-secure ang kanilang mga kapaligiran.

Isang Mabilis na Aside sa AI-Driven Threat Detection
 
Hindi tulad ng pagtuklas ng pagbabanta na nakabatay sa panuntunan, na naghahanap ng mga partikular na trigger ng isang partikular na pinagmumulan ng data upang makabuo ng mga alerto, ang pagtuklas ng pagbabanta na hinimok ng AI ay maaaring tumukoy ng mga anomalya kumpara sa mga inaasahang gawi sa maraming pinagmumulan ng data. Dahil sa kakayahang ito, ang isang produktong panseguridad na sumusubok na makakuha ng mga banta nang epektibo gamit ang teknolohiyang AI ay mangangailangan ng kumplikadong lohika na idinisenyo upang gawing normal at pagyamanin ang data sa limampung pinagmumulan ng data na ito.

Dalawang Distinct Data Management Approach

Schema-on-Read

Ang Schema-on-Read ay isang diskarte sa pamamahala ng data kung saan nangyayari ang raw data ingestion nang hindi naglalapat ng anumang paunang natukoy na schema. Ang diskarteng ito ay nagsasama ng maraming iba't ibang data source nang mas mabilis dahil hindi na kailangang maunawaan ang format ng data source nang maaga. Sa halip, ang hilaw na data ay naka-imbak kung ano-ano, at anumang schema na kinakailangan para sa pagproseso ay nangyayari sa oras ng pagbasa nang hindi binabago ang raw data. Mas gusto ng maraming data engineer ang Schema on Read dahil binibigyang-daan sila nitong:

  • I-ingest ang data nang mas mabilis dahil hindi kailangan ang upfront structuring.
  • Iangkop sa mga sitwasyon kung saan ang mga format ng data ay patuloy na nagbabago.
  • Pangasiwaan ang malawak na hanay ng mga pinagmumulan ng data nang hindi binabago ang kanilang schema.

Tulad ng anumang teknolohiya, may mga disadvantages sa paggamit ng Schema-on-Read na diskarte sa pamamahala ng data:

  • Naghihirap ang pagganap sa paghahanap
  • Ang Data Analytics ay resource-intensive sa compute
  • Isang mas mataas na hilig para sa mga hindi pagkakapare-pareho ng data at mga error.

Pag-detect ng Banta na Dahil sa AI sa isang Schema-on-Read World

Ngayong napag-usapan na natin ang mga kalamangan at kahinaan ng Schema-on-Read. Isaalang-alang natin kung paano maaaring gumana ang pagtuklas ng pagbabanta na hinimok ng AI nang walang schema sa data. Tulad ng nabanggit dati, ang pagtuklas ng pagbabanta na hinimok ng AI ay kinikilala ang mga anomalya kumpara sa inaasahang pag-uugali. Dahil sa pangangailangang ito, mangangailangan ang isang produktong panseguridad na nakabatay sa AI ng kumplikadong lohika na idinisenyo upang gawing normal at pagyamanin ang data "on the fly" sa buong nakaimbak na data sa iba't ibang format. Ang bawat tala ay dapat na maiproseso sa mabilisang paraan upang maiwasan ang pagkawala ng anumang anomalya. Hindi mahirap isipin na ang diskarteng ito ay maaaring mabilis na maging mahal dahil mangangailangan ito ng tuluy-tuloy na makabuluhang kapangyarihan sa pagpoproseso at memorya upang pansamantalang maimbak ang naprosesong data para sa iba't ibang AI-driven na detection. Kaya, habang ang ideya ng pag-ingest ng hilaw na data ay pakinggan at maaaring para sa ilang kaso ng paggamit ng hindi cybersecurity patungkol sa pagtuklas ng pagbabanta na hinimok ng AI, ang mga patuloy na gastos ay maaaring mabilis na mawala sa kamay. Ang presyo ay maaaring maging lubhang mahal at hindi mahulaan kapag ang pag-iimbak ng data at AI-driven na pagtuklas ay mula sa iba't ibang vendor.

Schema-on-Write

Hindi tulad ng Schema on Read, ang Schema on Write ay gumagawa ng ETL (Extract, Transform, Load), na naglalapat ng ilang istruktura (schema) sa data nang maaga, binabago, at pinapatunayan ang na-ingested na data bago sumulat sa anumang data store. Gaya ng maaari mong asahan, ang mga benepisyo ng Schema on Write:

  • Tumaas ang integridad ng data at mabawasan ang hindi pagkakapare-pareho nito
  • Mabilis at mahusay na paghahanap
  • Madali at mabilis na pagsusuri ng data

Upang maging patas, may ilang mga limitasyon pagdating sa mga diskarte sa Schema-on-Write sa pamamahala ng data:

  • Maaaring mangailangan ng mga update sa schema ang mga pagbabago sa mga format ng data source data.
  • Kailangang ma-update ang schema ng data para ma-accommodate ang mga bagong data source.

Pag-detect ng Banta na Dahil sa AI sa isang Schema-on-Read World

Dahil natukoy ang mga kalamangan at kahinaan ng Schema-on-Write, tingnan natin ngayon ang pagtuklas ng pagbabanta na hinimok ng AI na may mga schema ng data na inilapat bago sumulat sa isang database. Ipinapalagay namin na nagtatrabaho kami sa parehong organisasyon na may limampung iba't ibang mga produkto ng seguridad upang protektahan ang kanilang kapaligiran. Nagaganap ang mga pagbabagong-anyo ng data bago mag-load sa isang database kapag pinagsama-sama ang data sa isang schema-on-write na platform ng seguridad. Sa panahon ng pre-processing na ito, ang lahat ng data ay na-normalize at pinayaman ng data mula sa iba pang mga mapagkukunan. Gumagana na ngayon ang mga kakayahan sa pagtuklas ng pagbabanta na hinimok ng AI sa isang malinis na set ng data sa isang karaniwang format na may konteksto, na lumilikha ng iba't ibang mga baseline at mabilis, mahusay, at tumpak na pagtukoy ng mga anomalya. Halimbawa, ang pagtukoy sa aktibidad ng mga nakompromisong kredensyal mula sa isang hindi pangkaraniwang pisikal na lokasyon ay madaling ma-optimize dahil ang heyograpikong lokasyon ay idinagdag sa data sa panahon ng proseso ng pagpapayaman bago sumulat sa database. Katulad nito, ang lahat ng mga IP address, halimbawa, ay maaaring pagyamanin ng impormasyon ng lokasyon dahil sa proseso ng normalisasyon, na tinitiyak na ang anumang hindi pangkaraniwang aktibidad ng user ay madaling matukoy.

Alin ang Tamang Pagpipilian para sa Iyo?

Kapag nag-iisip ka ng isang napapanatiling mapagkumpitensyang kalamangan sa mga umaatake, maaaring hindi isang diskarte sa pamamahala ng data ang unang bagay na naiisip, ngunit dapat ito. Bagama't may mga kalamangan at kahinaan sa bawat diskarte sa pamamahala ng data na tinalakay sa itaas, sa huli, dapat mong timbangin ang epekto ng isang diskarte sa pamamahala ng data ng produkto sa iyong mga layunin bago ito gamitin, dahil ito ay may napakalaking implikasyon sa gastos, ang iyong kakayahan para sa pangangaso ng pagbabanta sa pamamagitan ng epektibong paghahanap, at ang iyong kakayahang bumuo ng sarili mong AI-driven o kahit na mga manu-manong panuntunan para sa mga pagtuklas ng pagbabanta.

Ang Stellar Cyber ​​ay binuo gamit ang isang pamamaraan ng pamamahala ng datos na Schema-on-Write, na nagbibigay sa aming mga customer ng epektibo at tumpak na mga resulta ng pagtuklas ng banta na pinapagana ng AI, mabilis na paghahanap ng banta, at kakayahang umangkop sa pagbuo para sa iyong pagsusuri ng banta. Bukod pa rito, kapag ginagamit ng mga organisasyon ang kakayahan ng aming platform na Bring Your Own Data Lake (BYODL), makakakita sila ng malaking matitipid sa gastos sa pamamagitan ng pag-iimbak lamang ng mga resulta sa kanilang data lake o sa kanilang mga umiiral na. SIEMPara matuto nang higit pa tungkol sa kung paano gumagana ang Stellar Cyber ​​upang ma-optimize ang aming pakikipag-ugnayan sa iyong data, makipag-ugnayan sa amin ngayon para mag-set up ng personalized na konsultasyon.

Mag-scroll sa Tuktok