Başqa sözlə, adətən, "böyük verilənlər" termini haqqında danışılan zaman məşhur üç
"V" (3 V) ifadəsindən istifadə olunur:
• Volume (həcm) -
verilənlərin həcmi,
• Velocity (sürət) -
informasiyanın böyük sürətlə emal
edilməsi,
• Variety (çeşidlilik)
- verilənlərin müxtəlifliyi və çox
zaman yetərincə strukturlaşdırlmış olmaması.
Beləliklə, "böyük verilənlər" anlayışı üç məsələ -
informasiyanın böyük həcmi, onun çeşidliliyi və çox böyük sürətlə emal
olunmasının zəruriliyi ilə bağlıdır.
"Böyük verilənlər"in təhlili insanın məhdud götürmə qabiliyyətinin "görə bilmədiyi"
gizli qanunauyğunluqları aşkarlamağa imkan verir. Bu, həyatımızın bütün sahələrində - dövlət
idarəçiliyi, səhiyyə, rabitə, maliyyə, nəqliyyat, istehsalat və başqa
sahələrdə optimallaşma etmək üçün misilsiz imkanlar açır.
Böyük verilənlər ə tipik örnək olaraq müxtəlif eksperimentlərdə istifadə olunan
fiziki qurğulardan, məsələn, “Böyük Adron
sürətləndiricisi”ndən daxil olan informasiyanı göstərmək olar. Bu qurğu fasiləsiz olaraq
hər an çox böyük miqdarda
verilənləri hasil edir, alimlər isə onların köməyi ilə çoxlu sayda məsələləri həll
edirlər. Ancaq "böyük verilənlər"in əhatə dairəsi təkcə elm adamları ilə məhdudlaşmır. Bu gün Facebook, WhatsApp,Twitter, Skype kimi sosial şəbəkələrin
istifadəçilərinin sayı milyardlarladır, onların bu şəbəkələrdə eyni zamanda yerinə
yetirdikləri əməliyyatların miqdarı isə çox böyükdür. Burada verilənlərin emalı
dedikdə təkcə onların yozulması (interpretasiyası) deyil,
bu əməliyyatların hər birinin düzgün emal
edilə bilməsi nəzərdə tutulur. Başqa sözlə, hər bir
əməliyyatı lazım olan yerə yerləşdirmək və elə
etmək ki, bütün şəbəkə istifadəçiləri bu verilənləri
dərhal əldə etsin, çünki sosial şəbəkələr gözləməyi
sevmir.
Açar
sözlər
• "Böyük verilənlər"
• üç "V" (3 V)
• Verilənlərin hasilatı
• NoSQL
• MapReduce
• Hadoop
Diqqət!
"Böyük verilənlər", xüsusən onların təhlili ilə bağlı bir sıra yanaşmalar çoxdan
mövcuddur; məsələn, müşahidə kameralarından alınan görüntülər selinin emalı on
illərdir aparılır.
Bəs böyük verilənlər , xüsusən böyük həcmdə strukturlaşmamış verilənlər necə
saxlanılır və necə emal olunur? Son illər bu istiqamətdə geniş tədqiqatlar aparılmış
və xüsusi texnologiyalar işlənib-hazırlanmışdır. Belə texnologiyalara ömək olaraq
"verilənlərin intellektual analizi"ni, NoSQL, MapReduce, Hadoop yanaşmalarını
göstərmək olar.