İnternet kullanarak attığımız her adım ile veri üretiyoruz. Müşteri profilimiz, akrabalarımız, Google’da neleri arattığımız, en çok hangi şarkıyı dinlediğimiz ve neresi için uçak bileti baktığımız: Hepsi dijital evrende birer veriye dönüşüyor. Facebook, YouTube, Instagram, e-ticaret siteleri, akıllı telefonumuzdaki sağlık takip eden uygulamalar… Bunların ve yüzlerce benzer teknolojinin hayatımıza girmeleriyle birlikte dijital veri üretiminde nasıl bir artış olduğunu tahmin edebilir misiniz?
Büyük Veri Analizi
Büyük veri, çok basitçe geleneksel veri işleme yöntemleri kullanarak işlemenin zor veya imkânsız olduğu kadar büyük, hızlı veya karmaşık olan verileri ifade ediyor. Bu veri havuzları birçok kaynağın katkısıyla sürekli yükselen bir hızda büyüyorlar ve çeşitli formatlardaki bir sürü bilginin yer aldığı dijital bir kümeye dönüşüyorlar diyebiliriz. Bu kümeler -yani büyük veri-çoğunlukla bilgisayar veri tabanlarında depolanır ve büyük, karmaşık veri kümelerini işlemek için özel olarak tasarlanmış yazılımlar kullanılarak analiz edilir.
Büyük Veri Konusunda Bilinmesi Gerekenler
Büyük veri konseptinin iyice ünlenmeye başladığı 2000’lerin başında, endüstri analisti Doug Lacey büyük veri için günümüzde halen çok geçerli kabul edilen üç özellik tanımlamıştı. Bunlar İngilizce isimleri sebebiyle büyük verinin 3 V’si olarak geçiyor:
1) Hacim (Volume): Büyük veri analizi çok büyük miktarda düzensiz verinin analiz edilmesini gerektirebiliyor ve bu yüzden verinin miktarı (hacmi) önemli. Wisconsin Üniversitesi’ne göre şu anki veri patlaması dijital evrenin 2025 yılına kadar 180 zettabayta (180 ardından 21 sıfır) ulaşacağını gösteriyor.
2) Sürat (Velocity): Buradaki sürat, verinin elde edilme ve işlenme hızını ifade ediyor. Her dakika yaklaşık 3,8 milyon Google araması yapıldığını veya 156 milyon e-mail atıldığını ve bu veri oluşturma hızının da gittikçe yükseldiğini düşünün.
3) Çeşitlilik (Variety): Veriler, geleneksel veri tabanlarındaki yapılandırılmış, sayısal verilerden yapılandırılmamış metin belgeleri, e-postalar, videolar, ses dosyaları, hisse senedi verileri ve finansal işlemlere kadar bir sürü formatta olabilirler.
Son zamanlarda bunlara değer (value), değişkenlik (variability) ve görselleştirme (visualization) gibi kavramların eklenmesi de konuşuluyor.
Umarız büyük veriye yaptığımız bu minik giriş işinize yarar. İlginizi çektiyse bu konuda ulaşabileceğiniz bir sürü kaynak olduğunu da unutmayın!