Big DATA

Big Data, doğru analiz metodları ile yorumlandığında şirketlerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha iyi yönetmelerine ve inovasyon yapmalarına imkan sağlayabiliyor.

Son yıllarda hızla artan ölçülebilir verilerin çokluğu, bunların şirket ve kurumlar için ne kadar önemli olduğu hepimizin malumu. Kökleri yaklaşık olarak 2004 yılına kadar uzanan veri topluluğu, bir başka değiş ile Big Data, verinin öneminin en büyük kanıtı niteliğinde. Bu yıllardan beri dünya devi nice markanın üzerine yatırım yaptığı ve bunun getirisini ilerleyen yıllarda fazlası ile aldığı Big Data aslında oldukça basit bir mantığa dayanıyor. IT sektörünü baştan sona şekillendirdiğini söyleyebileceğimiz bu kavram (Yüksek Hacimli Veri) ortaya çıkan içeriğin nerede, nasıl saklanacağı, içindeki bilgiye ne şekillerde ulaşılabileceği, nasıl işlenerek, mecraya kısa ya da uzun vadede ne tür faydalar getirebileceği üzerinde oldukça kapsamlı bir başlık. Uzun süredir büyük yatırımlar yapılan bu alan sağlıktan, otomotive kadar oldukça geniş bir yelpazede yerini alıyor.

Küçük bir örnek vermek gerekirse, 2012 Londra Olimpiyatları bu konuda önemli bir başarı olarak görülmekte. Dört yılda bir düzenlenmekte olan Olimpiyatlar, teknolojinin gelişmesi ile birlikte sadece sporcuların değil, teknoloji dünyasının da adeta çarpışma alanına dönüşüyor. NetApp’ın bahsi geçen etkinlik sonrasında yayınladığı bir infografik, Yüksek Hacimli Veri için oldukça şaşırtıcı sonuçları paylaşıyor.

Dört yıl önceki Pekin Olimpiyatları’na göre yüzde 30 oranında bir artış söz konusu! Oyunlar start almadan önce BT sistemleri ve altyapı test edilirken, toplamda 200 bin saatlik büyük veri oluşmuş. Törenin sadece açılış kısmını bile 1 milyardan fazla kişi seyretmiş. Olimpiyat Oyunları esnasında, İngiliz telekom ağı içerisinde saniyede 60 GB’lık boyuta sahip bilgi oluşacağı ön görüldü. 2 bin saate eşit etkinlik, medya üzerinden 14 bin 400?ün üzerinde televizyon ve yayın istasyonu tarafından yayınlandı. Facebook’ta hergün 15 TB’tan fazla veri 845 milyon aktif Facebook üyesi tarafından oluşturulmuş ve tüm bu “veri parçacıkları” önemli marka ve şirketeler için, geleceğe yönelik mühim bir ön görü şansı sunmuş.

Big Data: Her Alanda ve Her Noktada

Tüm bu bilgiler, küçük bir örneğin Yüksek Hacimli Veri dünyasında ne derece önemli bir içeriğe sahip olduğunun da kanıtı. Her yıl yaklaşık olarak yüzde 40 artış gösteren bu dev veri tabanından pek tabii ki faydalanmamak düşünülemezdi. Bu önemli verilerin sadece ticaret alanında değil, psikiyatri gibi bilim dallarında bile önemli istatistiklere kapı açtığını da not düşmüş olalım. İşin özünün analizde yattığı Big Data’da satıcı ve müşteri arasında gerçekleşen alışveriş, bir sonraki alıcı veya aynı müşterinin alışkanlıklarını ölçecek ve ilgili kurum için geleceğe yönelik önemli bir ön-yatırım olacaktır.

Bir tür sonsuz bilgi havuzu olarak da adlandırabileceğimiz Yüksek Hacimli Veri’nin tek işlevi ileriye yönelik yatırım ve planlamalar yapmak değil. Big Data ekonomik segmente hükmedebilmeyi sağladığı gibi, ilgili pazarın ne durumda olduğu ve nelere yönelip, nelerden kaçınılması gerektiğine dair de önemli bilgiler içerebilir. Asıl önemli olan, bu sonsuz havuzda kaybolmamak için izlenmesi gereken yolu iyi bilmek, doğru analizi, akılcı çözümler ile gerçekleştirebilmektir.

IT sektörünün hızla yükselen mesleği haline gelen Data Scientist’in görevi de tam bu noktada başlar. Söz konusu alanda uzman olması gereken görev sahibinin, hedefe uygun veriyi bilgi havuzundan dikkatlice çıkarıp, gerekli alanlara aktarması gerekir. Burada hedef sadece geleceğe bakmak değil, geçmişteki “akışın” ileride ne yöne ilerleyeceğini öngörebilmektir. Gerekli detaylar veri havuzundan süzüldükten sonra, işin bir başka meşakatli aşaması başlar. Elde edilen veri gerekli kişilere detaylı olarak sunulmalı, sunum yapılan kişinin (gerektiğinde bir başka analist ya da yönetici) kendi diline uygun bir üslup seçilmelidir. Tek düşünce yetkili kimsenin karar vermesini sağlamak değil, genel bir fikir birliğine vararak ortaya yeni bir hedef koymaktır.

Durumu bir başka örnekle taçlandırmak gerekirse; sosyal medyada süregelen reklam savaşları Yüksek Hacimli Veri’nin en önemli “müşterilerinden” biridir. Facebook, Twitter, Instagram ya da müzik dinleme hizmeti sunan birbirinden farklı ya da benzer mecra, reklamverenler için durmaksızın veri toplar. Kullanıcı alışkanlıklarını belirlemek, bu alışkanlıkları gerektiğinde paraya, gerektiğinde ise kısa dönemde kar sağlamayacak stratejilere evriltmek asıl amaçtır. X bir sosyal mecrayı kullanan bir kullanıcı, Y bir sayfaya gelmeden önce neler yapmıştır, incelediği sayfada bulunma sebebi nedir, kullanıcı ne yapılırsa reklamverenin arzu ettiği alana gelir, bu noktada istenilen ürüne yönlendirilebilir mi, nasıl yönlendirilir? İşte bunların hepsi Yüksek Hacimli Veri’nin işlenmesi ile ortaya çıkan sonuçların işidir.

Uzun yıllar boyunca gereksiz ya da üzerinde uğraşılmaya değmeyecek olarak görülen bu bilgi madeni, özellikle de sosyal medyanın gelişmesi ile önemli bir yol kat etmiştir. Bunun yanı sıra çevrim içi alışveriş siteleri, sanal sosyal gruplar, farklı ilgi alanlarına sahip kişileri tek bir çatı altında toplayan çok sayıdaki web sitesi. Hepsinin isteyerek ya da istemeyerek oluşturduğu tek şey, uçsuz bucaksız bir veri denizidir. Bu denizde, hatta okyanusta, söz konusu web siteleri az öncede bahsettiğimiz gibi adeta bir tür “mayın tarayıcılığı” yaparlar. En basit örneği ile alışveriş yaptığınız bir çevrim içi alışveriş sitesinde size sunulan alternatif ürünler, daha önceki alışverişlerinizden ya da gezindiğiniz diğer ürün sayfalarından “sizin hakkınızda edinilen bilgiler” ile gerçek olmaktadır. Daha önce de söylediğimiz gibi, önemli olan sonsuz bir çöplük olarak da kalabilecek bu alanın en ince noktasına kadar taranmasıdır.

Big Data: Nereden ve Nasıl?

Peki nasıl oldu da, Yüksek Hacimli Veri, yani Big Data yavaş ilerleyen bir süreçten, durmak bilmeyen bir çağlayana dönüştü? 1980?li yıllarda, günümüz teknolojisinin sunduğu nimetlerden henüz faydalanamayan şirketler, ERP (Enterprise Resource Planning) sistemlerinin öncülüğünde, müşteri, tedarikçiler, üretim ve dağıtım merkezini tek bir çatı altında toplayarak, ürünü en kısa sürede, en sağlıklı şekilde alıcıya ulaştırmak amacını güdüyordu. Maddi olarak doygunluğa ulaşan şirketler bir süre sonra farklı sorular sormaya başladılar. Bunların başında ise “benim için doğru müşteri kimdir?” sorusu yer aldı. Bu sayede ise CRM (Customer Relationship Menagement – Müşteri İlişkileri Yönetimi) sistemi doğdu. Bu sistem ile birlikte, doğru hizmet ya da ürünü, doğru müşteriye (kar getirecek kitle), doğru fiyatla, doğru zaman ve mekanda, sunmak ilkesi ortaya çıktı. Asıl hedef, “ürün müşteriye ulaşmalı”dan öte, “müşteriye göre ürün sunmak” haline geldi. Bu gibi sebeplerden ötürü de, teknolojinin gelişmesi, etkileşimin artması, lokasyona duyarlı cihazların yükselişe geçmesi ile birlikte Yüksek Hacimli Veri korkunç bir hızla yükselişe geçti.

Yüksek Hacimli Veri’nin oluşumu ise beş ayrı basamaktan meydana gelir. Bunlar sırası ile Variety, Velocity, Volume, Verification ve Value şeklindedir. Beş basamak sektörde kısaca 5V diye anılır.

Variety: Kullanıcı ya da müşteri tarafından üretilmekte olan verilerin yüzde 80?lik bir kısmı farklı format ve tabanlardadır. Akıllı telefonlar, tabletler ve bütünleşik devrelerden gelen çok sayıdaki “çeşitlilik” Veri Tipi olgusunu ön plana çıkarır. Farklı dillerde (görsel, video, CRM dosyaları, sensör verileri, sosyal medya içerikleri), Non – Unicode olarak düşünebileceğimiz bu verilerin bir arada bulunması ilişkisel bir veritabanı için pek mümkün değildir. Verileri bu şekilde ayıklamak ise büyük bir zahmet ve beraberinde masraf getirir. İşte Yüksek Hacimli Veri, çok sayıdaki çeşitliliğe sahip verinin işlenmesi ve analiz edilmesi için kusursuz bir çözümdür.

Volume: Yüksek Hacimli Veri’nin bel kemiğidir. Eldeki verinin her geçen gün artan hacmi, bir yandan da şirketlere Bilgi Teknolojileri açısından ekstra masraf çıkartmaktadır. IDC’nin istatistiklerine göre 2020 yılında ulaşılacak olan veri miktarı, 2009 yılının 44 katı olacak! Günümüzdeki veri saklama yöntemlerinin yeterliliği düşünülecek olursa, 44 katı fazla içerik için ne kadar yatırım yapılması gerektiği de açıktır.

Velocity: Hacmi artmakta olan verilerin belki de en önemli “işleniş aşaması” Hız’dır. Sisteme çok hızlı bir şekilde akan verinin en kısa sürede, en doğru şekilde değerlendirilmesi gerekir. Esas olan doğru sonucu sunacak hızı yakalayabilmektir.

Verification: Bitmek bilmeyen bilgi akışı içerisinde en önemli kurallardan biri de “doğru ve güvenilir” bilgiyi ayıklayabilmektir. Ayıklama esnasında gerekli güvenlik seviyesinin sabit tutulması, doğru – güvenilir kişiler tarafından gözlemlenmesi ya da gizli tutulması ilkesine dayanır.

Value: Yüksek Hacimli Veri işleyişinin, satıcı ve üretici için en önemli ayaklarından bir tanesidir. Çok sayıda formata ve büyüklüğe sahip bilgilerin çözümlenmesi için gerekli değere sahip olup, olmadığını ortaya çıkartan sac ayağıdır. Müşterisine hizmet sunacak olan şirketlerin, bu işlemin ileride kendisi için neler getireceğini, kar ya da zararın ne boyutlarda olabileceğini ön görmesi için önemlidir.

Yüksek Hacimli Veri klasmanının kullanıldığı alanlara başka örnekler de vererek, bu akış hakkında daha detaylı bilgiye sahip olabiliriz. İnternet mecrasının neredeyse her bir birey tarafından kullanılabildiği günümüzde, yaptığımız her bir işlem, izin alınarak ve bazen de izinsiz olarak kayıt altına alınmaktadır. Bunun en büyük nedeni de Yüksek Hacimli Veri bankası oluşturabilmektir.

Bu başlık altında yer alan önde gelen kişiler ise hükümetlerdir. Vatandaşlarına yönelik her türlü bilgiye ulaşmak isteyen hükümetler, veri saklama konusunda büyük ölçekli çalışmak zorundadır. Sağlık hizmetlerinden güvenliğe kadar çok sayıda konu, Yüksek Hacimli Veri olarak saklanmaktadır. Bir başka öne çıkan kurum/kurumlar ise üreticiler, web hizmet sağlayıcıları ve reklamcılardır. Amaç diğer mecralara da bilgi paylaşımı yapabilmektir. Öte yandan nerede ise herbirimizin iletişimde olduğu bankalar müşterileri ile ilgili bilgi toplar, analiz eder ve hem hizmet sunmada, hem de kendini korumaya alabilmekte başı çeker. İlaç sanayisi de bir başka önemli örnektir. Kanser araştırmaları gibi konular için oluşturulan veritabanları, araştırmacıların anlık erişimi için açık tutulur. Tüm bu örneklere, daha önce de bahsettiğimiz sosyal medya markaları, iletişim hizmet sağlayıcıları, ses ve görüntü çeken ürünler sağlayan kuruluşlar da katılmaktadır.

Sözün kısası, Yüksek Hacimli Veri günümüzdeki en önemli kaynaklardan biri haline gelmiştir. Zamanımızın, büyük ya da küçük, şirketler için olmazsa olmazı haline gelen bu önemli mevzu gözardı edilmemesi gereken, ticaretin ve marka stratejilerinin önünü açan bir kazanımdır. Şirketler için hem kazanç hem de stabilitenin yolu, kısaca anlattığımız gibi artık Big Data’dan, Yüksek Hacimli Veri’den geçmektedir ve onsuz bir ticaret hayatı verimli günlerin ardımızda kalacağı sakil bir geleceğe ilerlediğimiz manasına gelir.

3,098 total views, 1 views today