Büyük verinin 3 V’si olan veri hacmi (volume), veri hızı (velocity) ve veri çeşitliliğine (variety) çoktan aşinayız. Bunlara ek olarak, düşük veri kalitesi yüzünden harcadığımız maliyet ve efor sonucunda, Büyük Veri’nin dördüncü bacağının da önemini yavaş yavaş kavramaya başladık: veri doğruluğu (data veracity).
Büyük veri çağında; üretilen verinin geniş hacmi, gelen verinin hızlılığı ve çok çeşitli heterojen veriyle, veri kalitesi mükemmellikten çok uzakta kalıyor. Büyük Veri çözümleriniz 3 V’nin özelliklerini karşılamış olsa bile, şirketinizde ilgilenilmesi gereken yararsız ve hatta potansiyel olarak zararlı verilerden oluşan bir “sahipsiz hazine” bulunabiliyor. “Gelişmiş Federal Sektör Sağlık Hizmetleri’nin (Advancing Federal Sector Healthcare)” 2013 yılında yayınlanan bir vaka incelemesine göre, düşük kaliteli veriler bir şirkete, gereksiz efor ve müşteri şikayetleri nedeniyle %20-40 arasında bir bedele mal olabiliyor. Techrepublic.com da; düşük veri kalitesi nedeniyle ABD şirketlerinin yılda 600 milyar dolar harcayacağını tahmin ediyor. Güncel diğer bir araştırma, çoğu veri ambarı projesinde verinin kalitesini arttırmak için sistem geliştirmek yerine verileri temizlemenin tercih edildiğini ve veri geliştirme süre ve bütçesinin %30-80’inin buna ayrıldığını gösteriyor.
Organizasyonların, büyük veri ile ilgili aşağıdaki sorunlarla karşı karşıya olduğunu söyleyebiliriz:
- Veri kaynaklarının çeşitliliği, sayısız veri türü ve karmaşık veri yapılarının ortaya çıkmasıyla veri entegrasyonunun zorluğu artıyor.
- Büyük veri hacimleri, veri kalitesini makul bir süre içinde değerlendirmeyi zorlaştırıyor.
- Veriler çok hızlı değişiyor ve güncelliklerini kısa sürede kaybedebiliyor. Bu da işleme teknolojisi için daha yüksek gereksinimleri karşılamayı zorunlu kılıyor. (Li Cai, Yangyong Zhu)
Veri toplama süreci boyunca proaktif olmak, Büyük Veri sorunlarını gidermeye ve sürekli zayıf verileri temizlemeye harcanan eforu minimuma indirgiyor.
İşletmelerde Veri Doğruluğu
Yüksek veri kalitesi standartlarına ancak doğru, tutarlı, zamanlı ve kapsamlı veri sağlayarak ulaşılabiliyor. Bu yüzden tüm verilerin zaman damgalı olması ve veri tabanına eksiksiz veya hatasız girilmesi büyük önem taşıyor. Yüksek kaliteli veri sayesinde, yüksek kullanıcı erişilebilirliğine bağlı manuel arama yapma ihtiyacı ortadan kalkıyor. Bununla birlikte, verilerin standartlaştırılması farklı departmanlar veya endüstri sektörleri arasında değiş tokuş yapılmasına olanak tanıyor.
Adres Doğrulama
Adres doğrulama, kulağa basit bir işlem gibi gelse de Büyük Veri temizleme araçlarının önemli bir parçası olarak karşımıza çıkıyor. Adres doğrulama araçları; bir veri tabanına girilen adres bilgilerinin geçerli ve eksiksiz olmasını garanti edebiliyor. Müşterilerinizin size verdiği bilgiler çok az olduğunda bile, gerçek zamanlı adres doğrulama sistemi, boşlukları sizin yerinize dolduruyor. Doğrulama sistemleri, bir adresin yerini bulmak için arama dizeleri oluşturarak, en iyi eşleşmeyi belirlemek için derecelendiriyor. Buna ek olarak, belirli bir adresin gerçekte var olup olmadığını kontrol etmek için doğrulanmış adres veri tabanlarına erişiyor.
Bir adres doğrulama sistemi en etkili performansını gerçek zamanlı çalıştığında sergiliyor. Tahminler her ay tüm verilerin yaklaşık %2’si geçerliliğini yitirdiğini gösteriyor. Doğrulama programları ile; isimleri, e-postaları ve adresleri düzeltmek, düşük kalitedeki verileri veri tabanlarından kalıcı olarak silmede büyük rol oynuyor.
Veri Doğruluğu ve Pazarlama
Kaliteli veri; daha fazla potansiyel müşteri edinmenizi ve gelecekteki kampanyalarınızda doğru strateji geliştirmenize yardımcı olduğu için, satış ve pazarlama departmanları tarafından çok değerli kabul ediliyor. Kaliteli verilerden elde edilen analizler; kampanyalarınızda daha esnek olmayı, daha derin müşteri içgörüleri edinmeyi ve buna bağlı olarak da müşterilere kişiselleştirilmiş kampanyalar sunmanızı sağlıyor. Pazarlamacılar artık körü körüne çalışmayıp Büyük Veriyi doğru kullanarak müşteri kazanımı için mümkün olan en iyi yolu belirlemiş oluyor.
Verilerin büyük bir ivme ile büyümesi göz önüne alındığında, Büyük Veri kalitesinin sağlanması ve işletmeniz için karar alma sırasında etkin bir yardımcıya dönüştürülmesi, günümüzde büyük bir sorun haline gelebiliyor. Düşük veri kalitesi; sınırlı veri kullanımı, verimsizlik, yüksek maliyetler, müşteri memnuniyetsizliği ve bazen hatalı stratejik kararlara bile yol açabiliyor.