yazarı tarafından kooplog.com için yazılmıştır.
Data Nedir?
Data kelimesi 1640’da orijin olarak Latince datum kelimesinin çoğulu olarak türetilmiş “verilen” ya da “tahsis edilen bilgi” anlamına gelmektedir. Türkçe’de tam karşılığı veri olan data kelimesinin ilk kullanımı 1960’lara dayanmaktadır.
İlk zamanlarda matematik alanında numerik bilgilerin hesaplamalarında ve toplanmasında kullanılan data kelimesi günümüzde daha çok bilgisayarlar arası depo ve transfer edilen bilgilerin karşılığı haline gelmiştir.
Peki data gibi soyut bir kavramın büyüğü küçüğü olur mu?
Data toplamak, verileri analiz etmek, veritabanı, elektronik veri, data uzmanı gibi kavramlar sadece bilişim sektöründekilerin ilgi alanında değil artık. Küçük işletmelerden tutun, global firmalara kadar herkesin bir datası var. Öyle ki, biz bireysel internet ve sosyal medya kullanıcılarının dahi günde terabaytlarca data ürettiği, tabiri caizse ‘datan kadar konuş’ denilecek bir çağdayız. Hal böyle olunca bu datalar akıllıca depolanmalı ve dijital dünyamızda tutulmalı. Ama nasıl?
E-posta adresi, lokasyon, telefon numarası, IP adresi, kullanıcı profili, arama sonuçları, zaman, GPS, gün, yüz tanıma ve kullandığınız cihazın teknik ve yazılımsal bilgileri; her gün indirdiğimiz basit uygulamalar ya da gezindiğimiz web siteleri tarafından bile toplanan veri başlıklarındandır.
Internet üzerindeki toplanan verileri kabaca yapılandırılmış ve yapılandırılmamış veriler olarak ikiye ayırabiliriz. Çok fazla teknik detaya girmeden bu iki kavramı şöyle açıklayabilirim. Yapılandırılmamış veri, düzenlenmemiş ham veridir.
Sosyal medyadaki etkileşimlerinizin detaylarına indiğinizde kimin hangi saatte beğendiğini göremezsiniz ama orada tıklanma sayısı, etkileşim, bağlantı tıklamaları gibi ham haliyle görebilirsiniz. Aynı şekilde web sitenizdeki günlük ziyaretçi sayısı, reklam tıklamaları da analiz edilmemiş- yapılandırılmamış verilere örnektir.
Yapılandırılmış veriler ise diğerlerinin aksine belli bir amaca hizmet etmek üzere işlenmiş ve tablolar haline getirilmiş veri gruplarıdır. Ay ay listelenmiş fatura kayıtları, üniversitelerin öğrenci bilgi sistemleri, milyonlarca kişinin girdiği sınav sonuçlarının listelerinin hepsi yapılandırılmış, bir anlam ifade eden verilerdir.
Big Data kaç Gigabayt?
Akıllı telefon ve bilgisayar seçerken depolama alanı gözardı edilmez özelliklerin arasındadır. 1 terabaytlık telefonlar cebimize girmeye başladı bile. Buna rağmen harici disklerle kendimize ait verileri, sevdiğimiz filmleri biriktirmeye devam ediyoruz. Belirli periyotlarla kullandığımız cihazın verilerini daha büyük alanlara taşıyoruz. Fiziksel olmayan depolama kaynaklarına (GoogleDrive, DropBox ve iCloud gibi) ödemeler yapıp daha büyük depolama alanlarına kavuşabiliyoruz. Ve bu büyüdükçe büyüyor.
Şimdiye kadar bahsettiklerimle dünyadaki veri fazlalığını anlamış olmalısınız.
Aynı telefonlarımızdaki SD kartlar ve kullandığımız harici diskler gibi global şartlarda dönen bu ham ve işlenmiş veriler de belli bilişim teknolojisi şirketlerde ve serverlarda depolanmaktadırlar.
Dünya üzerindeki en büyük data şirketi IBM’dir. IBM’de her gün yaklaşık olarak 2.5 Kentilyon(2.5 x 10^19) bayt data üretilir. Bunu HP, Oracle, Amazon ve Microsoft gibi diğer şirketler kendilerine ait günlük data sayılarıyla takip eder.
Her saniye artan data yoğunluğunun 2025’de 163 Zettabayt’a (163 x 10^ 21) ulaşacağı tahmin edilmektedir. İnanılmaz değil mi?
Big Data neden önemli?
Dijital dünyadaki verinin niceliğinden bahsettik. Peki ya bu verilerin gerçekten hangileri önemli, hangileri işlenmeli ve hangileri ile veri kirliliğine ve olası komplo teorilerine mahal vermeden, insanlık adına daha iyi buluşlar ortaya konmalı?
Askeri alandan tutun, bankacılık, hükümet kaynakları ve sağlık sektöründe, yapay zeka ve makine öğrenmesi alanlarında kullanılabilme imkanı vaadeden olan big data’yı hala tam bir potansiyelle kullanıyor değiliz. Haliyle daha çok endüstriyel amaca hizmet eden big data:
- ileriye yönelik bilimsel tahminlerde bulunmak,
- maliyet ve zaman tasarrufu yapmak,
- iş kararlarını desteklemek ve yeni risk planları oluşturulmasında yardımcı olmak,
- müşteri ilişkilerini olabildiğince kişiselleştirmek,
- hastalık takibi ve hastalığın seyri hakkında raporlar elde etmek,
- doğal kaynakları ve buna bağlı ekonomiyi sürdürülebilir kılmak,
- bağımlılık analizleri ve amaca yönelik optimizasyon yapmak amacıyla kullanılıyor.
Gördüğünüz üzere data her şey değildir ama günümüzde çok şeydir. En kısa zamanda Türkiye’de de bu kaynakların kullanılmasını ve analizlenerek sonuçlarının doğru şekilde kanalize edilmesini diliyorum.
Bu İçeriği Okuduğunuz için Önerdiğimiz İçerikler:
- Kişisel Verilerinizin Güvenliği için Yasal Düzenleme: General Data Protection Regulation (GDPR)
- Twitter’dan Yeni ”Tuş” Duyurusu: Yeni Zaman Tünellerini Keşfedin
- Internet’in Sahibi Kim?
İlginizi Çekebilecek Faydalı Bağlantılar: