Yapay Zeka Bağlamında Veri Bilimi

Mehmet Rizgic
6 min readApr 26, 2022

Dijital transformasyon ve teknolojik gelişmenin etkisi ile birlikte, küresel anlamda veri bilimi dünyasına olan ilgi her geçen gün katlanarak artmaktadır. Bu artışla birlikte yapay zeka ve veri bilimi üzerine kurulan sayfa ve blog sitelerinin, sosyal ve iş platformu medyalarının da bu alan ile ilgili paylaşımlarının, dünya çapında üniversite, enstitü ve danışmanlık şirketlerinin veri bilimi ve yapay zeka odaklı derslerin, bootcampler ile birlikte canlı veri bilimi eğitimlerinin, iş analitiği ile veri analitiği uygulamalarının, Uluslararası çapta yazılım ve Ar-Ge projelerinin alan bazlı olacak şekilde yeni mesleklerin doğduğu ve yeni iş alanlarının oluştuğunu görmekteyiz..

Yirmi birinci yüzyılın en popüler meslekleri arasında olan Veri bilimci ve veri bilimi kapsamında yol alıp kendini geliştirmek isteyen on binlerce insan, halka açık ve belli başlı amaçlar için toplanıp depolanmış hazır kümeleri indirerek bu veri setleri üzerine analizler yapmaya çalışmaktadırlar…

Bu süreçle birlikte doğan bir çok avantajın olması ile birlikte yeterli alt yapıyı kendisinde hem teorik hem de uygulama bazında sağlayamamış olan kişilerin bu yolda ilerleyemedikleri üzücü bir gerçektir. Bu kapsamda yazmaya başlamış olduğum bu yazım ilk olmakla birlikte, bu ve benzeri yazılarımı belirli bir yöntem ve akış çerçevesinde, siz değerli okuyucularım arasından kendini yapay zeka ve veri bilimi alanında kendini geliştirmek isteyenlere, düzenli ve sürekli bir şekilde yayınlanacak bir uçtan uca Python İle Veri Bilimi yayını serisi niteliğinde olacaktır..

Yapay Zeka

1956 yılında ortaya atılan Yapay Zeka , artan veri miktarı, gelişmiş algoritmalar ve hesaplama gücü ve depolama alanındaki iyileştirmeler sayesinde ancak son 10–15 yıldır popüler hale gelmiş bir alandır. Yapay zekâ, bir bilgisayarın veya bilgisayar kontrollü robotun, genellikle akıllı varlıklarla ilişkili görevleri yerine getirme yeteneği olarak adlandırılabilir. Uygulamada yapay zeka genellikle akıl yürütme, anlam keşfetme, genelleme veya geçmiş deneyimlerden öğrenme gibi insanlara özgü entelektüel süreçlerle donatılmış sistemler geliştirmek amacıyla kullanılmakta.

Yapay zekâ, bir insanın yapabileceği bazı görevleri daha fazla veriyle daha hızlı bir şekilde yapılmasına imkân tanıyan, hayatımızı kolaylaştıran bir otomasyon gibi düşünülebilir. Bu sebeple, yapay zekâ; sesli asistanlar, dil çevirileri, öneri sistemleri, navigasyon, sosyal güvenlik, sağlık hizmetleri, e-ticaret ve yardımcı robot uygulamalarıyla günlük hayatımızda yer almakta. Siber güvenlik ve savunma sanayi gibi stratejik alanlar gibi neredeyse hayatımızın bir çok yönünde kullanılabilen akıllı bir sistem haline gelmiştir.

Bu yayım serisi kapsamında sizlere daha çok yapay zekanın özellikle veri analitiği temelli makine öğrenmesi, derin öğrenme ve veri bilimi gibi alanlarda kullanılan yönlerini anlatacağım. Keyifli ve verimli okumalar dilerim 😊

Veri Bilimi

Son zamanlarda herkesin çok zikrettiği ve diline dolandırdığı kelimeler arasında herhalde Veri Bilimi kelimeleri başı çekmektedir. Peki herkesin ağzından düşürmediği bu Veri Bilimi nedir ? Hadi gelin birlikte bakalım..

Veri bilimini, verilerden değer elde etmek için istatistik, bilimsel yöntemler, yazılım, yapılan analizin alanına yönelik teorik bilgi, yapay zeka ve veri analizi dahil olmak üzere birçok alanı bir araya getirerek oluşan multidisipliner bir bilim dalıdır diyebiliriz . Veri bilimiyle uğraşan kişilere ise veri bilimci denir. Bu kişiler yapılandırılmış ve yapılandırılmamış veri tabanı, web, akıllı telefonlar, müşteriler, sensörler ve diğer kaynaklardan toplanan verileri analiz etmek ve bunlardan eyleme dönüştürülebilir içgörüler üretmek amacıyla bir dizi beceriyi bir araya getirerek süreç optimizasyonuna ön ayak olan kişilerdir diyebiliriz.

Peki Bir Veri Bilimi Süreci Nasıl İşler ?

Bir veri bilimi sürecinin sağlıklı işler yapıya sahip olabilmesi için evvela problem tanımının tam, eksiksiz bir şekilde yapılması gerekmektedir. Problem tanımı tamamlanan bir süreç için veri bilimi yaşam döngüsü aşağıdaki şekilde işlemektedir.

Planlama: Planlama aşamasında amaçlanan, yapılacak proje ile elde edilecek sonuçların ve proje akış sürecinin nasıl ilerleyeceğini ve bu süreç sonunda nasıl bir çıktı beklendiğinin saptanmasıdır.

Veri Hazırlama: Veri hazırlama süreci totalde 3 basamaktan oluşuyor diyebiliriz. İlk aşama olarak amaçlanan analiz türüne uygun veri setinin tercih edilip hazırlanması, hazırlanan bu veri setinin makine öğrenmesi kapsamında kullanılacak modelin yapısına uygun bir şekilde ön işlemeden geçirilmesi ve son olarak yine model yapısının başarılı sonuçlar verdiği formatta veri setinin normalleştirme mantığında dönüştürülmesidir.

Veri Modeli Oluşturma: Veri bilimi kapsamında kullanılan bir çok makine ve derin öğrenme modellerinin olduğunu görmekteyiz. Ancak bunların hangileri bizim veri setimizle uyumludur bilgisi ise hayati önem taşımakta. Çünkü veri seti yapısına uygun çeşitli makine ve derin öğrenmesi modelleri seçerek veriden elde etmek istediğimiz faydayı maksimize ederiz.

Modeli Değerlendirme: Geliştirilen yapay zeka modelinin iş sürecinde karar destek sistemi olarak referans alınabilir bir model olup olmadığını teyit edip, yüksek bir doğruluk yüzdesi sonucunu veren modeller tercih edilmektedir. Model değerlendirmesi, model performansını yeni verilere göre ölçmek için genellikle kapsamlı bir değerlendirme metrikleri ve görselleştirme seti tarafından oluşturulur. Ayrıca üretimde optimum davranışı sağlamak için bunları zaman içinde sıralayıp gerçeklikle yakınlığı test edilir. Model değerlendirmesi, beklenen temel davranışı hesaba katmak için ham performansın ötesine geçen bir süreçtir şeklinde tanımlayabiliriz.

Model Açıklaması: Makine öğrenimi modellerinin ürettiği sonuçların iç mekaniklerini yani teorik olarak yorumlanabilir yapılarını ortaya koyarak, makine öğrenmesinin ne türden ve düzeyde bir yapısından nasıl bir sonucun ortaya konulup değerlendirilmesi durumudur model açıklaması.

Yapay Zeka Modeli Konuşlandırma: Eğitilmiş bir makine öğrenimi modelini alıp doğru sistemlere yerleştirip otomasyonel olarak fayda türetmek veri bilimi sürecinin amacıdır. Bu, modelleri ölçeklenebilir ve güvenli API’ler olarak çalıştırarak veya veritabanı içi makine öğrenimi modelleri kullanarak daha kolay hâle getirilerek otomasyonel bir hal alması amaçlanmaktadır model konuşlandırma ile.

Model Takibi: Ne yazık ki, bir modeli web sistemine entegre etmek, işin tamamlandığı anlamına gelmiyor. Düzgün çalıştıklarından emin olmak için, modellerin konuşlandırmadan sonra sürekli izlenmeleri gerekir. Modelin eğitiminde kullanılan veriler, belirli bir süre sonra gelecekteki tahminler için geçerli olmayabilir. Örneğin, dolandırıcılık tespiti alanında suçlular hesapları ele geçirmek için her zaman yeni yollar buluyor. Böylelikle model başarısı sürekli takip edilerek nasıl çıktılar verdiği sürekli bir değerlendirmeye tabii tutulmalıdır.

Veri Bilimi Bağlamında İş Analitiği

Yapay Zeka, Bulut Bilgi İşleme, Süper bilgisayarlar, IOT, Büyük Veri derken hızlı bir şekilde teknolojik gelişmeyle ortaya çıkan bir veri dünyasında bulduk kendimizi. Neredeyse her gün, her hafta, yeni bir teknolojik gelişme ve haber bombardımanı altında kalıyoruz. Diğer bir yandan da bu kadar veri bolluğu içinde karşımıza verileri kullanarak çözüm üretme ve analitik kararlar alma gibi de problemler çıktı. Bu problemler de karşımıza İş Analitiği gibi yeni bir disiplini ortaya çıkardı. Gelin hep birlikte şu İş Analitiği kavramına bir yakından bakalım.

İş analitiği (business analytics), işletmelerin doğru bilgiler ve hızlı karar verme yeteneği elde etmesini sağlayacak şekilde mevcut verilerin analiz edilip raporlanmasını sağlar. Bu veriler hem müşteri davranışlarını ve taleplerini anlamak hem de işletmenin performansını değerlendirmek açısından önem arz etmektedir.

Birçok disiplinden faydalanan iş analitiği, veriyi bilgi haline getirmenin sanatı ve bilimidir denilebilir. İş analitiği, bilginin nasıl bir araya getirildiğini ve iş kararlarının nasıl verildiğini doğrudan etkilemektedir. İş analitiği, iş planlamasının etrafında şekillenmektedir. Dolayısıyla, iş planını oluşturmak için gereken eğitim, teknoloji, yeterlilikler ya da her çeşit uygulama iş analitiğinin bir parçasıdır. Günümüzde iş analitiği başta bankacılık sektörü olmak üzere, oyun sektörü, perakende sektörü gibi birçok sektör ve sosyal ağlar tarafından kullanılmaktadır.

Özellikle büyük veri (İng. big data) çalışmaları ile hem donanım kaynakları açısından çok daha fazla imkanın bulunması hem de çok büyük verilerin işlenmesi için toplanıyor olması gibi sebeplerle özellikle veri bilimi (İng. data science) gibi çalışmalar, iş analitiği çalışmalarını da ivmelendirmiş ve iş analitiği artık çoğu işletmenin ayrılmaz bir parçası haline gelmiştir.

Peki bu kapsamda İş analitiği bize ne gibi faydalar sağlayacak gelin birlikte bakalım..

İş analitiği çözümleri ile;

Kurumsal stratejileri geliştirmek,

İşletme faaliyetleri için hedef ve performans ölçütleri belirlemek,

İşletme tarafından kullanılan teknoloji ve süreçleri aktif ve etkin tutmak,

Rakip işletmelere karşı rekabet üstünlüğü sağlamak,

Kritik anlarda ihtiyaç duyulan bilgiyi anlık sunarak karar alma mekanizmalarını güçlendirmek,

Müşteri davranış ve talepleri doğrultusunda uygulamalar yapmak (ürün fiyatlandırma, arz sunma vs.),

Satın alma, lojistik ve tedarik süreçlerini optimize ederek maliyetleri azaltmak mümkündür.

Durum böyle iken ilerleyen proje ve yayınlarımda veri bilimi ile böylesine iç içe geçmiş olan iş analitiği konularını veri bilimi ve veri analitiği araçları ile ayrıca sizlere anlatmaya ve verimli bir şekilde kodlarıyla birlikte aktarmaya çalışacağım. Sıkı takipte kalın.. Geliyor gelmekte olan 😊

Bir sonraki bölüme Veri Bilimi İçin Python Seri 1 linkinden ulaşabilirsiniz.

--

--