Veri Madenciliği (Bahar-23)
ENM424
Kodu: “ENM424” Google Class: orlap6f
Ders notları: kitap
Amaç
Veri Madenciliği veri tabanlarından bilgi keşfi süreci olarak tanımlanır. Veri madenciliği teknikleri sayesinde büyük veri tabanlarından gizli olan anlamlı bilgiler çıkarılır. Bu ders veri madenciliğinin istatiksel, makine öğrenmesi ve veri tabanı yönünden temellerini içermektedir. Derste veri madenciliğinin temel kavramları gösterildikten sonra veri hazırlama, sınıflandırma, kümeleme, birliktelik analizleri gibi veri madenciliği uygulamaları anlatılacaktır. Ayrıca derste veri madenciliğinde veriden anlamlı bilgi keşfedilme sürecinden bahsedilecek ve veri madenciliğinde kullanılan istatistiksel metotlara yer verilecektir. Günümüzün trend konuları olan makine öğrenmesi ve yapay sinir ağları ile ilgili bilgiler de ders kapsamında anlatılacaktır.
- Veri madenciliğinin temel kavramlarını, amaçlarını ve tekniklerini tanıtmak ve kullanımını yaygınlaştırılması
- Geniş ölçekli veri tabanlarında analiz yeteneğinin kazandırılması
- Veri madenciliği uygulamaları ve popüler konuları hakkında bilgi ve yeterlilik kazandırılması
- Veri madenciliği uygulamaları geliştirmeye yönelik yeterlilik kazandırılması
- Veriyi anlama, yorumlama, analiz etme ve görselleştirme gibi yeteneklerin kazandırılması
Ana Kitap
- Tan, Pang, et al., Introduction to Data Mining, Pearson, 2018, link.
Yardımcı Kaynaklar
- Han, Jiawei, et al., Data Mining: Concepts and Techniques, Morgan Kaufmann link.
- Kantardzic, Mehmed, Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-IEEE Press, 2019 link.
- Leskovec, Jure, et al., Mining of Massive Datasets, Cambridge Uni Press, 2014 link.
- Sumathi, S., Introduction to Data Mining and Its Applications, Springer, 2006 link.
- Laura Igual et al., Introduction to Data Science, Springer, 2017 link.
Program
Derste öğrenilen algoritma ve teknikler Python programlama dili ile geliştirilecek kodlar sayesinde uygulanacaktır. Python programlama dilinde özellikle, Numpy, scikit-learn, Scipy, pandas, matplotlib gibi kütüphanelerin bilinmesi önerilir. Python ile geliştirilen kodlar ile birlikte Orange aracı da kullanılarak veri madenciliği teknikleri uygulanacaktır. Bu dersi programlama bilgisi olmayanların tercih etmesi önerilmemektedir.
Bağlantılar
Bu dersin diğer üniversitelerdeki bağlantıları;
- Arizona State University, USA
- Australian National University, Australia
- Bilkent University, Turkey
- Carnegie Mellon University, USA
- Central Connecticut State University, USA
- Central Washington University, USA
- Depaul University, USA
- Georgia Institute of Technology, USA
- Hong Kong University of Science and Technology, China
- Indian Institute of Technology Bombay, Indian
- Massachusetts Institute of Technology, USA
- McMaster University, Canada
Yayınlar
Veri madenciliği ile alakalı takip edilmesi gereken bazı yayınlar aşağıda listelenmiştir.
- Veri Madenciliği Dergileri
- Makine Öğrenmesi Dergileri
- Machine Learning,
- Transactions on Pattern Analysis and Machine Intelligence
- Transactions on Neural Networks and Learning Systems]
- Neurocomputing
- Transactions on Knowledge and Data Engineering
- Expert Systems with Applications
- Knowledge-Based Systems
- Journal of Machine Learning Research
- Neural Computing and Applications
- Transactions on Evolutionary Computation
- Neural Networks
- Transactions on Intelligent Systems and Technology
- Swarm and Evolutionary Computation
- Engineering Applications of Artificial Intelligence
- Veri Madenciliği Konferansları
- Makine Öğrenmesi Konferansları