Herkesin Kullanabileceği Veri Setleri

Veri Bilimi çalışmaya başlayacak ya da halihazırda çalışan arkadaşlar için işte herkese açık, değişik problemleri uygulamanıza olanak veren veri setlerini bulabileceğiniz adresler:

1) UCI Machine Learning Repository

Benim açıkçası ilk veri kaynağım bu adres olmuştu. Halen kullanırım 😉 Bazı veri setlerini ezberlemiş bile olabilirim 🙂

archive.ics.uci.edu/ml/datasets.html

2) Kaggle Datasets

İkinci kaynak Kaggle Veri Setleri. Kaggle’ı düzenlediği dönemsel yarışlardan biliyoruz. Bu adreste hem geçmiş yarışmalardaki veri setleri hem de farklı alanlara ait veri setleri bulunmakta.

www.kaggle.com/datasets

3) Amazon Datasets

Biraz daha farklı tipte veri ile çalışmak isterseniz de bu adres tam size göre.

registry.opendata.aws/

4) Google’s Datasets Search Engine

Her alanda yanımızda olan sevgili Google’ımız tabi ki veri seti hizmeti de sunmakta.

toolbox.google.com/datasetsearch

5) Microsoft Datasets

Microsoft’umuz da boş durmamış yapıştırmış cevabı:

msropendata.com/

6) Awesome Public Datasets Collection

Bu adreste, dünya genelinde özellikle devlet kurumlarının yayımladığı veri setleri bir araya getirilmiş.

github.com/awesomedata/awesome-public-datasets

7) Computer Vision Datasets

Bu adresimiz de isminden anlaşılacağı üzere görselleştirme çalışacaklar için!

www.visualdata.io/