Derin Öğrenme için Veri Hazırlama

Ahmet Okan YILMAZ
2 min readJul 15, 2023

--

Derin öğrenme modelleri, karmaşık problemleri çözmek için büyük miktarda veriye ihtiyaç duyarlar. Bu nedenle, veri hazırlama süreci, derin öğrenme modelinin başarısı için önemli bir adımdır. Bu makalede, derin öğrenme için veri hazırlama sürecini ayrıntılı bir şekilde ele alacağız ve bu süreci uygulamak için Tensorflow kütüphanesini kullanacağız.

Veri Toplama ve Ön İşleme

Derin öğrenme modelleri, genellikle büyük miktarda etiketlenmiş veri gerektirir. Bu veriyi toplamak ve uygun şekilde işlemek, veri hazırlama sürecinin temel adımlarıdır.

Veri Toplama

Veri toplama süreci, derin öğrenme modeli için temsilci ve genelleyici veri kümesini oluşturmayı amaçlar. Temsilci veri kümesi, modelin üzerinde çalışacağı veri örneklerini içerir ve genelleyici veri kümesi, modelin genellemesini iyileştirmek için farklı örnekler ve sınıfları içerir.

Örneğin, bir görüntü sınıflandırma modeli için, farklı kategorilerden çok sayıda görüntü içeren bir veri kümesi oluşturabiliriz. Bu veri kümesi, farklı nesneleri, sahneleri ve diğer görüntü türlerini içermelidir. Veri toplama süreci, bu tür bir veri kümesinin oluşturulması için kaynakları ve yöntemleri içerir.

Veri Ön İşleme

Veri ön işleme, toplanan verinin düzenlenmesi ve temizlenmesiyle ilgilenir. Bu adımda, veriye uygulanacak işlemler, veri setinin özelliklerine ve kullanılacak derin öğrenme modelinin gereksinimlerine bağlı olarak belirlenir.

Örneğin, görüntü verisi üzerinde çalışırken, görüntüleri aynı boyuta yeniden boyutlandırma ve normalleştirme yaygın işlemlerdir. Bu, görüntülerin piksel değerlerinin belirli bir aralığa getirilmesini ve modelin daha iyi öğrenmesini sağlar.

Tensorflow gibi derin öğrenme kütüphaneleri, veri ön işleme işlemlerini gerçekleştirmek için çeşitli fonksiyonlar ve araçlar sağlar. Örneğin, bir görüntüyü yeniden boyutlandırma ve normalleştirme işlemlerini içeren basit bir örnek kod şu şekildedir:

Yukarıdaki örnek kodda, preprocess_image adlı bir fonksiyon tanımlanmıştır. Bu fonksiyon, bir görüntüyü alır, boyutunu 224x224 piksel olarak yeniden boyutlandırır ve piksel değerlerini 0-1 aralığına normalleştirir.

Veri Bölütleme

Derin öğrenme modellerini eğitmek için veri kümesini genellikle eğitim, doğrulama ve test bölümlerine ayırırız. Eğitim bölümü, modelin öğrenme sürecinde kullanılacak olan veriyi içerir. Doğrulama bölümü, modelin eğitim sırasında performansını değerlendirmek için kullanılır ve hiperparametre ayarlaması için yardımcı olur. Test bölümü ise eğitilmiş modelin gerçek dünya performansını değerlendirmek için ayrılan veridir.

Scikit-learn, veri kümesini bölütleme işlemlerini gerçekleştirmek için çeşitli fonksiyonlar sağlar. Aşağıda, bir veri kümesini eğitim, doğrulama ve test bölümlerine ayıran basit bir örnek kod verilmiştir:

Yukarıdaki örnek kodda, train_test_split fonksiyonu, veri kümesini belirtilen oranlara göre eğitim, doğrulama ve test bölümlerine ayırır. Bölütlenmiş veriler ve etiketler ayrı değişkenlere atanır.

Bu makalede, derin öğrenme için veri hazırlama sürecinin önemli adımlarını ele aldık. Veri toplama, veri ön işleme, veri bölütleme ve veri artırma gibi adımların doğru bir şekilde gerçekleştirilmesi, derin öğrenme modellerinin daha iyi performans göstermesine yardımcı olabilir. Tensorflow kütüphanesi, bu adımları uygulamak için kullanabileceğiniz çeşitli fonksiyonlar ve araçlar sunar.

Sonraki yazıda Veri Artırma adımını ele alacağız.

--

--

Ahmet Okan YILMAZ
Ahmet Okan YILMAZ

Written by Ahmet Okan YILMAZ

Industrial Engineer | Data Scientist | Factory Manager

No responses yet