Veri Azaltma İçin Diğer Teknikler – Doktora Tezi – Tez Nasıl Yazılır?– Doktora – Ödevcim – Essay – Ödev – Tez – Makale – Çeviri – Tez Yazdırma -Tez Yazdırma Fiyatları
Veri Azaltma İçin Diğer Teknikler
Verileri iyi sunmak için onları gerçekten anlamalısınız. Ve bunu yapmak için, onlara uzun süre dikkatlice bakmalı ve ne gösterdiklerine dair bir dizi iyi düşünülmüş soru sormalısın. Yine de modern PC’ler ve yazılımlar, hepimize, belki de tam olarak analiz ettiğimizden çok daha fazla rakamı hesaplama ve sonra bunları okuyucularımıza sindirilmemiş bir şekilde uygulama yeteneği de veriyor.
Veri azaltma, üzerinde çalıştığımız sayıları basitleştirmek anlamına gelir. Keşifsel veri analizi alanı, bunu yapmak için birçok güçlü teknik sunar ve burada sadece kısaca değineceğim ilginç bir literatüre sahiptir.7 Verileri uygun şekilde araştırmak ve azaltmak, herhangi bir sayı kümesini anlamada ilerleme kaydetmek için temel bir ilkedir. bu bilgiyi okuyuculara doğru bir şekilde iletmek şöyle dursun analiz etmelisiniz.
Veri azaltmanın temel ilkeleri şunlardır:
◆ Birincil verilerinize dikkatlice bakın. Size neyle uğraştığınızın sezgisel bir resmini vermek veya hangi soruları sormanız gerektiğini söylemek için analiz paketlerine güvenmeyin. Analiz paketleri, yalnızca hangi veri şekline sahip olduğunuzu zaten biliyorsanız işinize yarayabilir. Bu, bir başkasının önceki analizini tekrarladığınız kurslarda yeterince kolaydır, ancak araştırmayla yeni oluşturduğunuz yepyeni bilgiler için genellikle çok zordur.
◆ Verilerinizi her zaman sayısal bir ilerlemeye yerleştirin (herhangi bir elektronik tabloda kolayca yapılabilir). Mümkün olan her yerde bunların haritasını çıkarın ve ardından sonuçlara dikkatle bakın. İşlediğiniz birincil verilerin görsel şeklini anlamadan, korelasyonlar veya regresyon analizi gibi çok değişkenli analizin daha karmaşık formlarına da asla girmeyin.
◆ Verilerinizdeki kalıpları görmeye çalışırken, mümkün olduğunca çok “dağınıklığı” ortadan kaldırın. Örneğin, kafa karıştırıcı ve gereksiz ondalık noktaları kesen veya sayıların yuvarlandığı bir sürüme bakmayı deneyin. Ve verilerinizi, verileri en kolay anlaşılabilir sayı aralıklarına, ideal olarak 0 ile 100 arasında olacak şekilde, dizin sayılarını veya oranlarını kullanarak dönüştürün. Basitleştirilmemiş sayılarla (özellikle çok büyük veya çok küçük olanlar) çalışmak sizin için daha zor hale getirecektir.
Dimensionality reduction
Boyut indirgeme
Temel Bileşenler Analizi MATLAB
Dimensionality Reduction Nedir
Temel bileşenler Analizi örnek
Keşif amaçlı veri analizi tekniklerine daha fazla çözüm bulmak için, kısaca üç yararlı yaklaşımı ele alıyorum: gövde ve yaprak analizi (merkezi düzey ve yayılma ölçümleri dahil); kutu ve bıyık grafikleri; ve zamana bağlı grafikler için veri düzeltmedir.
Kök-yaprak analizi, bir veri kümesine dikkatle bakmak için basit bir tekniktir. Yapmış olduğunuz bazı veri toplamanın belirli bir değişken için aşağıdaki 27 sayıyı oluşturduğunu varsayalım (veri kümenizde bunların rasgele ortaya çıkma sırasına göre):
Bu verileri analiz etmenin bir yolu, çubuk grafik veya sıklık sayımı olabilir. Burada bazı kategori kutuları oluşturabilir ve her birindeki vaka sayısını sayabiliriz ve şöyle bir sonuç veririz.
Bu model, geleneksel tek tepeli bir modele benziyor (yanıltıcı bir şekilde “normal” dağılım olarak adlandırılan ve “çan eğrisi” olarak popüler hale getirilen). Ancak burada orijinal verilerdeki kesin sayılarla ilgili birçok bilgiyi kaybettik ve sonuç olarak bir hile kaçırıyor olabiliriz.
Kök-yaprak analizi biraz daha ileri gider çünkü orijinal sayılarda verilen bilgilerin daha fazlasını tutar. Her sayı iki kısma bölünmüştür, büyük “gövde” kısmı ve daha küçük “yaprak” veya birim kısmı. Analiz edilen verilerin aralığına göre neyin kök olarak ayarlanacağını seçiyoruz (yukarıdan aşağıya doğru varyasyon). Burada, yukarıdaki frekans tablosunda olduğu gibi gövdeyi 10’lara eşit olarak ayarlayabiliriz.
Ancak biraz daha derinlemesine bakmak istediğimizden, bunun yerine gövdeyi beşli olarak ayarlayabiliriz, (örneğin) bir gövde 20’den 24’e ve bir başka gövde 25’den 29’a kadar uzar. 25, üstteki 20’li bir gövdeye ve 5’li bir yaprağa ayrılacaktır. Sonraki 46 numara, üstteki 40’lı bir gövdeye ve 6’lı bir yaprağa ayrılacaktır. Sonraki 52 rakamı, 50’li yılların altındaki bir gövdeye ve bir yaprağa ayrılacaktır. 2 vb. Yukarıdaki sayıların tamamı üzerinde çalışmak, aşağıdaki gibi bir gövde ve yaprak analizi verecektir.
Burada sadece tek tepeli bir eğri (tek çan eğrisi) olmadığı açıktır. Bunun yerine, 15’ten 23’e (13 veri noktası dahil) puan alan bir ana gözlem çıkıntısı ve ardından 29’dan 34’e (7 veri noktası dahil) daha küçük bir çıkıntı var. 27 gözlem olduğu için, on dördüncü gözleme ulaşana kadar yukarı veya aşağı sayarak medyanı bulabiliriz (yukarıdaki listede kalın harflerle gösterilmiştir).
Ve çeyrekleri aynı şekilde, medyanın üstündeki ve altındaki gözlemleri yarıya bölerek bulabiliriz (çeyrekler, yukarıdan veya aşağıdan giden yedinci ve sekizinci gözlemlerin ortalamalarıdır). Sap ve yapraktan, hızlı bir şekilde merkezi seviyenin özet endekslerini veren bir tablo oluşturabilir ve aşağıdaki gibi yayabiliriz.
Küçük miktarlarda veri ile gövde-yaprak teknikleri kalem ve kağıt kullanılarak kolaylıkla uygulanır. Bunları bu şekilde kullanmak için söylenecek çok şey var çünkü verilerinizle yakın temas halinde olmanızı sağlar (bu, frekans sayıları veya çizelgeler gibi diğer istatistiksel paketlerden çıktılar olabilir). Çok sayıda veri noktası elde ettiğinizde (yaklaşık 30’dan fazla), burada belirtilen tüm keşif amaçlı veri analizi tekniklerini yapmak için bir PC paketi kullanabilirsiniz: örneğin, SPSS’nin kök ve yaprak tesisleri vardır.
Kutu ve bıyık grafikleri, bir dizi gövde ve yaprak analizinin istatistiksel sonuçlarını görüntülemenin bir yoludur. Ölçeği gösteren dikey bir eksene sahip dikey bir çubuk grafik gibidirler. Fark şudur ki, Şekil 7.4’ün sağ tarafındaki çubukta gösterildiği gibi, yalnızca üst çeyrek noktalarından aşağıya doğru bir kutu çizmeniz ve medyanın konumunu göstermek için kalın bir çizgi eklemenizdir. Kalan veri noktalarını, orta kütlenin üstüne ve altına uzanarak görüntülemek için tek bir dikey çizgi (ince çizgi) ekleyin. Bir gözlem, orta kütleden ne kadar uzakta olursa, o kadar olağandışıdır.
Boyut indirgeme Dimensionality reduction Dimensionality Reduction Nedir Temel Bileşenler Analizi MATLAB Temel bileşenler Analizi örnek
Son yorumlar