"Jika sesuatu tidak seperti yang kita inginkan, jangan menyerah, tetap berusaha untuk mengubahnya" (Gene Simmons)

Kamis, 29 September 2011

Visualisasi Informasi pert 4

Ganimeda - 10410100198

Foundation for a Science of Data Visualization (2)

Tujuan dari visualisasi data adalah bagaimana dapat mengelola data dalam jumlah yang besar ini dan bagaimana sistem komputer membantu kita dalam tugas mengelola data yang besar :

• Visual Data membantu menangani banjir informasi dengan cara mengintegrasikan manusia dalam proses analisis data.

• Visual Data memungkinkan pengguna untuk mendapatkan wawasan yang dalam tentang data, kesimpulan dari data gambar dan langsung berinteraksi dengan data.

Advantages of visualization techniques

• Eksplorasi visual data dapat dengan mudah mengangani data yang sangat besar, sangat homogen dan noisy sejumlah data.

• Eksplorasi visual data tidak membutuhkan pemahaman tentang matematika yang kompleks dan logika statistik.

• Teknik visualisasi memberikan gambaran kualitatif yang berguna untuk analisis kuantitatif lebih lanjut

• Memberikan perspektif baru pada data.

• Memungkinkan viewer untuk cepat memahami "gambaran umum“.

• Dapat digunakan untuk mencari nilai yang hilang di antara beberapa titik data yang telah diketahui.

• Dapat dibuat "user friendly“

• Cepat menciptakan atau memodifikasi kumpulan data dengan memanipulasi objek grafis pada layar komputer.

• Mudah untuk menemukan kesalahan dalam inkonsistensi data dalam jumlah besar.

Jika tujuan dari visualisasi adalah mengubah data perseptual ke dalam format visual yang efisien, dan jika kita ingin membuat statement tentang data yang umum, kita harus mampu mengatakan sesuatu tentang jenis data yang dapat di visualisasikan.

Attribute quality sering digunakan untuk menggambarkan metode visualisasi data dengan dan menerangkan kualitas attribut itu sendiri

Sebuah cara yang berguna untuk mempertimbangkan kualitas data adalah taksonomi

Skala nomor ditetapkan oleh statistik SS Stevens (1946). Menurut Stevens, ada empat tingkat pengukuran : Nominal, Ordinal, Interval dan skala ratio.

• Nominal adalah Fungsi pelabelan.

Ex : buah dapat diklasifikasikan dalam jambu, jeruk dll

• Ordinal kategori meliputi nomor yang digunakan mengorder hal-hal dalam urutan.

Ex : barang tertentu datang sebelum atau sesudah barang lain datang

• Interval adalah suatu pengukuran untuk mendapatkan kesenjangan nilai antar data.

Ex : Waktu keberangkatan dan waktu kedatangan pesawat terbang

• Ratio : dengan skala rasio, kita memiliki kekuatan ekspresif penuh terhadap bilangan real.

Ex : kita bisa membuat pernyataan seperti “Objek A dua kali lebih besar dari pada objek B”.

Dalam prakteknya, hanya tiga tingkat Stevens pengukuran yang secara luas digunakan. Basis class data yang khas sering digunakan dalam visualisasi telah sangat dipengaruhi oleh tuntutan pemrograman komputer :

• Category Data

• Integer Data : This is like his ordinal class in that it is discrete and ordered.

• Real-number data : This combines the properties of interval and ratio scales.

Sebuah atribut dari suatu entitas dapat memiliki beberapa dimensi.

Kita dapat memiliki kuantitas skalar tunggal, seperti berat seseorang.

Kita dapat memiliki kuantitas vektor, seperti arah di mana orang yang bepergian.

Tensor orde yaitu jumlah yang menggambarkan kedua arah dan pergeseran kekuatan.

Data Sources

Kualitas data adalah faktor yang paling penting untuk mempengaruhi kualitas hasil dari analisis apapun.

Data harus dapat diandalkan dan mewakili dari populasi

Data sering dikumpulkan untuk menjawab pertanyaan spesifik

Sumber dari Data :

• Survey

• Eksperiment

• Observasi

Sebagai bagian dari operasi harian suatu organisasi, data merupakan kumpulan dari alasan varietas.

• Database Operasional adalah Database ini berisi transaksi bisnis yang sedang berlangsung. Database jenis ini diakses terus-menerus dan diperbarui secara teratur.

• Data Warehouse adalah Sebuah gudang data adalah salinan dari data yang dikumpulkan dari yang lain sumber dalam suatu organisasi yang telah dibersihkan, normalisasi dan dioptimalkan untuk membuat keputusan, database jenis ini diperbarui tetapi tidak sesering database operasional.

• Historical Databases

Databases are often used to house historical polls,surveys and experiments.

• Purchased data

Penggabungan dari data internal yang ada dengan data dari eksternal.

• Data Tables

• Continuous and Discrete Variables

Sebuah kategorisasi awal yang berguna untuk mendefinisikan setiap variabel yang dapat diambil dalam hal ini adalah jenis nilai, berikut ini adalah daftar istilah deskriptif untuk kategori variabel:

• Konstan: Sebuah variabel dimana setiap nilai data adalah sama.

• Dikotomis: Sebuah variabel di mana hanya ada dua nilai.

• Diskrit : variabel yang hanya dapat mengambil nilai-nilai tertentu (baik teks atau angka).

Kontinu: Sebuah variabel yang memiliki nilai numerik yang tak terbatas dalam kisaran tertentu

• Scales of Measurement

Skala variabel menunjukkan akurasi di mana data telah diukur. Klasifikasi ini memiliki implikasi untuk jenis analisis yang dapat dilakukan terhadap variabel tersebut.

• Roles in Analysis

Hal ini juga berguna untuk berpikir tentang bagaimana variabel akan digunakan dalam analisis berikutnya. Contoh peran dalam analisis data

• Label : Variabel yang menjelaskan pengamatan individu dalam data.

• Deskriptor : variabel ini hampir selalu dikumpulkan untuk mengambarkan suatu observasi

• Respon : variabel ini yang diprediksi dari model prediktif

• Distribusi Frekuensi : Distribusi frekuensi didasarkan pada jumlah nilai atau rentang nilai (dalam hal skala interval atau rasio).

Tidak ada komentar:

Posting Komentar