Selasa, 13 Desember 2011

Principal Component Analysis

PCA, Kelebihan dan Signifikansinya
GeoGIS Forum #2 yang dilaksanakan pada tanggal 5 Desember 2011 di ruang kuliah 1 PUSPICS mengambil topic PCA (Principal Component Analisis). Ada tiga hal yang dibicarakan pada forum ini, yaitu pengertian PCA, Signifikansi PCA, dan aplikasi PCA. Ketiga hal tersebut dikupas tuntas oleh pembicara, Pramaditya Wicaksono, S.Si, M.Si. Peserta forum juga tak kalah antusias menyimak dan bertanya seluk beluk PCA.
Pada dasarnya, PCA mampu mereduksi jumlah band yang akan digunakan lebih lanjut. PCA lebih signifikan dipakai untuk citra hiperspektral daripada untuk citra multispektral. Klasifikasi pada citra multispektral menggunakan PCA tidak akan menambah informasi terlalu banyak. Sementara, jika digunakan pada citra hiperspektral yang notabene memiliki berpuluh-puluh saluran atau lebih, PCA mampu menyederhanakan informasi yang terkandung dalam beberapa saluran menjadi sekitar 3 saluran yang telah merangkum informasi lengkap sesuai tujuan masing-masing.
Penggunaan PCA juga mampu mempermudah pengambilan sampel. Jumlah training area dirumuskan sebagai (jumlah saluran + 1) pada setiap kelas. Berarti jika jumlah saluran yang dipakai adalah 220 saluran, maka diperlukan 221 sampel pada setiap kelas. Kalau dilakukan secara visual tidak masalah. Namun bagaimana jika akan mengambil sampel lapangan? Tentunya sangat bermasalah jika menggunakan sampel sebanyak itu. PCA menjawab permasalahan tersebut dengan mengkompakkan jumlah sampel. Cukup memakai 4 sampel, akurasinya bisa menyamai hasil sampel sejumlah 221.
Penggunaan PCA di Fakultas Geografi UGM pertama kali dilakukan oleh John Palapa pada tahun 2002. Citra yang digunakan adalah citra hiperspektral CASI dengan metode klasifikasi tidak terselia (unsupervised) karena tidak melihat kondisi lapangan. Jika kelas yang dipakai cukup banyak, maka akurasi yang dihasilkan juga tidak begitu tinggi. Analisis PCA sebaiknya menggunakan histogram slicing. Satu kurva pada histogram menunjukkan obyek tunggal. Dalam histogram, pada umumnya terdapat sekitar 2 atau 3 kurva mayor. Sisanya adalah kurva kecil-kecil dengan jumlah yang lebih banyak, kurva ini disebut kurva minor. PCA biasanya lebih bisa menunjukkan karakter obyek yang ditunjukkan oleh kurva minor tersebut.

PCA, Mencari Informasi Kompleks atau Mencari Kesamaan Info dari Suatu Saluran?
Hasil dari PCA berupa PC, mulai PC1, PC2, dan seterusnya. Ini semacam saluran yang ada pada citra. Masing-masing PC memiliki karakter tersendiri. PC1 mengumpulkan info yang sama dari setiap saluran asal, maka informasi yang dihasilkan lebih banyak dibandingkan PC lainnya. Dia tidak menambah kompleks, justru menggabungkan hal yang sama. PC2 juga dianggap sama, tapi memakai sumbu yang berbeda sehingga PC1 berseberangan dengan PC2, jika PC1 memiliki rona gelap maka PC2 memiliki rona terang, begitu pula sebaliknya. Sedangkan PC3 mengambil titik tengah dari keduanya. Sementara, PC4 biasanya tampak banyak noise atau gangguan karena hanya mengambil sisa-sisa informasi yang tidak digunakan pada PC sebelumnya.
Input PCA tidak harus memakai saluran atau band. Bisa juga memamakai indeks, semisal NDVI atau indeks normalisasi vegetasi. Yang penting, pengguna bisa menjelaskan mengapa dia memasukkan indeks tersebut? Penambahan 1 saluran pada PCA bisa mempengaruhi akurasi hasil.

Cara Mengambil PC yang Sesuai Untuk Klasifikasi?
Pada citra komposit terdapat istilah OIF (Optimum Indeks Factor) untuk mengetahui indeks optimum. Pada PCA, terdapat Factor Loading Analysis. Faktor ini dapat digunakan untuk mengetahui saluran mana saja yang berpengaruh terhadap PCA. Factor Loading Analysis dapat diketahui dengan perhitungan manual, biasanya menggunakan kalkulator. Belum ada perangkat lunak yang dapat digunakan untuk mengetahui Factor Loading Analysis ini.
PC1 menilai informasi yang tidak saling berhubungan antar saluran asli. Walaupun PC1 memiliki informasi sangat banyak, namun PC1 tidak pasti lebih akurat dibandingkan PC2, tergantung informasi yang dibutuhkan. PCA sangat sensitif terhadap sebaran data. PCA tidak membeda-bedakan mana darat, mana laut, mana vegetasi, sehingga jika tidak dilakukan masking pada obyek yang diperlukan, nanti informasi yang sebenarnya diperlukan malah dianggap noise. Dalam penjelasannya menggunakan ENVI, Pramaditya menunjukkan perbedaan klasifikasi menggunakan PCA ketika tidak dilakukan pemotongan atau masking terhadap obyek dan setelah dilakukan pemotongan antara obyek laut dan darat. Hasilnya ternyata sangat berbeda.

Tidak ada komentar:

Posting Komentar