Review Paper Interaksi Manusia Komputer

“Without the Clutter of Unimportant Words”: Descriptive Keyphrases for Text Visualization

JASON CHUANG, CHRISTOPHER D. MANNING, and JEFFREY HEER, Stanford University

Abstract

Keyphrases aid the exploration of text collections by communicating salient aspects of documents and are often used to create effective visualizations of text. While prior work in HCI and visualization has proposed a variety of ways of presenting keyphrases, less attention has been paid to selecting the best descriptive terms. In this article, we investigate the statistical and linguistic properties of keyphrases chosen by human judges and determine which features are most predictive of high-quality descriptive phrases. Based on 5,611 responses from 69 graduate students describing a corpus of dissertation abstracts, we analyze characteristics of human-generated keyphrases, including phrase length, commonness, position, and part of speech. Next, we systematically assess the contribution of each feature within statistical models of keyphrase quality. We then introduce a method for grouping similar terms and varying the specificity of displayed phrases so that applications can select phrases dynamically based on the available screen space and current context of interaction. Precision-recall measures find that our technique generates keyphrases that match those selected by human judges. Crowdsourced ratings of tag cloud visualizations rank our approach above other automatic techniques. Finally, we discuss the role of HCI methods in developing new algorithmic techniques suitable for user-facing applications.

Pengkaji: Khaidir Afif (G64120068)


Dalam kumpulan dokumen, frasa kunci membantu proses eksplorasi dengan menyediakan ringkasan informasi. Frasa kunci memberikan aspek penting dari satu atau lebih dokumen. Algoritma ekstraksi kunci bekerja dengan cara memilih frasa-frasa deskriptif dari teks. Pada penelitian tersebut, investigasi dilakukan berdasarkan pada Reference Corpora, Document Diversity, Feature Complexity, dan Term Similarity and Specificity. Sedangkan faktor bebas yang digunakan pada studi pengguna diantaranya Familiarity, Document Count, dan Topic Diversity.
Penelitian tersebut menggunakan lima sampai enam belas frasa kunci yang diuji pada tiga jenis dokumen, yaitu dokumen tunggal, dokumen ganda, dan dokumen campuran. Dari hasil penelitian tersebut diperoleh bahwa pengguna lebih sering menggunakan jumlah frasa kunci yang lebih sedikit untuk dokumen-dokumen tersebut. Selain itu, frasa bigram (frasa dengan panjang dua kata) lebih banyak digunakan dibandingkan dengan frasa-frasa dengan panjang lainnya. Pengguna juga cenderung lebih sering  memilih frasa kunci dari frasa yang terdapat pada dokumen.
Dalam pemilihan frasa kunci sangat mungkin terjadi redundansi. Cara mengatasinya adalah dengan mengelompokkan frasa-frasa yang memiliki konsep yang sama. Dengan pengelompokkan tersebut, redundansi dapat dikurangi. Pengurangan terhadap redundansi tersebut sangatlah penting, karena dapat mempengaruhi efisiensi dari frasa kunci yang dibangkitkan. Untuk memudahkan pemberian parameter frasa kunci, pengguna dapat memilih panjang/pendek frasa atau berdasarkan keterangan umum/spesifik. Penyesuaian lainnya dapat dispesifikasikan oleh pengguna. Misalnya, untuk mengenali orang, pengguna bisa memperluas nama menjadi nama lengkap. Sedangkan untuk lokasi dan organisasi, pengguna bisa memilih untuk menggunakan bentuk singkat ataupun bentuk lengkap.
Penelitian ini juga dibandingkan dengan visualisasi tag cloud. Ada dua alasan menggunakan visualisasi tag cloud. Pertama, tag cloud sering ditampilkan sebagai bagian dalam laman web atau visualisasi teks. Kedua, frasa kunci sering ditampilkan dalam agregat. Tag cloud menyediakan fitur visual seperti tata letak, sizing, term proximity dan estetika lainnya sebagai rujukan untuk frasa kunci dalam aplikasi dunia nyata. Penentuan kualitasnya didasarkan pada evaluasi terhadap keputusan orang untuk menilai kualitas relatif dari visualisasi tag cloud  dengan istilah yang terpilih dari teknik yang dikembangkan dan dari nilai unigram G2.
Secara rata-rata, para pemberi nilai lebih cenderung memilih tag cloud yang dibangkitkan dari metode ekstraksi penelitian ini. Sebanyak 49% pengguna memberi nilai ‘MUCH better’, jauh lebih tinggi dibandingkan hasil G2 yang memperoleh 38% suara pengguna. Hasil observasi ini menunjukkan bahwa aplikasi metode pemodelannya kepada frasa kunci yang dipilih orang menghasilkan pemilihan yang lebih baik.
Dari kesimpulan penelitian tersebut diperoleh Guidelines dalam membuat visualisasi teks dan memilih fitur model, diantaranya

  • Frasa Multikata, hasil penelitian menunjukkan bahwa frasa multi kata (khususnya bigram) menyediakan deskripsi yang lebih baik dibandingkan dengan frasa unigram.
  • Pemilihan Statistik Frekuensi, penggunaan statistik frekuensi dengan performa lebih tinggi sangat dianjurkan saat mengidentifikasi frasa kunci deskriptif.
  • Tata Bahasa dan Posisi, berdasarkan hasil penelitian, kualitas dari frasa kunci dapat ditingkatkan dengan menambahkan penjelasan tata bahasa dan informasi.
  • Pemilihan Frasa Kunci, hasil penelitian menunjukkan visualisasi teks membuat penggunaan ruang layar lebih baik dengan mengidentifikasi istilah-istilah terkait dan mengurangi redundansi.
  • Efek Potensial dari Tata Letak dan Akurasi Kolektif, dari hasil pembandingan dengan tag cloud menunjukkan bahwa pilihan tata letak dan akurasi kolektif mempengaruhi penilaian pengguna terhadap kualitas frasa kunci.


Aesthetic and Minimalist Design - Komutta

Aesthetic and Minimalist Design - Sebuah aplikasi seharusnya tidak menampilkan informasi yang tidak relevan atau jarang dibutuhkan. Selain itu, rancangan aplikasi juga harus mengikuti ketentuan-ketentuan yang dapat membantu user lebih mudah memahami isi aplikasi. Pada aplikasi Komutta, terdapat beberapa masalah yang berkaitan dengan Aesthetic and Minimalist Design.

Ringkasan Masalah

Tampilan CCTV belum berfungsi.

Deskripsi Masalah

Ketika memilih rute TransJakarta, terdapat opsi CCTV. Namun, ketika user memilih opsi tersebut, terlihat tampilannya masih tidak sesuai dengan ekspektasi. Yang muncul hanyalah listview dengan gambar bertuliskan 8A, dengan judul 'Name' dan subjudul 'info'.

Gambar 1. Tampilan opsi CCTV pada menu TransJakarta

Rekomendasi Perbaikan

Apabila fungsinya masih belum berjalan dengan baik, sebaiknya informasi CCTV tidak perlu ditampilkan terlebih dahulu.

Severity Rating: 2


Ringkasan Masalah

Pada halaman In-App Purchase, terdapat informasi yang tidak terlalu dibutuhkan oleh pengguna.

Deskripsi Masalah

Aplikasi Komutta tergolong aplikasi Freemium, yaitu user bisa menginstall aplikasi secara gratis namun untuk mendapatkan fitur yang lebih user harus meng-upgrade aplikasi menjadi premium. Informasi yang ditampilkan ketika user akan membuka halaman In-App Purchase terlalu banyak dan kurang penekanan pada fitur yang diberikan.

Gambar 2. Informasi pada halaman In-App Purchase

Rekomendasi Perbaikan

Pada halaman tersebut seharusnya hanya menampilkan informasi-informasi yang dibutuhkan user, seperti fitur yang akan didapatkan ketika meng-upgrade aplikasi menjadi premium.

Severity Rating: 2

Flexibility and Efficiency of Use - Komutta

Flexibility and Efficiency of Use - Sebuah aplikasi harus bisa digunakan oleh user yang berpengalaman maupun yang belum berpengalaman. Oleh karena itu, sebuah aplikasi harus mengefisienkan setiap fungsi yang berkaitan dengan interaksi user. Pada komutta ditemukan beberapa fungsi yang tidak efisien.

Ringkasan Masalah

Fungsi zoom tidak efisien, karena membutuhkan beberapa action.

Deskripsi Masalah

Untuk melakukan zoom, pada umumnya akan lebih efisien apabila menggunakan dua jari seperti zoom pada umumnya. Akan tetapi, pada aplikasi Komutta, untuk melakukan zoom user harus meletakkan jari di atas gambar lalu geser ke atas atau ke bawah.

Gambar 1. Fungsi zoom pada untuk aplikasi Komutta

Rekomendasi Perbaikan

Fungsi zoom sebaiknya diganti menjadi zoom pada umumnya, yaitu menggunakan dua jari. Karena user akan lebih terbiasa dengan zoom yang menggunakan dua jari.

Severity Rating: 3


Ringkasan Masalah

Pada pemilihan angkutan umum hanya salah satu input yang berfungsi

Deskripsi Masalah

Ketika akan memilih angkutan umum, user dihadapkan pada dua input, yaitu nomor angkutan dan lokasi. Namun, sebenarnya user hanya perlu mengisi salah satu dari dua input tersebut.

Gambar 2. Pemilihan bus berdasarkan nomor

Gambar 3. Contoh pemilihan bus berdasarkan lokasi

Rekomendasi Perbaikan

Sebelum melakuan pencarian, sebaiknya user diberikan opsi pencarian. Opsi pencarian bisa berdasarkan nomor atau berdasarkan lokasi.

Severity Rating: 2

Consistency and Standards - Komutta

Consistency and Standards - Sebuah aplikasi seharusnya menerapkan prinsip Consistency and Standards. Hal ini diperlukan agar user tidak bingung dalam menggunakan aplikasi. Selain itu, dengan adanya Consistency and Standards, user tidak perlu khawatir akan adanya perbedaan aksi untuk setiap tampilan yang sama. Beberapa masalah Consistency and Standards ditemukan pada aplikasi Komutta.

Ringkasan Masalah

Terdapat beberapa halaman yang menampilkan bahasa yang tidak konsisten.

Deskripsi Masalah

Pada pengaturan aplikasi, user diizinkan untuk mengganti bahasa yang digunakan pada aplikasi. Bahasa yang disediakan pada aplikasi ini ada dua, yaitu Indonesia dan Inggris. Namun, ketika Bahasa Indonesia dipilih menjadi bahasa yang digunakan, belum sepenuhnya terganti ke dalam Bahasa Indonesia.

Gambar 1. Inkonsistensi bahasa pada hasil pemilihan jadwal kereta
Gambar 2. Inkonsistensi bahasa pada pemilihan jadwal untuk pemilihan jam keberangkatan

Rekomendasi Perbaikan

Sebaiknya Bahasa Inggris yang ada pada halaman tersebut diubah ke dalam Bahasa Indonesia.

Severity Rating: 2



Ringkasan Masalah

Adanya listview yang tidak konsisten pada beberapa halaman.

Deskripsi Masalah

Pada beberapa listview ditambahkan tanda '>>' dan sebagian lagi tidak. Hal ini dapat menimbulkan persepsi yang berbeda bagi user. Padahal aksi yang dapat dilakukan sama saja.

Gambar 3. Listview yang menggunakan tanda '>>'

Gambar 4. Listview yang tidak menggunakan tanda '>>'

Rekomendasi Perbaikan

Perbaikan bisa disesuaikan dengan style guide yang dimiliki aplikasi Komutta. Apabila listview yang dikehendaki tidak menggunakan tanda '>>', maka untuk keseluruhan listview tidak ditambahkan tanda '>>'.

Severity Rating: 1

Match Between System and the Real World - Komutta

Match Between System and the Real World - Sebuah sistem seharusnya menerapkan fungsi dan objek-objek yang familiar dengan pengguna. Oleh karena itu, sebuah sistem haruslah mengikuti konvensi dunia nyata. Pada aplikasi Komutta, ditemukan beberapa objek dan fungsi yang masih belum mengikuti fungsi yang sesuai dengan konvensi dunia nyata atau berbeda dari pengalaman user.

Ringkasan Masalah

Aplikasi Komutta menggunakan icon yang kurang relevan.

Deskripsi Masalah

Pada aplikasi ini, user dapat menyimpan hasil pencarian sebagai favorite. Komutta menggunakan icon yang kurang relevan untuk merepresentasikan fungsi favorite, yaitu icon hati.

Gambar 1. Icon hati yang merepresentasikan fungsi favorite

Rekomendasi Perbaikan 

Untuk merepresentasikan fungsi favorite, bisa menggunakan icon bintang yang umum digunakan dan familiar bagi user.

Severity Rating: 1


Ringkasan Masalah

Icon left arrow yang memberikan tautan ke halaman awal.

Deskripsi Masalah

Icon left arrow biasanya digunakan untuk fungsi back atau kembali ke parent activity-nya. Pada aplikasi Komutta, icon left arrow tersebut berfungsi untuk kembali ke halaman awal. User belum tentu terbiasa dengan hal tersebut. Ekspetasi user terhadap icon left arrow biasanya merujuk ke halaman sebelumnya.

Gambar 2. Icon left arrow pada pencarian jadwal kereta aplikasi Komutta

Rekomendasi Perbaikan

Sebaiknya fungsi icon left arrow tersebut diganti menjadi fungsi back atau kembali ke halaman sebelumnya.

Severity Rating: 2