Artikel

Teks Al Quran dalam Machine Learning

Written by Fadhilah Zein

Memahami teks-teks Al Quran bisa dilakukan dengan pendekatan Machine Learning. Tiga ilmuwan Muslim dari Salman bin Abdul Aziz University melakukan penelitian teks Al Quran dengan metode penggalian teks (text mining) dan penarikan data (crawling). Mereka adalah Mohammad Alharawat, Mohamed Hegazi dan Anwer Hilal yang telah mempublikasikan hasil penelitiannya dalam International Journal of Advanced Computer Science and Aplications.

Menurut Han dan Kamber (2000), data atau text mining berarti mengekstrak atau menambang pengetahuan dari sejumlah besar data. Di dalamnya ada proses menemukan pengetahuan yang menarik dari sejumlah besar data yang disimpan dalam database, warehouse atau tempat penyimpanan informasi lainnya. Al Quran adalah penyimpanan terbaik atas sejumlah data dan informasi yang usianya telah mencapai 14 abad. Dan, di era disruptif saat ini, tidak ada server sebaik Al Quran.

Text mining dilakukan dengan word cloud yang menjadi salah satu metode untuk menampilkan data teks secara visual. Word cloud juga biasa digunakan untuk menampilkan teks-teks yang sering muncul (frequently words) di media sosial untuk kemudian dikonversikan menjadi data obyek visual secara presisi. Di Indonesia, metode ini biasa digunakan untuk mengukur “keriuhan” topik di twitter, dan di tahun politik cara-cara ini laku dijual.

Dengan menggunakan word cloud, frekuensi kata dapat ditampilkan dalam bentuk yang menarik namun tetap informatif. Semakin sering satu kata digunakan, maka semakin besar pula ukuran kata tersebut ditampilkan dalam word cloud.  Metode ini dipopulerkan Ian Fellows yang menulis word cloud dengan aplikasi R, aplikasi statistik yang mengubah teks menjadi data kuantitatif.

Alharawat dkk menggunakan word cloud untuk menggali teks-teks dalam Al Quran, baik dari sisi pengulangan kata maupun bobot kata. Teks-teks Al Quran secara digital diteliti dari aplikasi open source Quranic Corpus. Setelah data berhasil dikumpulkan kemudian diolah secara statistik untuk menghitung bobot setiap kata yang paling umum digunakan pada pengambilan informasi dari teks. Pengolahan statistik ini menggunakan metode penghitungan algoritma TF (Term Frequency) dan IDF (Inverse Document Frequency).

Yang menarik, penelitian penggalian dan penarikan data dan teks ini sepenuhnya menggunakan kecerdasan buatan. Aplikasi R menghitung kata dalam Al Quran yang memang menggunakan teks-teks Arab. Alharawat mengakui adanya masalah dalam menggali teks-teks Al Quran yang berbahasa Arab. R kesulitan dalam memahami bahasa Arab namun untuk mengatasi masalah itu, Alhawarat dkk mengonversi teks Arab ke CP1256 agar dikenali oleh R.

Kecerdasan buatan atau Artificial Intelligence (AI) mampu mengenali satu kata meski berbarengan dengan imbuhan lain. Mesin juga memilah prefix dan sufix (seperti huruf jar dan majrur) dan menggolongkannya menjadi satu teks, misalnya  kata “Allah”. AI akan mengenali “Allah” di dalam Al Quran meski dia berbarengan dengan huruf tambahan lain, seperti billahi, wallahi, fallahu, falillahi, allhumma dan lillahi. Begitu pula dengan kata “Rabb”, AI akan mengenalinya meski diimbuhi dengan kata ganti orang atau benda (isim dhomir) menjadi robbuna, robbuhum, robbukum, robbuhu, warabbu dan robbi.

Hasil penelitian menunjukkan setidaknya ada lima kata paling banyak muncul di dalam Al Quran. Kelima kata tersebut adalah Allah (mendekati 5.000 kali), Rabb (mendekati 1.200 kali), al Ardhu (mendekati 500 kali), Amanuu (mendekati 500 kali) dan Kafaruu (kurang dari 500 kali).

 Computer Science dan Religion Science

 Semakin berkembangnya teknologi digital tentunya akan berpengaruh pada disiplin ilmu lainnya, salah satunya adalah ilmu agama. Dari hasil penelitian di atas menunjukkan pengaruh computer science dalam teks Al Quran. Ulama terdahulu memang sudah melakukan klasifikasi dan indeks teks Al Quran secara manual, namun dengan algoritma dan machine learning, proses tersebut akan semakin mudah dan cepat.

Dengan machine learning, umat bisa mempelajari isi kandungan Al Quran yang memiliki ketersinggungan antar teks di dalamnya. Ketersinggungan itu didapat melalui processing data yang dilakukan dengan menggunakan algoritma untuk menentukan topik dalam suatu terjemahan ayat.

Text mining terhadap Al Quran menjadi akvititas menambang pengetahuan dari sejumlah besar data yang ada dalam kitab suci tersebut. Umat dapat mendapatkan pengetahuan yang menarik sesuai dengan perkembangan teknologi digital.

Prosedur yang umum digunakan dalam text mining meliputi tahap-tahap berikut; menentukan permasalahan dan merumuskan hipotesis, mengumpulkan data, memperkirakan dan menafsirkan model serta menarik kesimpulan.

Dalam Computer Science, penggalian data berkaitan dengan prediksi yang menghasilkan model dan dapat digunakan untuk klasifikasi, prediksi atau estimasi. Tujuan data mining yang berkaitan dengan deksripsi adalah memperoleh pemahaman sistem yang dianalisa dengan mengungkap pola dan hubungan dalam kumpulan data yang besar. Teks-teks dalam Al Quran adalah big data yang di dalamnya memuat informasi dan misteri yang lebih dikenal dalam bahasa agama sebagai Hudan (petunjuk).

Penggalian data dalam Ilmu Al Quran dengan pendekatan computer science menjadi tantangan umat di abad 21. Ilmuwan muslim bisa melakukan klasifikasi atau kategorisasi teks menjadi proses penempatan suatu dokumen teks ke dalam kategori atau kelas sesuai dengan karakteristik yang ada dalam Al Quran.

Apakah akan mengubah urut-urutan Al Quran yang sudah ditentukan ulama-ulama terdahulu? Tentu tidak demikian. Text mining hanya sarana untuk lebih mengetahui kandungan dalam kitab suci tersebut yang mungkin saja luput dilakukan para ulama terdahulu. Tentunya ini tantangan ulama-ulama kontemporer untuk lebih menggali data, informasi dan misteri yang dikandung dalam Al Quran.

Kategorisasi teks Al Quran menjadi proses yang secara otomatis melakukan pengurutan terhadap sekumpulan dokumen ke dalam suatu kategori atau kelas. Klasifikasi teks biasa dari dari tiga komponen yaitu processing data, classifier construction dan document categorization. Singkat katanya, Al Quran dipahami dengan pendekatan machine learning, algoritma dan kecerdasan buatan. Tidak ada yang perlu diubah dari keutuhan dan kesucian Al Quran itu sendiri yang telah diimani secara qath’i mayoritas muslim dunia. (*)

Mohamad Fadhilah Zein

Anggota Komisi Infokom MUI

About the author

Fadhilah Zein

Leave a Comment