Opini
Kolonialisasi AI Terhadap Masyarakat Adat
Dalam sejarah, kolonialisasi sering dikaitkan dengan penjajahan suatu wilayah terhadap sumber daya oleh kekuatan asing.
Penulis: Yuyun Peneliti pada Pusat Riset Sains data dan Informasi, BRIN
TRIBUN-TIMUR.COM - Tulisan ini saya awali dengan pertanyaan dasar: ketika budaya masyarakat lokal tidak diakui oleh sistem digital, siapa yang bertanggung jawab?
Dalam sejarah, kolonialisasi sering dikaitkan dengan penjajahan suatu wilayah terhadap sumber daya oleh kekuatan asing.
Namun, di tengah kemajuan digital, muncul bentuk kolonilisme baru yang tak kasat mata, massif, terstruktur, yang didalamanya berisikan logika yang dipresentasikan dalam bentuk angka-angka logis, sebagaimana terimplementasi dalam model-model kecerdasan buatan (AI).
Fenomena ini mengingatkan kita pada gagasan Edward W. Said, dalam bukunya Orientalism, menunjukkan bagaimana kolonialisme hadir bukan hanya dalam bentuk penaklukan fisik, melainkan juga melalui konstruksi pemikiran.
Dalam konteks ini, kita melihat bagaimana data, algortima dan komputasi merekonstruksi bahasa dan budaya dalam ruang digital, mirip dengan bagaimana Barat mengkategorikan Timur dalam narasi kolonial.
Sebuah bentuk penjajahan terhadap linguistic dan nilai-nilai yang dianut masyarakat local yang halus yang berdampak langsung terhadap kedaulatan mereka.
Sebagai bangsa yang memilki lebih dari 700 bahasa dan 1.340 suku, Indonesia menyimpan kekayaan linguistik yang melimpah.
Sayangnya, hanya sebagian kecil bahasa ini terdokumentasi dengan baik.
Dalam konteks pemodelan AI, khususnya pemrosesan bahasa alami (NLP), bahasa yang tidak memiliki sumber daya digital seringkali diabaikan.
Akibatnya, model-model AI moderen seperti GPT (OpenAI), Gemini (Google), dan Meta (Facebook) yang dilatih menggunakan miliaran data dari bahasa-bahasa dominan dunia, mengabaikan pengetahun local, yang secara tidak langsung menyingkirkannya dari ekosistem digital.
Salah satu contoh di Maluku Utara, provinsi dengan lebih dari 34 bahasa daerah didalamnya.
Dalam beberapa kali simulasi, kami tidak menemukan bahwa bahasa-bahasa tersebut mampu beradaptasi saat diprompt pada mesin-mesin AI.
Terlihat bahwa model cenderung menghasilkan terjemahan yang salah yang tidak merepresentasikan makna asli.
Artinya, bagi sistem AI global, bahasa-bahasa ini “tidak ada.”
Mereka tidak terwakili, tidak dikenal, dan tidak menjadi bagian dari interaksi manusia-mesin.
Inilah bentuk kolonialisasi diam-diam, AI hanya ‘mendengarkan’ bahasa yang dianggap layak secara statistik dan ekonomi. Bahasa dengan penutur sedikit dan tanpa dokumentasi digital tidak akan pernah masuk radar AI.
Padahal, nilai sebuah bahasa tidak terletak pada kuantitas digital, melainkan pada kekayaan budaya, sejarah, dan kearifan lokal yang dikandungnya.
Kalangan peneliti dalam bidang ini berargumen bahwa bahasa daerah tidak didukung oleh mesin-mesin tersebut karena memang datanya tidak tersedia atau belum pernah dilatih kedalam model AI.
Secara teknis ini benar, tapi justru di sinilah letak kritik, mengapa data itu tidak ada?
Siapa yang memutuskan bahasa mana yang layak didigitalkan dan mana yang diabaikan?
Ketidakhadiran bahasa lokal dalam dataset AI bukanlah kondisi alami, melainkan hasil dari struktur kekuasaan pengetahuan global yang sejak lama meminggirkan bahasa-bahasa kecil.
Etika model-model besar seperti GPT dan kawan-kawanya hanya membangun kecerdasannya dari bahasa global, mereka ikut memperkuat ketimpangan linguistik dunia, sebuah bentuk kolonialisasi epistemik yang menghapus eksistensi komunitas.
AI hanya mendukung dan memahami bahasa tertentu, dan secara tidak langsung mengabaikan, merendahkan, bahkan menghapuskan eksistensi bahasa lainnya dari lanskap digital.
Apakah mereka netral? Mengapa pengetahuan komunitas tidak ada? Bisa jadi karena masyarakat adat tidak diberi tempat dalam pengembangan teknologi, tidak dilibatkan dalam proses produksi, dan pemilik sistem tidak memberi insentif pada dokumentasi bahasa minoritas.
Mereka cenderung menghindari invertasi besar, dan hanya mau menggunakan data yang telah terdokumentasi secara digital.
Ketika teknologi asisten virtual hanya mendukung segelintir bahasa besar, maka Penutur bahasa daerah terpaksa harus beradaptasi.
Mereka harus meninggalkan bahasanya untuk bisa terlibat dalam dunia digital.
Mereka mungkin kurang termotivasi untuk belajar atau menggunakan bahasa daerah mereka yang tidak relevan dengan teknologi yang mereka gunakan setiap hari.
Ini menciptakan kesenjangan digital baru dimana Penutur bahasa daerah yang tidak fasih berbahasa mayoritas akan kesulitan mengakses informasi melalui platform digital.
Ini seolah-olah mengukuhkan ketimpangan, mesin-mesin AI tersebut yang tanpa sadar melanggengkan hierarki Bahasa.
kibatnya bahasa mayoritas makin dominan dan makin digunakan.
Sementara bahasa daerah mulai terpinggirkan yang bermuara pada kepunahan atau hilang.
AI seperti penjajah aktif yang ikut berkontribusi pada penghilangan bahasa dalam ruang digital.
Selain case kepunakan bahasa, mesin-mesin AI akan menjadi alat homogenisasi budaya yang mengukuhkan dominasi budaya lain yang tidak selaras dengan local wisdom kita.
Ini bisa dibuktikan dengan kecenderungan respons model-model AI saat ini yang ketika ditanya tentang konteks ke Indonesiaan, justru cenderung menjawab dengan west perspektif.
Budaya lokal sering disederhanakan, sementara nilai-nilai dan konteks sosial-budaya dari komunitas tidak tercermin secara akurat.
Teknologi AI seperti memproyeksikan pemahaman global yang seragam, yang berakar pada nilai-nilai dominan, menghidari respon terhadap budaya lokal yang kompleks dan kontekstual.
Akibatnya, narasi budaya kita dikuasai oleh kerangka pikir luar, yang berpotensi bias atas asset pengetahuan lokal kita.
Dalam jangka panjang, ini menciptakan standar pengetahuan yang tidak merepresentasikan realitas sosial-budaya Indonesia yang sebenarnya. Ini bukan sekadar hilangnya kata-kata, tetapi juga hilangnya pengetahuan lokal.
Dalam perspektif gender, misalnya, sistem AI cenderung mengasosiasikan peran dan pemahaman yang bersifat umum atau universal, daripada menggali kompleksitas peran tradisional gender dalam budaya lokal Indonesia.
Pada isu identitas kebangsaan, model lebih banyak mengenali budaya dominan, sementara narasi-narasi lokal seringkali diabaikan atau tidak dikenali.
Dalam aspek kepercayaan, kepercayaan mayoritas yang paling sering muncul dalam data pelatihan cenderung lebih dipahami, sedangkan sistem AI bisa bersikap terlalu netral atau ambigu terhadap tradisi kepercayaan lokalnya.
Dari sisi status sosial-ekonomi, model AI lebih akrab dengan pola hidup kelas menengah-atas, sementara kehidupan masyarakat pedesaan atau komunitas adat yang sarat nuansa budaya sering kali luput dari pemodelan.
Model kesulitan menjelaskan kehidupan masyarakat lokal yang sarat dengan nuansa budaya.
Akibatnya, AI kesulitan merepresentasikan kehidupan masyarakat lokal secara utuh.
Pada aspek geografi, AI lebih mengenal konteks metropolitan, tetapi kesulitan memahami kehidupan dan perspektif komunitas adat dari wilayah-wilayah terpencil.
Sebagaimana ditulis oleh Yaw Ofosu-Asare dalam artikelnya, 'Cognitive Imperialism in Artificial Intelligence’.
Ia menyoroti bagaimana dominasi epistemologi Barat dalam pengembangan AI telah menciptakan ketimpangan pengetahuan yang dikenal sebagai 'imperialisme kognitif', yakni situasi di mana sistem AI melanggengkan nilai-nilai budaya Barat sambil mengabaikan atau meminggirkan pengetahuan masyarakat adat.
Ini mengisyaratkan bahwa Model-model kecerdasan buatan saat ini pada dasarnya pasif terhadap ketimpangan data.
Bukanya aktif terhadap ketimpangan data, alih-alih model AI saat ini, menfaatkan pendekatan Retrieval-Augmented Generation (RAG) yang memungkinkan model melakukan pencarian informasi melalui mesin pencari eksternal, memanfaatkan keterdiaan data digital budaya yang ada pada data yang sudah tersedia dan dipublikasikan.
Ini justru memperkuat dirinya terhadap apa yang sudah ada, bukan terhadap apa yang hilang atau belum terdokumentasi.
Lebih ironis lagi, mesin AI yang hari ini dipuja sebagai terobosan teknologi justru mengulangi pola lama, ekstraksi sumber daya tanpa pengembalian manfaat.
Bedanya, yang diekstrak bukan emas atau rempah, tapi data bahasa dan pengetahuan lokal, sering kali tanpa sepengetahuan komunitas penuturnya.
Bahasa-bahasa ini lalu menjadi objek dalam sistem digital yang mereka sendiri tidak punya kuasa atasnya.
Untuk mengatasi masalah ini, negara perlu mengembangkan kebijakan teknologi berbasis keadilan lokal, yang memastikan bahwa AI dibangun secara inklusif, dengan melibatkan komunitas sebagai mitra aktif, bukan sekadar objek data.
Dalam Upaya ini, Investasi pada arsip digital bahasa daerah, pembuatan model AI lokal, dan penguatan kapasitas komunitas penutur menjadi sangat penting.
Pemerintah, peneliti, akademisi, pengembang, dan pihak-pihak terkait harus bekerja sama menciptakan ekosistem data, secara khusus menciptakan kedaulatan data masyarakat adat yang terkontrol.
Dengan melibatkan masyarakat adat, tidak hanya lapangan kerja baru yang akan tercipta, tetapi mereka juga mulai terberdaya.
Mereka akan menuntun dan mengawal identitas mereka, sehingga keberlanjutan bahasa dan budaya mereka tetap terjaga di tengah gempuran modernisasi. (*)
:quality(30):format(webp):focal(0.5x0.5:0.5x0.5)/makassar/foto/bank/originals/OPINI-YuyunPeneliti-pada-Pusat-Riset-Sains-data-dan-Informasi-BRIN.jpg)