Belajar Algoritma dari Chat Mantan (Sebuah Studi Kasus Levenshtein Distance)


Pernah nggak sih kamu baca chat dari doi, tulisannya cuma satu kata: "Gapapa", tapi insting kamu berteriak kalau ada badai yang sedang menuju ke arahmu?
Sebagai manusia, kita tahu itu bahaya. Tapi bagi komputer? Kata "Gapapa" itu valid, benar, dan tidak ada kesalahan sintaksis sama sekali. Di sinilah letak menariknya perbedaan antara logika mesin dan logika perasaan.
Hari ini, mari kita bedah fenomena galau ini menggunakan kacamata Data Science, spesifiknya menggunakan algoritma Levenshtein Distance.
Apa itu Levenshtein Distance?
Sebelum kita masuk ke drama percintaan, kita harus paham dulu logikanya. Vladimir Levenshtein, seorang ilmuwan Rusia, menciptakan algoritma ini pada tahun 1965.
Secara sederhana, Levenshtein Distance adalah cara matematis untuk menghitung seberapa "jauh" perbedaan antara dua kata (string). Jarak ini dihitung berdasarkan jumlah minimal langkah "edit" yang diperlukan untuk mengubah satu kata menjadi kata lainnya.
Langkah "edit" itu bisa berupa:
- Insert (Menyisipkan huruf)
- Delete (Menghapus huruf)
- Substitute (Mengganti huruf)
Studi Kasus 1: Typo yang Manusiawi
Bayangkan kamu menerima chat:
"Aku sayank kamu"
Mata kita tahu itu typo. Komputer juga tahu. Bagaimana caranya? Algoritma membandingkan kata "sayank" (input) dengan kata baku di kamus "sayang" (target).
- Kata 1:
s a y a n k - Kata 2:
s a y a n g
Hanya ada satu perbedaan di huruf terakhir. Huruf 'k' diganti (substitusi) menjadi 'g'. Jarak Levenshtein = 1.
Karena jaraknya kecil (cuma 1), sistem autocorrect di HP kamu berani menyarankan: "Maksud Anda: sayang?". Kasus ditutup. Teknologi menyelamatkan komunikasi kita.
Studi Kasus 2: The "Gapapa" Paradox
Sekarang kita masuk ke level Boss Stage. Situasi di mana teknologi angkat tangan. Bayangkan pacar (atau mantan) kamu bilang:
"Gapapa kok."
Mari kita masukkan ke dalam algoritma Levenshtein.
- Input User:
Gapapa - Kamus Bahasa:
Gapapa(kata tidak baku yang umum)
Jika kita bandingkan secara tekstual, tidak ada huruf yang salah. Ejaannya benar sesuai kebiasaan. Jarak Levenshtein = 0.
Bagi komputer, Jarak 0 berarti Perfect Match. Tidak ada error. Tidak ada masalah. Sistem akan memberikan tanda centang hijau ✅.
Tapi, bagi siapa pun yang pernah menjalin hubungan asmara, kita tahu bahwa: "Gapapa" secara teks ≠ "Gapapa" secara perasaan.
Di dunia nyata, "Gapapa" seringkali memiliki Jarak Emosional yang tak terhingga. Kata itu bisa berarti:
- "Aku kecewa."
- "Coba kamu pikir lagi salahmu apa."
- "Bujuk aku sekarang atau kita perang dingin 3 hari."
Mengapa Algoritma Gagal?
Levenshtein Distance bekerja pada level Sintaksis (susunan kata/huruf). Sedangkan manusia berkomunikasi pada level Semantik (makna) dan Pragmatik (konteks).
Komputer melihat data sebagai string (teks). Manusia melihat data sebagai state of mind (perasaan).
Ketika ada "typo hati"—di mana yang diketik beda dengan yang dirasa—belum ada satu pun kode Python atau JavaScript yang bisa mendeteksi itu dengan akurasi 100%. Tidak ada fitur autocorrect untuk gengsi atau kode-kodean pasif-agresif.
Kesimpulan: Jadilah Lebih Peka dari Robot
Belajar tentang Levenshtein Distance mengajarkan kita satu hal penting: Mengoreksi huruf itu mudah, tapi mengerti maksud itu butuh usaha.
Di era di mana kita terlalu bergantung pada layar, seringkali kita lupa bahwa teks hanyalah representasi yang buruk dari emosi manusia. Algoritma bisa membantu kita memperbaiki tulisan "mutusin" menjadi "putusin", tapi ia tidak bisa memperbaiki hubungan yang retak karena salah paham.
Jadi, kalau nanti pasanganmu bilang "Gapapa", jangan percaya pada algoritma yang bilang zero error. Percayalah pada intuisimu.
Karena pada akhirnya:
Levenshtein Distance = Alat koreksi kata.
Hati Manusia = Bukan soal hitungan logika.Yang perlu di-debug seringkali bukan apa yang tertulis di layar, tapi cara kita mendengarkan apa yang tak terucap.
Komentar