Skor Kesamaan Teks
Hitung persentase kesamaan antara dua teks menggunakan berbagai algoritma.
Tentang Skor Kemiripan Teks
Skor Kemiripan Teks menghitung seberapa mirip dua string teks menggunakan berbagai algoritma jarak dan kemiripan termasuk Levenshtein edit distance, Jaccard index, cosine similarity pada character n-grams, dan Jaro-Winkler distance. Setiap algoritma memiliki kekuatan yang berbeda: Levenshtein menangkap biaya pengeditan tingkat karakter, Jaccard mengukur tumpang tindih set token, cosine similarity menangani variasi frekuensi kata dengan baik, dan Jaro-Winkler dioptimalkan untuk string pendek dan nama. Hasil dinormalisasi menjadi skor kemiripan 0-100% bersama dengan nilai metrik mentah, memberikan Anda gambaran komprehensif tentang kedekatan tekstual dari berbagai perspektif.
Cara Menggunakan
Tempelkan teks pertama ke kolom input kiri dan teks kedua ke kolom input kanan. Pilih algoritma kemiripan yang ingin Anda terapkan dari dropdown algoritma, atau jalankan semua algoritma secara bersamaan untuk membandingkan hasilnya. Klik Calculate untuk melihat persentase kemiripan dan nilai metrik mentah untuk setiap algoritma yang dipilih. Bandingkan hasil antar algoritma untuk memahami mana yang paling sesuai dengan kasus penggunaan spesifik Anda, misalnya Levenshtein untuk skenario spell-check dan cosine untuk perbandingan dokumen.
Kasus Penggunaan Umum
- Mendeteksi potensi plagiarisme dalam tugas akademik dengan menghitung skor kemiripan antara esai siswa dan dokumen referensi
- Menemukan deskripsi produk, postingan blog, atau artikel basis pengetahuan yang hampir duplikat dalam sistem manajemen konten
- Mengukur kualitas terjemahan dengan menilai seberapa dekat teks terjemahan mesin cocok dengan terjemahan referensi profesional
- Mengevaluasi dan menyetel fuzzy matching thresholds dalam search autocomplete, deduplikasi catatan, dan sistem resolusi entitas
- Membandingkan file konfigurasi atau set environment variables di seluruh lingkungan deployment untuk mengidentifikasi perbedaan yang tidak terduga