Оценка схожести текстов
Рассчитать процент сходства между двумя текстами по различным алгоритмам.
О Text Similarity Score
Text Similarity Score рассчитывает, насколько похожи два текста, используя несколько алгоритмов расстояния и подобия, включая расстояние редактирования Левенштейна, индекс Джарда, косинусное подобие на характерные n-граммы и расстояние Джаро-Винклера. Каждый алгоритм имеет свои сильные стороны: расстояние редактирования Левенштейна отслеживает стоимость редактирования на уровне символов, индекс Джарда измеряет пересечение наборов токенов, косинусное подобие хорошо справляется с вариациями частот слов, а расстояние Джаро-Винклера оптимизировано для коротких строк и имён. Результаты нормализуются до 0-100% подобия со значением метрики на/raw, давая вам полное представление о текстовой близости с разных точек зрения.
Как Использовать
Введите первый текст в левое поле ввода и второй текст в правое поле. Инструмент мгновенно показывает оценку сходства с использованием нескольких алгоритмов.
Распространённые Сценарии Использования
- Выявление потенциального плагиата в академических представлениях, вычисляя коэффициенты подобия между эссе студентов и документами-отсчётчиками
- Поиск близких дубликатов описаний товаров, блогов или баз знаний в системах управления контентом
- Оценка качества перевода, вычисляя, насколько близко машинно-переведенный текст соответствует профессиональному отсчётчику перевода
- Оценка и настройка порогов распознавания фаззов в системах автозаполнения поиска, удаления дубликатов записей и системы распознавания сущностей
- Сравнение файлов конфигурации или наборов переменных окружения в средах развертывания, чтобы выявить непредвиденные разногласия