Podsumowania lingwistyczne na standaryzowanych dokumentach tekstowych

P.S. Szczepaniak, J. Ochelska

W oparciu o teorię zbiorów rozmytych można dokonywać podsumowań dokumentów standaryzowanych zawierających dane liczbowe i tekstowe; właśnie rozmytość pozwala uzyskać przyjazną interpretowalność otrzymanego podsumowania. Standaryzacja dokumentów oznacza, że konkretne cechy opisywanego obiektu są liczbami lub w sposób zwarty (tj. możliwie krótki) i jednorodny opisane lingwistycznie. Jednorodność oznacza używanie określeń cech z pewnego licznego ich zbioru, przy czym bliskoznaczność cech (w sensie semantycznym) można rozpoznać po podobieństwie słów lub zdań mierzonym podobieństwem łańcuchów tekstowych w sensie liczby i kolejności znaków. Zastosowanie różnych rodzajów rozmytości daje możliwość zastosowania nowych rozwiązań, np. rozszerzenia formuły podsumowań Yagera o nowy element mający swe źródło w intuicjonistycznych zbiorach rozmytych, rozszerzenie podsumowań baz danych ściśle numerycznych o zbiory rekordów zawierających łańcuchy znakowe właściwe językowi naturalnemu, wykorzystanie metody porównań opartej na relacjach rozmytych lub też uzyskiwanie odpowiedzi na kilka różnych zapytań sformułowanych w odniesieniu do tej samej bazy danych.

Słowa kluczowe: zbiory rozmyte, podsumowania lingwistyczne, podobieństwo tekstów.

Strzałka w lewoSpis referatów, Pełny tekst PDF