Szukaj czynnik pełnię

Wyszukiwanie współczynnik pełnią ( Przypomnijmy, Q ). Jest to wskaźnik, który charakteryzuje stosunek wykrytych odpowiednich dokumentów do całkowitej liczby dokumentów odnoszących się do wniosku.

Co rozumie się przez pełnię wyszukiwania?

Każdy konsument informacji (który jest jednym z internautów) jest zainteresowany rozważa tylko te dokumenty, które są w stanie zaspokoić jego potrzeby zapoznaj się z informacjami na dany temat. Najbardziej uderzającym przykładem - sprawdzanie zawartości oryginalności. Jeśli istnieje co najmniej jeden dokument, potwierdzający, że zawartość nie jest oryginalny, dalsza analiza nie jest już sens. Inny przykład - poszukiwanie największej liczby odpowiednich dokumentów tematycznych że naukowiec powinien przeczytać przed rozpoczęciem badań. W tym przypadku jeden dokument nie będzie wystarczające.

Zdolność systemu do wymagań użytkownika w obu powyższych przykładach, o których mowa Szukaj pełnia Jeśli wyszukiwanie nie jest wystarczająco pełnia, zawartość (pierwszy przykład) będzie pomylić z oryginału - system podczas sprawdzania po prostu przegapić podobny dokument.

indeksy wyszukiwania kompletności

Współczynnik poszukiwaniu pełnia - kluczowy wskaźnik wyszukiwarki. W celu obliczania tej wartości za pomocą następującego wzoru:

ISP = 100 * ( R / C )

W ramach tej formuły, litera R oznacza liczbę odpowiednich dokumentów uznał, litera C - całkowita liczba dokumentów, które są istotne z przedmiotem wniosku.

Załóżmy, że wiemy, że system posiada 10 dokumenty odnoszące się do tematu, ale w trakcie poszukiwań, byliśmy w stanie tylko 8 z nich do wykrycia. W tym przypadku mówimy, że czynnik wyszukiwania pełnia jest 80% (8/10).

Wskaźnik odwrotna relacja wyszukiwania jest nazywany współczynnikiem utraty danych, która jest uważana w następujący sposób:

CPI = 1 - IPA

W naszym przykładzie 20% informacji zostały utracone.

Prawdziwa wartość wyszukiwarek szukać czynnik sytości, co do zasady, nie wykracza poza zakres od 0. 7 - 0,9.

Problemy i rola współczynnika wyszukiwania kompletności

Często na prośbę out tysiące lub nawet setki tysięcy odpowiednimi dokumentami, jednak treść wielu z nich są prawie identyczne - użytkownik może w pełni zaspokoić zapotrzebowanie na informacje badając dokument 2-3, a dalsze badania doprowadzą tylko do straty czasu. W odwrotnej sytuacji, użytkownik nie może znaleźć potrzebnych informacji, nawet przy wysokim współczynniku pełnia wyszukiwania (jeśli obiekt jest słabo poznana). Wszystko to sugeruje, wskaźniki wtórne wyszukiwania factor pełnia, nie odgrywają szczególną rolę w poszukiwaniu nieprofesjonalnych.

Kolejny argument, potwierdzający niską wagę czynnika wyszukiwania jest to, że możemy osiągnąć wartość 100%, nawet bez wprowadzania zapytania i kolejno skanowania wszystkich dokumentów w kolekcji.