Váhy v dotazu
Program pracuje s libovolnými váhami termínů, nicméně pro další
popis budeme předpokládat, že váhy termínů při vyhodnocování dotazu
jsou navrženy do intervalu 1 ‑ 100.
Potom:
-
při vyhodnocení složitého dotazu může výsledná váha překročit
100,
protože je součtem vah pro jednotlivé termíny,
-
při zadávání vah jednotlivých termínů je někdy vhodné použít
váhu vetší nez 100, např. bereme‑li
děti s vyloučením zadaného termínu, je vhodná váha 333,
abychom dosáhli váhu 100 u dětí
(jejich násobitel je 0.3 - viz níže).
Není-li ve uvedena váha u slova v dotazu, bere se 100.
Při analýze dotazu se přiřazují váhy odvozeným termínům pomocí
násobitele:
-
1.0 - synonyma,
-
0.6 - sourozenci,
-
0.3 - děti 1. úrovně,
-
0.3 - děti 2. úrovně,
-
0.2 - bratranci.
Relevance ve výskytech
Při vyhodnocení dotazu se výsledná váha získá součtem vah za
jednotlivé termíny. Váha jednoho termínu je přirozený logaritmus
součtu vah jeho výskytů.
Seznam nálezů je zpravidla setříděn podle vah od nejvyšší k
nejnižší. Výjimkou jsou publikace slovníkového charakteru, kde výstup
(slovníková hesla) mohou být tříděna i podle pořadí v publikaci.