Lematizace

Lematizace, neboli postup, který převádí slova na základní gramatický tvar je základním lingvistickým úkonem. Podud v aplikaci stačí jen základní a málo přesné rozhodování dá se použít jednoduchý systém, například ISPELL. Pro důkladnou práci se problematika ukazuje jako rozsáhlá a složitá. Dokonce je v úplnosti neřešitelná a sami lingvisté se neshodují na tom, která slova do jazyka patří, a která ne. Příklady problematických oblastí:

Z uvedeného je jasné, že kvalitní lematizace vyžaduje mimo jiného: