Opait Text Filters Spécifications
|
Extrait du texte de documents formatés et balisés pour l'indexation, l'agrégation, ou l'exploration de données .
De nombreuses applications qui traitent des données non structurées ont besoin d'accéder au contenu de texte des documents formatés ou annotés. Organisations qui archivent des documents souvent besoin d'accéder à du contenu textuel de rendre les documents consultables et permettre l'agrégation de contenu, les rapports et l'exploitation minière des archives de documents. Recherche et application de recherche doivent également extraire et texte tokenize de divers formats de fichiers .
Télécharger (143.85K)