Opait Text Filters 仕様
|
インデックス作成、集計、またはデータマイニングのためのフォーマットされ、マークアップされた文書からテキストを抽出.
非構造化データを扱う多くのアプリケーションは、フォーマットされたか、マークアップされた文書のテキストコンテンツにアクセスする必要があります。文書をアーカイブする組織は、多くの場合、文書が検索可能にし、ドキュメントのアーカイブの内容の集約、報告および採掘を可能にするためにテキストコンテンツにアクセスする必要があります。検索と検索アプリケーションは、さまざまなファイル形式からテキストを抽出し、トークン化する必要があります.
ダウンロード (143.85K)