Opait Text Filters विनिर्देशों
|
अनुक्रमण, एकत्रीकरण, या डेटा खनन के लिए स्वरूपित और चिह्नित अप दस्तावेजों से पाठ निकालने .
असंरचित डेटा के साथ सौदा है कि कई अनुप्रयोगों प्रारूपित या चिह्नित अप दस्तावेजों की पाठ्य सामग्री के लिए उपयोग की आवश्यकता होती है. दस्तावेजों संग्रह संगठनों है कि अक्सर दस्तावेजों खोजा और दस्तावेज अभिलेखागार की सामग्री एकत्रीकरण, रिपोर्टिंग और खनन सक्षम करने के लिए शाब्दिक सामग्री के लिए उपयोग की आवश्यकता होती है. खोज और पुनर्प्राप्ति आवेदन भी निकालने और विभिन्न फ़ाइल स्वरूपों से tokenize पाठ करने की जरूरत है .
डाउनलोड करें (143.85K)