[[पीटी5]] [[पीटी12]] स्कैन किए गए टेक्स्ट को प्रयोग योग्य बनाने के लिए उपकरण
एक PDF OCR टूल स्कैन किए गए दस्तावेज़ों, छवि-आधारित PDF, फोटोग्राफ किए गए पृष्ठों और गैर-चयन योग्य टेक्स्ट को ऐसी सामग्री में बदलने में मदद करता है जिसे खोजना, कॉपी करना, समीक्षा करना या पुन: उपयोग करना आसान है। कई [[पीटी5]] सामान्य दस्तावेज़ों की तरह दिखते हैं लेकिन छवियों की तरह व्यवहार करते हैं, जिसका अर्थ है कि पाठ को चुना, खोजा या साफ-सुथरा नहीं निकाला जा सकता है। [[पीटी12]] दृश्य पृष्ठ से पात्रों को पहचानकर उस अंतर को पाटने में मदद करता है। यह चालान, रसीदें, मुद्रित प्रपत्र, अनुबंध, शैक्षणिक नोट्स, पुरानी रिपोर्ट, मैनुअल और कार्यालय रिकॉर्ड के लिए उपयोगी है। परिणामों की हमेशा समीक्षा की जानी चाहिए, क्योंकि OCR पृष्ठ स्पष्टता, भाषा, कंट्रास्ट, रोटेशन, फ़ॉन्ट और स्कैन गुणवत्ता पर निर्भर करता है।
स्कैन किए गए PDF में अक्सर वास्तविक पाठ परतों के बजाय पृष्ठ छवियां होती हैं। देखने में, यह पूर्ण लग सकता है, लेकिन जब आप किसी शब्द को खोजने, एक वाक्य का चयन करने, या एक पैराग्राफ की प्रतिलिपि बनाने का प्रयास करते हैं, तो कुछ भी उपयोगी नहीं होता है। [[पीटी12]] दृश्य पात्रों को पढ़कर और उन्हें मान्यता प्राप्त पाठ में परिवर्तित करके इस व्यावहारिक समस्या का समाधान करता है। यह दस्तावेज़ को रोजमर्रा के वर्कफ़्लो में अधिक उपयोगी बनाता है, खासकर जब आपको नाम, चालान संख्या, तिथियां, पते, अनुबंध खंड या संदर्भ शर्तें ढूंढने की आवश्यकता होती है। [[पीटी12]] दस्तावेज़ को दोबारा नहीं लिखता; यह उस पृष्ठ से प्रयोग करने योग्य पाठ को पुनर्प्राप्त करने में मदद करता है जो पहले एक छवि-जैसे प्रारूप के अंदर बंद था।
[[पीटी5]] [[पीटी12]] स्वाभाविक रूप से वर्कफ़्लो में फिट बैठता है जहां मुद्रित या स्कैन की गई जानकारी को खोजने योग्य बनाने की आवश्यकता होती है। एक कार्यालय कर्मचारी खर्च दर्ज करने से पहले स्कैन की गई रसीदें संसाधित कर सकता है। एक छात्र परीक्षा की तैयारी के दौरान पुराने व्याख्यान नोट्स को खोजना आसान बना सकता है। एक शोधकर्ता संग्रहीत रिपोर्टों से उपयोगी अंश निकाल सकता है। एक व्यवसाय स्वामी प्रत्येक पृष्ठ को मैन्युअल रूप से पढ़े बिना स्कैन किए गए अनुबंधों की समीक्षा कर सकता है। [[पीटी12]] तब भी मदद कर सकता है जब कोई दस्तावेज़ फ़ोन फ़ोटो, कॉपियर स्कैन, या छवि निर्यात से बनाया गया हो। प्रत्येक मामले में, लक्ष्य सजावट नहीं है; यह PDF के अंदर की जानकारी को ढूंढना और संभालना आसान बना रहा है।
[[पीटी12]] सटीकता काफी हद तक इनपुट गुणवत्ता पर निर्भर करती है। धुंधले स्कैन, कम कंट्रास्ट, तिरछे पृष्ठ, लिखावट, असामान्य फ़ॉन्ट, टेबल, टिकट, वॉटरमार्क और मुड़े हुए कागज सभी पहचान की गुणवत्ता को कम कर सकते हैं। संख्याओं और समान दिखने वाले वर्णों पर विशेष ध्यान देने की आवश्यकता है, जैसे 0 और O, 1 और l, या 5 और S. यदि PDF में कानूनी, वित्तीय, चिकित्सा या तकनीकी सामग्री शामिल है, तो उस पर भरोसा करने से पहले मान्यता प्राप्त पाठ की सावधानीपूर्वक समीक्षा करें। [[पीटी12]] को उत्पादकता सहायता के रूप में माना जाना चाहिए, न कि पूर्ण गारंटी के रूप में। एक त्वरित सत्यापन कदम कॉपी किए गए टेक्स्ट को फॉर्म, रिपोर्ट, स्प्रेडशीट या रिकॉर्ड में उपयोग करने से पहले गलतियों को पकड़ने में मदद करता है।