गूगल ने अभी हाल ही में रिकैप्चा को खरीद लिया है. रिकैप्चा वेबसाइटों को आनलाइन कैप्चा लगाने की सुविधा प्रदान करने वाली सेवा है.
आपने इसे कई साइटों में कुछ ऐसे देखा होगा:
पहले रिकैप्चा को समझते हैं. रिकैप्चा असल में पुरानी पुस्तकों को डिजिटल रूप में परिवर्तित करने की सेवा है. पर ये काम कैसे करती है?
सामान्यत: किसी किसी किताब के किसी पृष्ठ को डिजिटल रूप देने के लिये उसे स्कैन करना पड़ेगा. लेकिन ये स्कैन की हुई कापी स्टोर करने में आकार में बड़ी हो जाती है तथा इसमें से शब्दों को खोजा नही जा सकता है. अत: इसमें से जानकारियां भी नही खोजी जा सकती हैं.
अत: इस समस्या का हल निकालने के लिये ओसीआर की मदत ली जाती है. ओसीआर यानि कि आप्टिकल कैरेक्टर रीडर. लेकिन ये भी पूरी तरह से शब्दों को पढ़ने में सक्षम नही है. और जब किताबें पुरानी हों और उनका प्रिंट खराब हो तब तो ओसीआर कुछ पढ़ ही नही पायेगा.
इसे समझने के लिये इस चित्र पर गौर फ़रमाइये:
केवल इंसान ही ऐसे शब्दों को पढ़ सकते हैं. अत: ओसीआर का काम कैप्चा के जरिये मनुष्यों से करवाया जाता है. क्योंकि मनुष्य ही खराब प्रिंट वाले अक्षरों को पढ़ सकते हैं. लेकिन लेकिन जब मशीन को शब्द का अर्थ ही नही पता है तो वह यह कैसे जानेगी कि आपने जो टाइप किया है वह सही है?
यही रिकैप्चा का आइडिया है. आपको कैप्चा के रूप में दो शब्द दिये जाते हैं एक वो जिसका मतलब मशीन को पता नही है और दूसरा वो जिसका मतलब मशीन को पता है.
जब आप कैप्चा को हल करते हैं तो एक शब्द से मशीन ये निश्चित करती है कि आप मनुष्य हैं ना कि कोई रोबोट/प्रोग्राम और दूसरे शब्द के से मशीन उसका मतलब सीखती है.
दुनियाभर में प्रतिदिन करीब २०० मिलियन कैप्चा हल की जाती हैं. और किसी सामान्य व्यक्ति को इसे हल करने में करीब १० सेकेंड लगते हैं. जो कि मामूली है. पर इससे एक लाख पचास हजार घंटों का काम प्रतिदिन हो जाता है. और इस प्रकार पुरानी हो चुकी पुस्तकों के ज्ञान को डिजिटल रूप में परिवर्तित किया जाता है.
गूगल रिकैप्चा को खरीदकर गूगल बुक्स के लिये किताबों का डिजिटलीकरण करेगा.
तो है ना रिकैप्चा कमाल की चीज!
No comments:
Post a Comment