(The original article in English)
इस बात पर लोगों के बीच में काफी विवाद हो सकता है कि चैटजीपीटी के पास क्या वाकई मानव समान इन्टेलिजैन्स है या नहीं। पर शायद सब लोग यह मानेंगे की चैटजीपीटी ऐसे बहुत से काम कर लेता है जो किसी मनुष्य के किए जाने पर इन्टेलिजैन्ट कहे जाएंगे। आजकल मैं अपनी अधिकतर इंटरनेट क्वेरी चैटजीपीटी पर ही शुरू करता हूँ। जबकि पहले यही क्वेरी गूगल या बिंग पर शुरू होती थीं| और सब लोगों की तरह मुझे भी यह बात चकित करती है कि चैटजीपीटी करोड़ों तथ्य एकदम तत्काल कैसे याद कर लेता है, कैसे यह सिस्टम इतनी जल्दी अर्थपूर्ण वाक्य बना लेता है, वाक्यों को एक व्यवस्थित रूप में रख लेता है, और इसी तरह के न जाने कितने काम वो सफलता पूर्वक कर लेता है। मेरे चैटजीपीटी की साथ हुए बहुत से वार्तालापों में मुझे ऐसा लगता है जैसे वह तर्कपूर्ण बातें कर सकता है और किसी छोटी-मोटी प्रमेय को सही या गलत साबित कर सकता है। ऐसा भी लगता है जैसे चैटजीपीटी अपने द्वारा प्रयोग किए हुए शब्दों का अर्थ समझता है। जब हम चैटजीपीटी को एक क्रम में लगे हुए आपस में संबंधित कुछ शब्द देते हैं तो चैटजीपीटी में यह क्षमता है की वो आगे आने वाले कुछ शब्दों को प्रिडिक्ट कर सकता है। हम सब लोग इस बात पर चकित हैं कि चैटजीपीटी की बाकी सब शक्तियां क्या केवल उसकी आगे के कुछ शब्द प्रिडिक्ट करने की शक्ति से उत्पन्न हो सकती है? कम-से-कम यह तो हम सभी जानना चाहते हैं की क्या चैटजीपीटी शब्दों के अर्थ को समझता है।
यहां यह कहना बहुत जरूरी है कि अगर यह मानव-निर्मित सिस्टम्स शब्दों के अर्थ उसी तरह समझते हैं जैसे हम मानव, तो हम कृतिम इन्टेलिजैन्स बनाने के अत्यंत नजदीक होंगे। और अगर नहीं, तो कृतिम इन्टेलिजैन्स बनाने का लक्ष्य हमसे अभी बहुत दूर हो सकता है।
अब से दो दशकों से ज्यादा पहले मेरे साथ एक घटना घटी जिससे मुझे यह समझ में आया कि सर्च-एंजिन्स संभवतः अपने द्वारा प्रयोग किए हुए शब्दों का अर्थ नहीं समझते। सन 2000 के आसपास, सर्च-एंजिन्स बिल्कुल नई और सफल टेक्नोलॉजी के उदाहरण होते थे और उन दिनों भी लोग यह आश्चर्य करते थे की क्या सर्च-एंजिन्स प्रयोग किए हुए शब्दों के अर्थ समझते हैं। जो कहानी में जल्दी ही आपको बताऊँगा, उस कहानी ने मुझे बिल्कुल स्पष्ट कर दिया कि जिस तरह से सर्च-एंजिन्स काम करते हैं, वो शब्दों का अर्थ जाने बिना भी किसी क्वेरी से संबंधित इन्टरनैट पेजों को ढूंढ कर निकाल सकते हैं। सर्च-एंजिन किसी क्वेरी से संबंधित आर्टिकल ढूँढने के लिए कुछ काफी सामान्य से काम करते हैं। उदाहरण के लिए वो बिना शब्दों का अर्थ जाने यह देखते हैं कि क्वेरी और आर्टिकल के बीच में कितने शब्द कॉमन हैं और वो शब्द कितनी बार आर्टिकल में प्रयोग हुए हैं। सच यह है कि कॉमन शब्दों को देखने से यह निश्चित हो जाता हैं कि सर्च-एंजिन केवल क्वेरी से संबंधित आर्टिकल ही लौटायेंगे। ऐसा हो ही नहीं सकता की इस तरीके को प्रयोग करने के बाद कोई असंबंधित आर्टिकल लौट कर वापिस आयें।
जो तर्क मैंने दो दशक पहले सर्च-एंजिन्स के लिए दिया था, वही तर्क आज चैटजीपीटी पर भी लागू होता है । मेरे कहने का मतलब यह बिलकुल नहीं है चैटजीपीटी और सर्च-एंजिन्स बुद्धिमत्ता प्रदर्शित नहीं करते हैं। मैं तो बस यह देखना चाहता हूँ कि उनकी बुद्धिमत्ता की सीमा कितनी दूर तक जाती है और उसको और कितना आगे बढ़ाया जा सकता है.
सन २००० के आस-पास सर्च-एंजिन्स एक बिलकुल नई टेक्नोलॉजी थे और उनका प्रयोग लोगो के बीच बढ़ता जा रहा था। मेरी लड़की उन दिनों पहली या दूसरी कक्षा में रही होगी। हम लोग उन दिनों कभी-कभी टाइम पास करने के लिए नए-नए खेल बना लेते थे। उसी समय एक दुपहर को मैंने अपनी ही दूसरी कक्षा की इंग्लिश क्लास के एक प्रश्न उठा कर उसके साथ खेलना शुरू कर दिया। मैंने उसे एक इंग्लिश का शब्द दिया और उससे उस शब्द को एक इंग्लिश वाक्य में प्रयोग करने के लिए कहा। यह बिलकुल सादा सा खेल था। मेरी लड़की ने आसानी से दो चार वाक्य बनाये पर बहुत जल्दी से खेल थोड़ा बोरिंग हो गया। खेल को थोड़ा कठिन बनाने के लिए मैंने अब की बार एक के बदले दो शब्द प्रयोग किए और अपनी लड़की को दोनों शब्दों को एक ही वाक्य में प्रयोग करने के लिए कहा। पर खेल जल्दी ही फिर से बोरिंग हो गया। इस पर मैंने खेल के तीन-शब्द और चार-शब्द रूपों का प्रयोग किया। मैंने जब अपनी लड़की से चार अलग-अलग शब्दों को एक ही वाक्य में रखने के लिए कहा, तो कुछ ऐसा हुआ जिसने मुझे बिलकुल चकित कर दिया। मैंने पाया कि चार शब्दों के कारण खेल कठिन होने के बजाये और भी आसान हो गया। इससे भी बड़ी बात यह हुई कि जो वाक्य मेरी लड़की ने मुझे बना कर दिया वह लगभग वही वाक्य था जो कि मेरे मन में था जब मैंने वह चार शब्द चुने थे। चार शब्दों की वजह से खेल का आसान होना और मेरी लड़की का बिना बताये लगभग वही वाक्य बनाना मेरे लिए अत्यंत आश्चर्य कि बात थी.
हमारी भाषाओं का हमारे जीवन में काम यह है कि हम जिन दृश्यों को देखते, सोचते, या अनुभव करते है उनका शब्दों में वर्णन हम अपने लिए या दूसरों के लिए कर सकें। सच्चाई शब्दों में कम होती है दृश्यों में अधिक। कहा जाता है कि एक चित्र एक हजार शब्दों के बराबर होता है, और हम हजारों शब्दों का प्रयोग करके अपने मन में बनी तस्वीरों का बखान करते हैं। हम सब लोग मिल कर अपने मस्तिष्कों में करोड़ों दृश्यों को सहेज कर रखते हैं। जो वर्णन हम लोग भाषाओं में लिखते हैं या बोलते हैं वह, एक तरह से, इन दृश्यों के कैटलॉग या इंडेक्स बन जाते हैं। जो दृश्य व्यक्तिगत अभिरुचि के होते हैं वह दिमाग में ही रह जाते हैं। जो चित्र सबके इंटरेस्ट के होते हैं उनके बारे में लेख और किताबें लिखी जाती हैं और सर्च-एंजिन्स उनकी खोज करते हैं। दो अलग-अलग व्यक्तियों को अगर एक ही चित्र का कैटलॉग बनाने को कहा जाये तो वह आम तौर से एक से शब्दों का ही प्रयोग करेंगे.
मेरी प्राथमिक विद्यालय में पड़ने वाली लड़की और मैं आपस में हजार दो हजार मानसिक चित्रों को जानते होंगे। जो भी तीन चार शब्द में उस दिन सोचता, इन्हीं में से किसी न किसी चित्रों के बारे में रहे होंगे। मेरी लड़की के लिए एक वाक्य बनाने काम बस अपने कैटलॉग का प्रयोग करके बस उस चित्र को ढूंढ कर निकालने से अधिक कुछ नहीं रहा होगा जो मेरे दिमाग में था और वह भी पहले से जानती थी। व्याकरण तो उसे पता ही था। वाक्य बनाने का काम बस उस चित्र का वर्णन करना ही था। मेरी लड़की ही क्या, संसार का हर आदमी जो उस चित्र को जानता होगा लगभग वही वाक्य बनाता जो मेरे दिमाग में था।
यही प्रक्रिया ही सर्च-एंजिन्स कि दुनिया में एक बहुत बड़े पैमाने पर होती है। जब लिखने वाले कोई लेख लिखते है तो वह सबके इंटरेस्ट के चित्रों का वर्णन करते हैं। इस काम के लिए वह ऐसे शब्दों का प्रयोग करते हैं जो बहुत लोग जानते हैं। सर्च-एंजिन्स को प्रयोग करने वाले लोग भी उन्हीं शब्दों का प्रयोग करके, उन लेखों तक पहुंचना चाहते हैं। क्वेरी में प्रयोग किए हुए शब्दों को लेकर सम्बंधित लेखों तक पहुंचने के लिए केवल यह जानना ही काफी है कि किस लेख में किस शब्द का प्रयोग हुआ है, शब्दों के अर्थ को जानना जरूरी नहीं है। सर्च-एंजिन्स न तो अर्थ जानते हैं न उन्हें शब्दों के अर्थ को जानना जरूरी है। इस प्रक्रिया के सफल होने के लिए बस यही काफी है कि लेखक और लेखों को ढूँढने वाले लोग एक ही भाषा और शब्दकोश का प्रयोग करते हों। सर्च-एंजिन्स के लिए शब्दकोश को जानना आवश्यक नहीं है.
इतने पहले घटी इस घटना से मुझे इस बात का आभास तो हुआ कि सर्च-एंजिन्स को शब्दों का अर्थ जानना आवश्यक नहीं है, पर मैंने इससे इतना नहीं सीखा जितना में सीख सकता था। मेरी आगे देखने कि क्षमता इतनी नहीं थी कि में उस समय समझ पाता जो तर्क मैंने सर्च-एंजिन्स के बारे में प्रयोग किया था, वही तर्क चैटजीपीटी की सैद्धांतिक नींव का काम भी कर सकते थे। मैं यह नहीं सोच पाया कि मेरी लड़की ने केवल किसी सर्च-एंजिन्स कि भांति एक मानसिक चित्र को नहीं खोजा था, उसके अलावा उसने चैटजीपीटी की भांति से एक वाक्य भी बनाया था। उसने व्याकरण का प्रयोग किया था और अपने वाक्य में कुछ अधिक सम्भावना वाली ऐसी चीजें भी जोड़ दी थीं जो उस समय उसके मन में आयीं। चैटजीपीटी कुछ अधिक सम्भावना वाले नए शब्द जोड़ कर शब्दों का अर्थ जानने का भ्रम देता है। मेरी लड़की भी अपने वाक्यों में मेरे दिए शब्दों के अलावा कुछ नए शब्द डाल देती थी। उदाहरण के लिए अगर में उसको केक, बनाना। बेकरी, और चीनी शब्द देता, तो ऐसा हो सकता था कि वह केक से पहले चॉकलेट शब्द डाल देती क्योंकि उसको मालूम था कि काफी बार चॉकलेट केक बनायी जाती हैं। और शायद वह लेमन शब्द नहीं डालती क्योंकि लेमन केक बनती तो है पर उतनी नहीं। चैटजीपीटी का व्यवहार भी कुछ ऐसा ही होता है। उस समय में यह नहीं सोच पाया कि अगर हम कंप्यूटरों को शब्दों के एक दूसरे के बाद आने कि संभावनाओं कि जानकारी दे दें तो वह भी चैटजीपीटी कि तरह कुछ वाक्य बना सकते हैं। वह उन शब्दों के अर्थ समझें या नहीं यह दूसरी बात है। आज यह बात मेरे लिए कहना आसान है पर हजारों वैज्ञानिकों को चैटजीपीटी के बारे में सोचने में और उसे बनाने में दो या तीन दशक लगे और चैटजीपीटी एक बहुत बड़ी उपलब्धि है.
मेरे उदाहरणों का मतलब यह नहीं है कि शब्दों के अर्थ जानना हम लोगों के लिए और कंप्यूटरों के लिए जरूरी नहीं है। इन उदाहरणों का मतलब बस इतना ही है कि कुछ अल्गोरिथम बिना अर्थ जाने ही ऐसा आभास दे सकती हैं जैसे वह अर्थ समझती हैं.
अब हम लौट कर उसी प्रश्न पर आ जाते हैं जहाँ से हमने यह लेख शुरू किया था: क्या चैटजीपीटी शब्दों का थोड़ा बहुत अर्थ जानता है? क्या चैटजीपीटी के पीछे छुपी अल्गोरिथम शब्दों के अर्थ खोज निकलती हैं? हम यह भली भांति जानते हैं कि मानवीय इंटेलिजेंस में संभावनाएं बहुत बड़ी भूमिका निभाती हैं। उदाहरण के लिए हम बखूबी जानते हैं कि कौन सी चीज़ किस चीज़ के पाई जाती है और किस बात कि सम्भावना किस चीज़ के होने से कम हो जाती है। इस तरह कि जानकारी हमारे लिए हमारे सभी काम करने में निरंतर सहायक है। यह जानकारी हर चीज़ को एक अर्थ प्रदान करती है। चैटजीपीटी के पीछे छुपी अल्गोरिथम करोड़ों शब्दों को पढ़ कर कौन से शब्द किन दूसरे शब्दों के साथ आ सकते इस तरह कि जानकारी इकट्ठी करती हैं। इसलिए हमें यह मानना ही चाहिए कि अगर बहुत नहीं तो कम-से-कम थोड़ा अर्थ तो चैटजीपीटी जानता ही है.