google-ai-tech-can-improve-photo-quality
क्रेडिट: गूगल ब्लॉग

Google AI Tech Can Improve Photo Quality: अमेरिकी टेक दिग्गज़ कंपनी गूगल (Google) ने आर्टिफ़िशल इंटेलिजेन्स (AI) आधारित एक ईमेज अपस्केलिंग (Image Upscaling) तकनीक पेश की है, जो लो-रिजॉल्यूशन वाली तस्वीरों को हाई-रिजॉल्यूशन फ़ोटो (HD Photos) में बदलने में सक्षम है।

जी हाँ! इस तकनीक को लेकर गूगल की टीम ने दो डिफ्यूजन मॉडल्स पेश किए हैं, जिनके ज़रिए तस्वीरों की गुणवत्ता को सुधारा जा सकता है।

ऐसी तमाम ख़बरें सबसे पहले पाने के लिए जुड़ें हमारे टेलीग्राम चैनल से!: (टेलीग्राम चैनल लिंक)

कंपनी के एक ब्लॉग पोस्ट में इस बात का ज़िक्र किया गया है कि दो नए डिफ्यूजन मॉडल्स – सुपर रिजॉल्यूशन (SR3) और कास्केडेड डिफ्यूजन मॉडल्स (CDM) के ज़रिए AI तकनीक के मेल के साथ, तस्वीरों की क्वॉलिटी सुधारने का काम किया जाता है।

Google AI Tech Can Improve Photo Quality

पर आप सोच रहें होंगें कि भला ये दो नए डिफ्यूजन मॉडल्स, जिन्हें ईमेज सुपर-रिजॉल्यूशन (SR3) और कास्केडेड डिफ्यूजन मॉडल्स (CDM) का नाम दिया गया है, वो हैं क्या? और ये काम कैसे करते हैं? तो आइए इसको समझते हैं।

Super-Resolution (SR3)

इन दोनों मॉडलों में से पहला है ईमेज सुपर-रिज़ॉल्यूशन या रिपीटेड रिफाइनमेंट या SR3। इसको कंपनी के एक सुपर-रिज़ॉल्यूशन डिफ्यूजन मॉडल के रूप में परिभाषित करती है, जो इनपुट के रूप में एक कम-रिज़ॉल्यूशन की फ़ोटो को लेता है और ख़राबी की पहचान कर मौजूदा डेटा के सहारे संबंधित हाई-रिज़ॉल्यूशन तस्वीर का निर्माण करने का प्रयास करता है।

इस SR3 प्रक्रिया के दौरान एक तरीक़े का इमेज करप्शन प्रोसेस इस्तेमाल होता है। आसान भाषा में कहें तो ये हाई-रिजॉल्यूशन फ़ोटो में तब तक Noise को जोड़ती है, जब तक केवल Pure Noise न बाकी रह जाए।

इसके बाद ये मॉडल इस पूरी प्रक्रिया को उल्टा कर देता है और Noise को हटाते हुए इनपुट पर दिए गए लो-रिज़ॉल्यूशन ईमेज के डेटा के आधार पर सुधार करने की कोशिश करता है।

Cascaded Diffusion Models (CDM)

अब बात दूसरे डिफ्यूजन मॉडल यानि कास्केडेड डिफ्यूजन मॉडल्स (CDM) की। इसको कंपनी एक ऐसे क्लास-कंडिशनल डिफ़्यूज़न मॉडल के रूप में परिभाषित की गई है, जिसको ImageNet डेटा के साथ ट्रेन किया गया है, ताकि इसके ज़रिए हाई-रिजॉल्यूशन (HD) नेचुरल ईमेज बनाई जा सकें।

इस मॉडल को कई सारे डिफ़्यूज़न मॉडलों का बंडल भी कहा जा सकता है, जो एक के बाद एक रिजॉल्यूशन को बढ़ाने का काम करते हैं।

इस CDM मॉडल का इस्तेमाल करके कंपनी के अनुसार 64×64 जिनती लो-रिज़ॉल्यूशन वाली तस्वीरों को भी 264×264 रिज़ॉल्यूशन और फिर 1024×1024 रिज़ॉल्यूशन तक बढ़ाया जा सकता है।

इस बीच गूगल ने अपने इस नए एआई टेक के इस्तेमाल से बेहतर बनाई गई कुछ तस्वीरों के उदाहरण भी पेश किए हैं, जिन्हें आप नीचे देख सकते हैं;

High Fidelity Image Generation Using Diffusion Models
क्रेडिट: गूगल ब्लॉग

माना ये जा रहा है कि भविष्य में गूगल अपने इस एआई टेक को किसी प्रोडक्ट की शक्ल भी दे सकती है, क्योंकि इसकी ख़ासियतों को देखते हुए इन इमेज डिफ्यूजन मॉडलों का इस्तेमाल सुरक्षा, स्वास्थ्य, मनोरंजन आदि जैसे क्षेत्रों में किए जानें की संभावनाओं को बल मिलता है।

वैसे इसके ज़रिए आप अक्सर थोड़ी ख़राब सी हो जाने वाली पुरानी फ़ैमिली फ़ोटो को भी वापस से HD क्वॉलिटी में प्राप्त कर सकते हैं।