दोस्तों यह तो आपको भी पता होगा की समय के साथ साथ डेटा की कैपेसिटी भी बढ़ती चली जा रही है अगर आपको याद होगा तो पहले कुछ सालों में बहुत ही बेसिक कंप्यूटर होते थे जिनमे रैम वगेरह या फिर रोम बहुत ही कम हुआ कर थी लेकिन उस समय के हिसाब से वह बहुत पर्याप्त थीं। इसलिए यह पोस्ट Data Scientist kya hai | Data Scientist Kaise bane? इतनी ज्यादा इंपॉर्टेंट हो जाती है।
मोबाइल का चलन भी हाल ही के कुछ सालों में बढ़ा है वरना मोबाइल होना बहुत बड़ी बात मानी जाती थी, उस समय मोबाइल में मुश्किल से 500 एमबी रैम हुआ करती थी जो किसी भी काम को बहुत सही ढ़ंग से करने में सक्षम होती थी,
उस समय का डेटा और अभी के डेटा में बहुत फर्क है उस समय बहुत बड़ी बड़ी हार्ड ड्राइव हुआ करती थी जिनमे बहुत कम डेटा स्टोर किया जाता था लेकिन समय के साथ टेक्नोलॉजी का विकास हुआ और देखते ही देखते बड़ी सी हार्ड डिस्क सिम के बराबर हो गई और इसकी कैपेसिटी पहले के मुकाबले कई गुना बढ़ गई।
वहीं पहले 500जीबी रैम का साइज बहुत विशाल हुआ करता था और आज मोबाइल में ही 12 जीबी रैम आती है तथा मोबाइल बहुत फास्ट होने के साथ स्मार्ट भी बन चुके है।
डेटा की खपत समय के साथ बढ़ती चली जा रही है और इसलिए जरूरत पड़ी उस डेटा को एनालाइज करने की
तथा वह डेटा कितना इंपॉर्टेंट है इसको समझने कि, इसलिए एक नए शब्द से जन्म लिया जिसका नाम था “डेटा साइंटिस्ट”
डेटा साइंटिस्ट ने आज मानव के लिए ऐसे मुकाम हासिल कर लिए है की इससे यह भी बताना संभव हो गया है की दुनिया में किस तरह के लोग क्या क्या देखना पसंद करते है यह सब डेटा साइंस कि वजह से ही मुमकिन हो पाया है इसलिए मेरी आज कि यह पोस्ट Data Scientist kya hai | Data Scientist Kaise bane?
Data Scientist kya hai
डेटा साइंटिस्ट उसे कहते है जो बहुत बड़े विशाल डेटा को एनालाइज करते है तथा उसको मैनेज या उस डेटा को बनाने का काम करते है तथा फिर उस डेटा को लेकर किसी निष्कर्ष तक पहुंचते है। अगर आपको याद होगा तो साल के बीच बीच में बड़ी बड़ी कंपनियां अपने डेटा का खुलासा करती है।
पब्लिक को यह बताती है को इस साल सबसे ज्यादा क्या देखा गया तथा लोगों को क्या देखना सबसे ज्यादा पसंद आ रहा है, तो कोई भी बड़ी कंपनी यह कैसे पता लगा लेती है को इतने करोड़ों लोगो ने क्या देखा, इसी डेटा को मैनेज तथा उसके निष्कर्ष तक डेटा साइंटिस्ट ही पहुचाते है। आइए इसे अब एक उदाहरण कि मदद से समझने की कोशिश करते है।
उदाहरण:- Data Scientist
आप ऑनलाइन शॉपिंग तो जरूर करते होंगे और कभी कभी हम कोई चीज लेने जाते है लेकिन वह आउट ऑफ स्टॉक हो जाती है, अब उस कंपनी को यह पता रहता है कि कौन सा समान आउट ऑफ स्टॉक है लेकिन वह यह कैसे पता लगाए की इस समान को और कितने लोग खरीदना चाहते है ताकि जल्द से जल्द वह उसी समान को वापस स्टॉक में लाए और कंज्यूमर उसको खरीद सके।
यहां काम आता है आपने डेटा का जो उन्हे बताते है की आप क्या सर्च कर रहे हो, हम कभी कभी कई सारी कुकी इनाबल कर देते है बेसिकली यह कुकीज़ आपके हर एक मूवमेंट को ट्रैक करने का काम करती है। जैसे कोई सामान आउट ऑफ स्टॉक हो गया और आप उसको सर्च कर रहे हो तो ऐसे में आपके ब्राउज़र में उपलब्ध वह कुकीज़ कंपनी को जानकारी देती रहती है कि आप क्या सर्च कर रहे हो।
इसी कि मदद से शॉपिंग कंपनियां समझती है कि आप क्या ढूंढ रहे है जिससे वो लोग जल्द से जल्दी उसे स्टॉक में लाते है फिर आप उसको खरीद लेते है, अगर बिना कंज्यूमर के जाने कोई कंपनी स्टॉक लाएगी तो उसको पता ही नहीं होगा की कितने लोग सर्च कर रहे है और कितने लोगो को यह चाहिए।
Data Scientist Kaise bane?
डेटा साइंटिस्ट बनने के लिए आपको बहुत कुछ सीखना पड़ेगा तथा यह थोड़ी लंबी जर्नी होती है जिसमे आपको ढेर सारा नॉलेज लेने की जरूरत होती है, डेटा साइंटिस्ट कैसे बने इसके बारे में मैं आपको डिटेल में समझाने वाला हूं की किस प्रोग्रामिंग लैंग्वेज को आपको सीखना चाहिए तथा कौन सी स्किल आपके अंदर डेटा साइंटिस्ट बनने के लिए होना जरूरी है।
1.स्टेटिस्टिक्स
इसमें आपको मैथ्स के बारे में थोड़ा पता होना बहुत जरूरी है क्यूंकि इसमें बहुत सारी ऐसी इक्वेशन है जो बिना मैथ्स के सॉल्व नहीं की जा सकती, जो लोग पूछते है जिंदगी में मैथ्स कहीं काम नहीं आता वह इसे ध्यान से पढ़ना क्यूंकि अब मैथ्स काम आने वाला है।
सबसे पहले आपको एक्सप्लोरेट्री डाटा एनालाइज को सीखने को जरूरत है जिसमे किसी भी दो चीजों का रिलेशन निकलता होता है। दूसरा प्रोबेबिलिटी डिस्ट्रीब्यूशन तीसरा थियोरम एंड इक्वेशन और चोथा कर्व एनालिसिस है इसको आपको सीखना पड़ेगा।
2. प्रोग्रामिंग
इसमें आपको पायथन की नॉलेज होना बहुत जरूरी है, पायथन एक ओपन सोर्स सॉफ्टवेयर है जिसमे कई सारी लाइब्रेरी होती है जिसका इस्तेमाल किसी भी कोड्स को लिखा जा सकता है, इसके बाद आपको आर प्रोग्रामिंग आनी चाहिए तथा फिर सेस सीखना पड़ेगा।
सेस का मतलब स्टेटिस्टिकल एनालिसिस सिस्टम होता है यह एक जेनरेशन प्रोग्रामिंग लैंग्वेज है जिसे आपको सीखना पड़ेगा।
3. डेटाबेस नॉलेज
डेटाबेस का बेसिक नॉलेज होना बहुत ज़रूरी है, इसमें किसी भी डेटा को स्टोर करना तथा इसको एनालाइज करना शामिल है यह आपको आना चाहिए।
मशीन लर्निंग और डीप लर्निंग
मशीन लर्निंग अल्गोरिथम्स को कहा जाता है यह ऐस कोड्स होते है जो कंज्यूमर की हर एक मूवमेंट को कैप्चर करते है तथा डेटा डेटाबेस तक पहुंचाते है जिसका आगे इस्तेमाल किया जाता है।
डीप लर्निंग एक तरह कि लाइब्रेरी होती है जिसमे आपका सभी प्रकार का डेटा शामिल होता है जैसे इमेज, ऑडियो, वीडियो और किसी भी तरह का टेक्स्ट यह बहुत विशाल मात्रा में होते है जिसका एनालाइज करना होता है।
बिग डेटा
बिग डेटा बहुत जरूरी हिस्सा होता है जिसमे बहुत विशाल डेटा को एनालाइज किया जाता है तथा उसको प्रोसेस करके उसके रिजल्ट तक पहुंचा जाता है, कई ऐसे फ्रेमवर्क है जो इतने बड़े डेटा को एनालाइज करने का काम करते है जैसे हदूप और अपाचे स्पार्क।
डेटा इंगेशन और मंगिंग
इसमें किसी भी बड़े डेटा को स्टोर किया जाता है ताकि उसको बाद में किसी और में इस्तेमाल किया जा सके, इसका इस्तेमाल डेटा को ट्रांसफर करने के लिए भी किया जाता है तथा इस डेटा को बड़े बड़े क्लाउड बेस्ड सर्विस में स्टोर किया जाता है।
डेटा विजुअलाइजेशन
अब हमने डेटा इंगेशन और मंगिंग की मदद से डेटा को आगे के प्रोसेस के लिए स्टोर करके रख लिया है जिसमे इमेज, वीडियो, ऑडियो और टेक्स्ट शामिल है लेकिन अगर आप इतने बड़े डेटा को देखोगे तो कुछ समझ नहीं आएगा इसलिए अब उसको विजुअलाइज करने को जरूरी होती है।
जिसके लिए उसको एक स्टोरी का फॉर्म दिया जाता है ताकि उसको समझा जा सके, यह था डेटा साइंटिस्ट बनने का पूर सफर।
निष्कर्ष
दोस्तों आज मैंने आपको इस पोस्ट के माध्यम से बताया की Data Scientist kya hai | Data Scientist Kaise bane? वैसे यह फील्ड थोड़ी मुश्किल है लेकिन आने वाले समय में इसका उपयोग बहुत ज्यादा बढ़ने वाला है इसलिए जिसे भी यह सीखना या बनना है तो बहुत अच्छे से उसको सीखे।
मैंने इस पोस्ट में पूरी कोशिश की है कि आपको सारी चीजे बहुत सरल भाषा में बता सकु अगर आपको कुछ भी समझ नहीं आया तो आप हमसे कॉमेंट बॉक्स में लिखकर पूछ सकते है, इस पोस्ट को अपने दोस्तों के साथ जरूर शेयर करें तथा इस पोस्ट को अंत तक पढ़ने के लिए आपका बहुत बहुत धन्यवाद।