Autoregressive चलती - औसत - ऑटो सहसंबंध
उद्देश्य: एक डेटा सेट में यादृच्छिकता की जांच के लिए सामान्यतः उपयोग किए जाने वाले उपकरण हैं, यादृच्छिकता के ऑटोकॉरेसेलेशन प्लॉट्स (बॉक्स और जेनकिंस, पीपी। 28-32) की जांच करें। इस यादृच्छिकता को समय-समय पर अलग-अलग आंकड़ों के मूल्यों के लिए स्व-संचालन की गणना के द्वारा पता लगाया गया है। यदि यादृच्छिक हो, तो इस तरह के autocorrelations किसी भी और सभी समय-अंतराल के लिए शून्य के पास होना चाहिए। अगर बिना यादृच्छिक, तो एक या अधिक autocorrelations काफी गैर शून्य हो जाएगा। इसके अलावा, बॉक्स-जेनकिंस के ऑटोरेग्रेसिव के लिए मॉडेल पहचान चरण में ऑटोकॉरेलेशन प्लेॉट्स का उपयोग किया जाता है, जो औसत समय श्रृंखला मॉडल चलती है। ऑटोकोएरलिलेशन केवल एकमात्र यादृच्छिकता है ध्यान रखें कि असंबंधित का मतलब यादृच्छिक नहीं है। महत्वपूर्ण स्वायत्तता वाले डेटा को यादृच्छिक नहीं है। हालांकि, डेटा जो महत्वपूर्ण ऑटोकोएरलिलिशन प्रदर्शित नहीं करता है, वह अभी भी अन्य तरीकों से गैर-रैंडिनेस प्रदर्शित कर सकता है। ऑटोकोएरलिलिटी केवल एक उपाय है यादृच्छिकता मॉडल वैधीकरण के संदर्भ में (जो कि प्राथमिक प्रकार की यादृच्छिकता हैंडबुक में है), स्व-पारस्परिक संबंध के लिए जांच आम तौर पर यादृच्छिकता का एक पर्याप्त परीक्षण है क्योंकि एक खराब फिटिंग मॉडलों के अवशेष गैर-सूक्ष्म यादृच्छिकता प्रदर्शित करते हैं। हालांकि, कुछ अनुप्रयोगों को यादृच्छिकता का अधिक कठोर निर्धारण की आवश्यकता होती है। इन मामलों में, परीक्षणों की एक बैटरी, जिसमें स्वयं-सम्बन्ध के लिए जांच शामिल हो सकती है, लागू किया जाता है क्योंकि डेटा कई अलग-अलग और अक्सर सूक्ष्म तरीकों में बिना-यादृच्छिक हो सकता है। एक उदाहरण जहां यादृच्छिकता के लिए एक और अधिक कठोर जांच की आवश्यकता होती है, यादृच्छिक संख्या जनरेटर परीक्षण में होगा। नमूना भूखंड: यादृच्छिकता के लिए ऑटोोकॉरेल्ललेशन निकट-शून्य होना चाहिए। इस उदाहरण में इस तरह का मामला नहीं है और इस प्रकार यादृच्छिक धारणा विफल हो जाती है यह नमूना स्वत: पारस्परिक संबंध प्लॉट दर्शाता है कि समय श्रृंखला यादृच्छिक नहीं है, बल्कि आसन्न और नज़दीकी आसन्न टिप्पणियों के बीच एक उच्च डिग्री स्वत: संबंध है। परिभाषा: आर (एच) बनाम एटोकॉरेसेलेशन प्लॉट्स वर्टिकल अक्ष द्वारा बनाई गई हैं: ऑटोकॉरेलेशन गुणांक जहां सी एच ऑटोकॉरिएंस फ़ंक्शन है और सी 0 विचरण फ़ंक्शन है, ध्यान दें कि आर एच -1 और 1 के बीच है। नोट करें कि कुछ स्रोतों का इस्तेमाल हो सकता है आटोोकॉरिएंस फ़ंक्शन के लिए निम्नलिखित फार्मूला हालांकि इस परिभाषा में कम पूर्वाग्रह है, (1 एन) के निर्माण में कुछ वांछनीय सांख्यिकीय गुण हैं और ये आंकड़ों के साहित्य में सबसे ज्यादा इस्तेमाल होता है। विवरण के लिए चेट्फ़ील्ड में पृष्ठ 20 और 49-50 देखें। क्षैतिज अक्ष: समय अंतराल एच (एच 1, 2, 3.) ऊपर की रेखा में कई क्षैतिज संदर्भ पंक्तियां भी शामिल हैं मध्य रेखा शून्य पर है अन्य चार पंक्तियां हैं 95 और 99 विश्वास बैंड ध्यान दें कि आत्मविश्वास बैंड बनाने के लिए दो विशिष्ट सूत्र हैं। यदि ऑटोोकॉएरलिलेशन प्लॉट को यादृच्छिकता (यानी डेटा में कोई समय निर्भरता नहीं है) के लिए परीक्षण करने के लिए उपयोग किया जाता है, तो निम्न सूत्र की सिफारिश की जाती है: जहां एन नमूना आकार है, z मानक सामान्य वितरण का संचयी वितरण फ़ंक्शन है और (अल्फा ) महत्व का स्तर है इस मामले में, आत्मविश्वास बैंड ने निश्चित चौड़ाई तय की है जो नमूना आकार पर निर्भर करती है। यह एक फार्मूला है जिसका उपयोग ऊपर की साजिश में आत्मविश्वास बैंड उत्पन्न करने के लिए किया गया था। एरोमा मॉडल फिटिंग के लिए मॉडल पहचान चरण में ऑटोोकॉरेरलेशन प्लॉट का भी उपयोग किया जाता है। इस मामले में, चलती औसत मॉडल को डेटा के लिए ग्रहण किया जाता है और निम्नलिखित विश्वास बैंड तैयार किए जाने चाहिए: जहां k अंतराल है, एन नमूना आकार है, z मानक सामान्य वितरण का संचयी वितरण समारोह है और (अल्फा) है महत्व का स्तर इस मामले में, अंतराल बढ़ने के रूप में विश्वास बैंड बढ़ता है। स्वचिकित्सा भूखंड निम्नलिखित प्रश्नों के उत्तर प्रदान कर सकता है: क्या आंकड़े यादृच्छिक हैं आसन्न अवलोकन से संबंधित एक अवलोकन क्या एक अवलोकन से संबंधित एक अवलोकन दो बार हटाया गया (हटाया गया) क्या देखा गया समय श्रृंखला सफेद शोर है मनाया समय श्रृंखला sinusoidal मनाया गया समय श्रृंखला ऑटरेरेसेजिव क्या मनाया गया समय श्रृंखला के लिए एक उचित मॉडल क्या मॉडल मान्य और पर्याप्त है सूत्र है sssqrt वैध महत्व: इंजीनियरिंग निष्कर्ष की वैधता सुनिश्चित करें यादृच्छिकता (निश्चित मॉडल, निश्चित भिन्नता और निश्चित वितरण के साथ) एक है चार धारणाओं में से जो आमतौर पर सभी मापन प्रक्रियाओं को लागू करते हैं यादृच्छिकता की धारणा निम्न तीन कारणों के लिए महत्वपूर्ण रूप से महत्वपूर्ण है: अधिकांश मानक सांख्यिकीय परीक्षण यादृच्छिकता पर निर्भर करते हैं। परीक्षण निष्कर्ष की वैधता को सीधे यादृच्छिक धारणा की वैधता से जोड़ा गया है। कई सामान्य तौर पर इस्तेमाल किए जाने वाले सांख्यिकीय फ़ार्मुले यादृच्छिक धारणा पर निर्भर होते हैं, नमूना के मानक विचलन का निर्धारण करने के लिए सबसे सामान्य सूत्र सूत्र है: जहां डेटा का मानक विचलन है। हालांकि भारी रूप से इस्तेमाल किया जाता है, इस फॉर्मूला का उपयोग करने के परिणाम कोई भी मूल्य नहीं हैं जब तक कि यादृच्छिक धारणा धारण न हो। बेरोजगार डेटा के लिए, डिफ़ॉल्ट मॉडल है यदि डेटा यादृच्छिक नहीं हैं, तो यह मॉडल गलत और अमान्य है, और मानकों के लिए अनुमान (जैसे कि निरंतर) अनावश्यक और अमान्य हो जाते हैं संक्षेप में, यदि विश्लेषक यादृच्छिकता की जांच नहीं करता है, तो कई सांख्यिकीय निष्कर्षों की वैधता संदिग्ध हो जाती है। इस प्रकार की यादृच्छिकता की जांच करने का एक उत्कृष्ट तरीका है। टाइम सीरीज़ विश्लेषण के लिए औपचारिक मूविंग औसत एआरएमए (पी, क्यू) मॉडल - भाग 2 में हमने ऑर्डर पी के ऑटोरेग्रेसिव मॉडल को माना, जिसे एआर (पी) आदर्श। हमने इसे वित्तीय समय श्रृंखला में अतिरिक्त सीरियल सहसंबंध की व्याख्या करने के प्रयास में यादृच्छिक चलने वाले मॉडल के विस्तार के रूप में पेश किया। आखिरकार हमने एहसास किया कि यह अमेज़ॅन इंक (एएमजेडएन) और एसएम्पपी 500 अमेरिकी इक्विटी इंडेक्स के समापन मूल्यों में सही ढंग से सभी आत्म-सम्बन्धों को हासिल करने के लिए पर्याप्त रूप से लचीला नहीं था। इसके लिए प्राथमिक कारण यह है कि इन दोनों संपत्तियों को सशर्त रूप से हेरोरोस्केडस्टिक है। जिसका अर्थ है कि वे अस्थायी हैं और विभिन्न विचरण या अस्थिरता क्लस्टरिंग की अवधि हैं, जो एआर (पी) मॉडल द्वारा ध्यान में नहीं आते हैं। भविष्य के लेखों में हम आखिरकार ऑटोरेग्रेसिव इंटीग्रेटेड मूविंग एवरल (एआरआईएएए) के मॉडल के साथ-साथ एआरसीएच और गर्च परिवारों के सशर्त रूप से प्रतिकूल मॉडल तैयार करेंगे। ये मॉडल हमें परिसंपत्ति की कीमतों की भविष्यवाणी पर हमारे पहले यथार्थवादी प्रयासों के साथ प्रदान करेंगे इस लेख में, हालांकि, हम एमए (क्यू) के रूप में जाने वाले ऑर्डर क्यू मॉडल के मूविंग एवरेज को पेश करने जा रहे हैं। यह अधिक सामान्य एआरएमए मॉडल का एक घटक है और इस तरह हमें आगे बढ़ने से पहले इसे समझने की जरूरत है। मैं अत्यधिक सलाह देता हूं कि यदि आपने ऐसा नहीं किया है, तो टाइम सीरीज़ विश्लेषण संग्रह में पिछले लेख पढ़ा। वे सभी यहां मिल सकते हैं। मूविंग एवरेज (एमए) ऑर्डर के मॉडल q ए मूविंग एवरल मॉडल ऑटोरेग्रेसिव मॉडल के समान है, सिवाय इसके कि पिछली बार सीरीज वैल्यू के रैखिक संयोजन होने के बजाय, यह पिछले सफ़ेद शोर शब्दों का एक रैखिक संयोजन है। Intuitively, इसका मतलब यह है कि एमए मॉडल इस तरह के यादृच्छिक सफेद शोर मॉडल के प्रत्येक वर्तमान मूल्य पर सीधे झटके देखता है। यह एआर (पी) मॉडल के विपरीत है, जहां सफेद शोर झटके परोक्ष रूप से केवल देखा जाता है श्रृंखला के पिछले शब्दों पर प्रतिगमन के माध्यम से एक महत्वपूर्ण अंतर यह है कि एमए मॉडल केवल किसी भी विशेष एमए (क्यू) मॉडल के लिए अंतिम क्यू आघातों को देखेगा, जबकि एआर (पी) मॉडल सभी पूर्व झटके को ध्यान में रखेगा, यद्यपि कमजोर तरीके से कमजोर तरीके से। गणितीय रूप से परिभाषा, एमए (क्यू) एक रेखीय प्रतिगमन मॉडल है और इसी तरह एआर (पी) को संरचित किया जाता है: ऑर्डर के औसत मॉडल को चलाना q एक समय श्रृंखला मॉडल, क्रम q का एक चलती औसत मॉडल है। एमए (क्यू), अगर: आरंभ xt wt बीटा 1 वाइड लॉड्स बीटाक वाई एंड इफेक्ट्स ई (डब्ल्यूटी) 0 और विचरण सिग्मा 2 के साथ सफेद शोर। यदि हम पिछड़े बदलाव ऑपरेटर पर विचार करते हैं (पिछले लेख देखें) तो हम इसके बाद के संस्करण के रूप में एक फ़ंक्शन PHI के रूप में दोबारा लिख सकते हैं: आरंभ xt (1 बीटा 1 बीटा 2 2 एलडीओट बीटाक्यू क्यू) wt phiq () wt end हम बाद के लेखों में फ़ंक्शन दूसरा ऑर्डर गुण एआर (पी) के साथ-साथ एमए (क्यू) प्रक्रिया का मतलब शून्य है। यह देखने के लिए आसान है कि इसका अर्थ केवल श्वेत शोर शब्दों का एक साधन है, जो कि खुद शून्य हैं। टेक्स्ट एन्स्पेस mux E (xt) योग E (wi) 0 अंत शुरू टेक्स्ट एन्स्पेस सिग्मा 2 डब्ल्यू (1 बीटा 21 एलडीओट्स बीटा 2 बी) एंड टेक्स्ट एस्प्सेज़ रॉक बाएं 1 टेक्स्ट एस्प्ले प्लेस कश्मीर 0 बीटाई बीटा बीटा एसक्यूबी बीटा 2आई टेक्स्ट एस्पेस कश्मीर 1, एलडीट्स, क्यू 0 टेक्स्ट एसएसपीएएस K जीटी q एंड एंड जहां बीटा 1 था। अब हम कुछ सिम्युलेटेड डेटा जनरेट करने जा रहे हैं और कोरल्रोग्राम बनाने के लिए इसका इस्तेमाल करते हैं। यह रॉक के लिए ऊपर के सूत्र को कुछ अधिक ठोस बना देगा। सिमुलेशन और कोरल्रोग्राम हम एमए (1) प्रक्रिया से शुरू करते हैं। यदि हम बीटा 1 0.6 सेट करते हैं तो हम निम्नलिखित मॉडल प्राप्त करते हैं: जैसा कि पिछले लेख में एआर (पी) मॉडलों के साथ हम इस तरह की श्रृंखला को अनुकरण करने के लिए आर का उपयोग कर सकते हैं और फिर कोरल्रोग्राम को साजिश कर सकते हैं। चूंकि हमने पिछले समय श्रृंखला विश्लेषण लेख श्रृंखला में कई अभ्यास किए थे, इसलिए मैं इसे पूर्ण रूप से विभाजित करने के बजाय आर कोड लिखूंगा: उत्पादन निम्नानुसार है: जैसा कि हम उपरोक्त में rhok के लिए सूत्र में देखा था , के लिए k gt q, सभी autocorrelations शून्य होना चाहिए क्यू 1 के बाद से, हमें कश्मीर में एक महत्वपूर्ण चोटी दिखाई देनी चाहिए और इसके बाद उसके बाद की महत्वपूर्ण चोटियों को देखना चाहिए। हालांकि, नमूनाकरण पूर्वाग्रह के कारण हमें नमूना ऑटोोकॉरेलेशन प्लॉट पर 5 (मामूली) महत्वपूर्ण चोटियों को देखने की उम्मीद करनी चाहिए। इस मामले में Correlogram हमें दिखाता है ठीक है। हमारे पास K1 में एक महत्वपूर्ण चोटी है और फिर K4 के अलावा क्षुद्र चोटियों को छोड़कर, कि 4 को छोड़कर जहां हमारे पास मामूली महत्वपूर्ण शिखर है वास्तव में, यह देखने का एक उपयोगी तरीका है कि क्या एमए (क्यू) मॉडल उचित है या नहीं। किसी विशेष श्रृंखला के कोरल्रोग पर एक नज़र डालने से हम देख सकते हैं कि कितने अनुक्रमिक गैर शून्य मौजूद हैं। यदि क्यू ऐसे झूठ मौजूद हैं तो हम वैध रूप से एक विशेष श्रृंखला के लिए एक एमए (क्यू) मॉडल फिट करने का प्रयास कर सकते हैं। चूंकि हमारे एमए (1) प्रक्रिया के हमारे सिम्युलेटेड डाटा के सबूत हैं, अब वे हमारे सिमेटेड डेटा में एमए (1) मॉडल की कोशिश करने और फिट करने जा रहे हैं। दुर्भाग्य से, आर में आटोमैरेसिव मॉडल आर कमांड के बराबर एमए कमांड नहीं है। इसके बजाय, हमें अधिक सामान्य अरिआ कमांड का इस्तेमाल करना चाहिए और ऑटोरेग्रेसिव और एकीकृत घटकों को शून्य पर सेट करना होगा। हम इसे 3-वेक्टर बनाकर और पहले दो घटकों (क्रमशः और एकीकृत पैरामीटर, क्रमशः) को शून्य से सेट करते हैं: हम अरिआआइम से कुछ उपयोगी आउटपुट प्राप्त करते हैं। सबसे पहले, हम देख सकते हैं कि पैरामीटर को टोपी 0.602 के रूप में अनुमानित किया गया है, जो कि बीटा 0.6 के सही मूल्य के बहुत करीब है। दूसरे, मानक त्रुटियों को हमारे लिए पहले से ही गणना की जाती है, जिससे विश्वास अंतराल की गणना करने के लिए इसे सरल बनाया जाता है। तीसरा, हमें अनुमानित विचरण, लॉग-संभावना और अकेईक सूचना मानदंड (मॉडल तुलना के लिए आवश्यक) प्राप्त होता है। अरिमा और एआर के बीच का मुख्य अंतर यह है कि अरिमा एक अंतरार्धक शब्द का अनुमान है क्योंकि यह श्रृंखला के माध्य मूल्य का घटाना नहीं करता है। इसलिए हमें अरिआ आदेश का उपयोग करते हुए पूर्वानुमानों को पूरा करते समय सावधानी बरतने की आवश्यकता है। ठीक बाद में इस बिंदु पर वापस जाएँ एक त्वरित जांच के रूप में टोपी के लिए आत्मविश्वास अंतराल की गणना करने जा रहे थे: हम देख सकते हैं कि 95 आत्मविश्वास अंतराल में बीटा 0.6 का सही पैरामीटर मूल्य है और इसलिए हम मॉडल को एक अच्छी फिट मान सकते हैं। स्पष्ट रूप से यह उम्मीद की जानी चाहिए क्योंकि हम पहली बार डेटा को सिम्युलेटेड करना चाहते हैं। अगर हम बीटा 1 से -0.6 के संकेत को संशोधित करते हैं तो चीजें कैसे बदलती हैं। हम एक ही विश्लेषण करते हैं: आउटपुट इस प्रकार है: हम देख सकते हैं कि हमारे पास 1 का महत्वपूर्ण है कोरल्रोग में चोटी, सिवाय इसके कि यह नकारात्मक सहसंबंध दिखाता है, जैसा कि एक एमए (1) मॉडल से नकारात्मक पहले गुणांक के साथ उम्मीद की जाती है एक बार फिर कश्मीर से बाहर सभी चोटियों को तुच्छ है। एक एमए (1) मॉडल को फिट करें और पैरामीटर का अनुमान लगाएं: टोपी -0.730, जो कि बीटा 1 -0.6 का छोटा अनुमान है। अंत में, विश्वास अंतराल की गणना करने देता है: हम देख सकते हैं कि beta1-0.6 का सही पैरामीटर मान 95 आत्मविश्वास अंतराल के भीतर समाहित है, जिससे हमें एक अच्छा मॉडल फिट के सबूत मिलते हैं। एमए (3) प्रक्रिया के लिए एक ही प्रक्रिया के माध्यम से चलें। इस समय हमें कश्मीर में महत्वपूर्ण चोटियों की उम्मीद है, और कश्मीर 3 के लिए क्षीण चोटें। हम निम्नलिखित गुणांकों का उपयोग करने जा रहे हैं: बीटा 1 0.6, बीटा 2 0.4 और बीटा 3 0.2। इस मॉडल से एमए (3) प्रक्रिया को अनुकरण करने देता है Ive ने इस अनुकरण में यादृच्छिक नमूनों की संख्या 1000 में बढ़ा दी है, जो कि वास्तविक आत्मिकरण संरचना को देखने के लिए आसान बनाता है, मूल श्रृंखला को व्याख्या करने के लिए कठिन बनाने की कीमत पर: आउटपुट निम्नानुसार है: जैसा कि उम्मीद है कि पहले तीन चोटियां महत्वपूर्ण हैं । हालांकि, ऐसा चौथा है लेकिन हम वैध रूप से यह सुझाव दे सकते हैं कि यह नमूनाकरण पूर्वाग्रह के कारण हो सकता है क्योंकि हमें उम्मीद है कि 5 चोटियों में से कुछ महत्वपूर्ण हैं जो कि क्यूके से परे महत्वपूर्ण हैं। अब पैरामीटर का प्रयास करने और अनुमान लगाने के लिए डेटा में एक एमए (3) मॉडल फिट करने देता है: अनुमान है कि टोपी 0.544, टोपी 0.345 और टोपी 0.2 9 9, क्रमशः बीटा 10.6, बीटा 20.4 और बीटा 30.3 के सही मूल्यों के करीब हैं। हम संबंधित मानक त्रुटियों का उपयोग करके विश्वास अंतराल भी बना सकते हैं: प्रत्येक मामले में 95 आत्मविश्वास के अंतराल में सही पैरामीटर मान होते हैं और हम यह निष्कर्ष निकाल सकते हैं कि हमारे एमए (3) मॉडल के साथ हमारे पास एक अच्छा फिट है, जैसा कि उम्मीद की जानी चाहिए। भाग 1 में वित्तीय डेटा हमने अमेज़ॅन इंक (एएमजेडएन) और एसएम्पपी 500 अमेरिकी इक्विटी इंडेक्स को देखा। हमने एआर (पी) मॉडल को दोनों में फिट किया और पाया कि मॉडल सीरियल सहसंबंध की जटिलता को विशेष रूप से कैप्चर करने में असमर्थ है, खासकर एसएम्पपी 500 के कलाकारों में, जहां लंबे समय तक स्मृति प्रभाव उपस्थित होने लगता है। मैं कीमतों और आत्मसभापति के लिए फिर से चार्ट का प्लॉट नहीं करता, बजाय मैं बीमार आपको पिछली पोस्ट में भेजता हूं। अमेज़ॅन इंक। (एएमजेडएन) एमए (क्यू) के मॉडल के चयन को एएमजेडएन में फिट करने की कोशिश करते हैं, अर्थात् क्यू में भाग 1 के रूप में, एएमजेडएन के लिए दैनिक कीमतों को डाउनलोड करने के लिए क्वांटमोड का उपयोग करें और फिर उन्हें समापन मूल्यों की एक लॉग रिटर्न स्ट्रीम में कनवर्ट करें: अब जब हमारे पास लॉग रिटर्न स्ट्रीम होता है तो हम एमए (1), एमए में फिट होने के लिए अरिआ कमांड का उपयोग कर सकते हैं (2) और एमए (3) मॉडल और फिर प्रत्येक के पैरामीटर का अनुमान एमए (1) के लिए हमारे पास: हम दैनिक लॉग रिटर्न और फिट मॉडल के अवशेषों को साजिश कर सकते हैं: ध्यान दें कि हमारे पास कुछ महत्वपूर्ण चोटियां हैं जो कि lags k2, k11, k16 और k18 पर हैं, जो दर्शाता है कि एमए (1) मॉडल AMZN लॉग रिटर्न के व्यवहार के लिए एक अच्छा फिट होने की संभावना नहीं है, क्योंकि यह सफेद शोर की प्राप्ति की तरह नहीं दिखता है। चलो एक एमए (2) मॉडल का प्रयास करें: बीटा गुणांकों के लिए अनुमान के दोनों नकारात्मक हैं। एक बार फिर अवशिष्ट अवयवों को आज़माएं: हम देख सकते हैं कि पहले कुछ गलतियों में करीब शून्य आत्मसम्मान है। हालांकि, हमारे पास पाँच मामूली महत्वपूर्ण चोटियां हैं जो कि केएक्स, के 16, के 1 9, के 25 और के 27 पर हैं। यह सुझाव है कि एमए (2) मॉडल बहुत सारे आत्म-सम्बन्धों पर कब्जा कर रहा है, लेकिन लंबे समय तक मेमोरी के सभी प्रभाव नहीं। एक एमए (3) मॉडल के बारे में कैसे एक बार फिर, हम अवशेषों को साजिश कर सकते हैं: एमए (3) अवशिष्ट साजिश एमए (2) मॉडल के समान दिखती है। यह आश्चर्य की बात नहीं है, जैसा कि एक मॉडल के लिए एक नया पैरामीटर जोड़ रहे थे जो प्रतीत होता है कि बहुत कम संबंधों में सहसंबंध हैं, लेकिन लंबे समय तक अवधि के संबंध में इसका अधिक असर नहीं होता। यह सब सबूत इस तथ्य के सूचक है कि एक एमए (क्यू) मॉडल अलगाव में सभी सीरियल सहसंबंध को समझाते हुए उपयोगी साबित नहीं हो सकता है। कम से कम AMZN के लिए SampP500 यदि आप याद करते हैं, भाग 1 में हमने देखा कि पहला आदेश भिन्न दैनिक लॉग रिटर्न एसएम्पपी 500 की संरचना में कई कमजोरियों पर कई महत्वपूर्ण चोटियां हैं, जो कि लघु और लंबी दोनों हैं इसमें सशर्त heteroskedasticity (यानी अस्थिरता क्लस्टरिंग) और लंबी स्मृति प्रभाव दोनों के प्रमाण प्रदान किए गए थे। यह हमें यह निष्कर्ष निकालना है कि एआर (पी) मॉडल वर्तमान में सभी आत्म-सम्बन्धों को हासिल करने के लिए अपर्याप्त था। जैसा कि हमने एमए (क्यू) मॉडल के ऊपर देखा है, फिट मॉडल के अवशेषों में पहले क्रम के लिए अलग-अलग दैनिक लॉग कीमत श्रृंखला को अतिरिक्त धारावाहिक सह-संबंध हासिल करने के लिए अपर्याप्त था। अब हम एसएपीपी 500 के लिए एमए (क्यू) मॉडल फिट करने का प्रयास करेंगे। कोई यह पूछ सकता है कि हम यह क्यों कर रहे हैं अगर हम जानते हैं कि यह एक अच्छी फिट होने की संभावना नहीं है। यह अच्छा प्रश्न है। इसका उत्तर यह है कि हमें यह देखने की जरूरत है कि यह कैसे सही नहीं है, क्योंकि यह अंतिम प्रक्रिया है जिसका हम पालन करेंगे, जब हम अधिक परिष्कृत मॉडल में आएंगे, जो संभवतः व्याख्या करने में कठिन हैं आइए हम डेटा प्राप्त करने और इसे पहले क्रम में बदलकर शुरू करते हैं, पिछले आलेख के रूप में लॉग-रेमीमिक रूप से रूपांतरित रूप से दैनिक क्लोज़िंग की कीमतों की भिन्न श्रेणियों को बदलते हैं: अब हम एमए (1), एमए (2) और एमए (3) मॉडल को फिट करने जा रहे हैं श्रृंखला, जैसा हमने एएमजेडएन के लिए किया था। हम एमए (1) से शुरू करते हैं: इस फिट मॉडल के अवशेषों की एक साजिश बनाते हैं: पहला महत्वपूर्ण चोटी K2 पर होता है, लेकिन इसमें बहुत अधिक कश्मीर में होता है। यह स्पष्ट रूप से सफेद शोर का एहसास नहीं है और इसलिए हमें एमए (1) मॉडल को SampP500 के लिए संभावित अच्छी फिट के रूप में अस्वीकार करना चाहिए। क्या स्थिति एमए (2) के साथ सुधार करती है (2) एक बार फिर, इस फिट एमए (2) मॉडल के अवशेषों की एक साजिश बना दे: जबकि कि 2 में चरम हो गए हैं (जैसा कि उम्मीद की जाती है), हम अभी भी महत्वपूर्ण चोटियों के साथ शेष अवशेषों में कई बार लंबी अवधि एक बार फिर, हम पाते हैं कि एमए (2) मॉडल एक अच्छा फिट नहीं है। हमें एमए (2) के लिए की 3 से कम सीरियल सह-संबंध देखने के लिए, एमए (3) मॉडल के लिए अपेक्षा करनी चाहिए, लेकिन एक बार फिर हमें उम्मीद है कि आगे की गड़गड़ाहट में कोई कमी न हो। अंत में, हम इस फिट एमए (3) मॉडल के अवशेषों की एक भूखंड बनाते हैं: यह ठीक है कि हम अवशिष्टों के कोरल्रोग्राम में क्या देखते हैं। इसलिए एमए (3), ऊपर के अन्य मॉडल के साथ, SampP500 के लिए एक अच्छी फिट नहीं है। अगले कदम हम अब विस्तार में दो प्रमुख समय श्रृंखला मॉडल की जांच कर रहे हैं, अर्थात् ऑर्डर पी, एआर (पी) के ऑट्रेसिव मॉडल और फिर ऑर्डर ऑफ एवर ऑफ क्यू, एमए (क्यू)। हमने देखा है कि इक्विटी और इंडेक्स के रोज़गार लॉग के मूल्यों के पहले क्रम के अवशेषों में कुछ आत्म-सम्बन्ध दूर करने के लिए वे दोनों सक्षम हैं, लेकिन अस्थिरता क्लस्टरिंग और लंबी मेमरी प्रभाव जारी रहती हैं। यह अंततः इन दोनों मॉडलों के संयोजन, जैसे क्रम पी, क्यू, एआरएमए (पी, क्यू) के ऑटोरेग्रेसिव मूविंग एक्शन का ध्यान देने के लिए समय है, यह देखने के लिए कि क्या इससे कोई और स्थिति में सुधार होगा। हालांकि, हमें पूरी चर्चा के लिए अगले लेख तक इंतजार करना होगा, इसके बारे में जानने के लिए नीचे क्लिक करें। इस वेबसाइट पर निहित जानकारी व्यक्तिगत लेखकों की राय है, जो कि उनके व्यक्तिगत अवलोकन, शोध और अनुभव के वर्षों पर आधारित है। प्रकाशक और उसके लेखकों ने निवेश सलाहकार, वकील, सीपीए या अन्य वित्तीय सेवा पेशेवरों को पंजीकृत नहीं किया है और कानूनी, कर, लेखा, निवेश सलाह या अन्य पेशेवर सेवाओं को प्रस्तुत नहीं करते हैं। इस वेब साइट की पेशकश की जानकारी केवल सामान्य शिक्षा है क्योंकि प्रत्येक व्यक्ति वास्तविक स्थिति अलग है क्योंकि पाठक को अपने स्वयं के व्यक्तिगत सलाहकार की तलाश करनी चाहिए न तो लेखक और न ही प्रकाशक किसी भी गलती या चूक के लिए कोई दायित्व या ज़िम्मेदारी ग्रहण करता है और इस साइट पर दी गई जानकारी के कारण प्रत्यक्ष या अप्रत्यक्ष रूप से होने वाली क्षति या आरोपों के संबंध में किसी भी व्यक्ति या इकाई को न ही देयता या उत्तरदायित्व होगा। अपने जोखिम पार इस्तेमाल करें। इसके अतिरिक्त, इस वेबसाइट को विज्ञापनों, सहबद्ध कार्यक्रमों या अन्यथा के माध्यम से उल्लिखित कंपनियों से वित्तीय क्षतिपूर्ति प्राप्त हो सकती है। इस वेबसाइट पर दिखाए जाने वाले विज्ञापनदाताओं के मूल्य और प्रस्ताव अक्सर बिना सूचना के, अक्सर बदलते हैं। जब हम समय और सटीक जानकारी बनाए रखने का प्रयास करते हैं, तो प्रस्ताव विवरण पुराना हो सकता है। आगंतुकों को उनसे भाग लेने से पहले ऐसी किसी भी प्रस्ताव की शर्तों को सत्यापित करना चाहिए। लेखक और उसके प्रकाशक तीसरे पक्ष की सामग्री, उत्पादों और सेवाओं के बारे में सूचना को अद्यतन करने और अस्वीकार करने की ज़िम्मेदारी को अस्वीकार करते हैं, जिसमें इस साइट पर हाइपरलिंक्स और विज्ञापन के माध्यम से प्रवेश किया जाता है। एक रिमा का अर्थ है ऑटोरेग्रेसिव इंटीग्रेटेड मूविंग औसत मॉडल। Univariate (एकल वेक्टर) ARIMA एक भविष्यवाणी तकनीक है जो एक श्रृंखला के भविष्य के मूल्यों को पूरी तरह से अपनी जड़ता पर आधारित करती है। इसका मुख्य अनुप्रयोग अल्पावधि भविष्यवाणी के क्षेत्र में है जिसमें कम से कम 40 ऐतिहासिक डेटा अंक की आवश्यकता होती है। जब आपका डेटा न्यूनतम या अधिक समय के साथ एक स्थिर या सुसंगत पैटर्न दिखाता है, यह सबसे अच्छा काम करता है। कभी-कभी बॉक्स-जेनकिंस (मूल लेखकों के बाद), एआरआईएए आमतौर पर घातीय चिकनाई तकनीकों से बेहतर होता है जब डेटा काफी लंबा होता है और पिछले अवलोकन के बीच के संबंध स्थिर होते हैं यदि डेटा छोटा या अत्यधिक अस्थिर है, तो कुछ चिकनाई विधि बेहतर प्रदर्शन कर सकती है यदि आपके पास कम से कम 38 डेटा बिंदु नहीं हैं, तो आपको एआरआईएए की तुलना में कुछ अन्य विधि पर विचार करना चाहिए। एआरआईएमए पद्धति को लागू करने में पहला कदम है, कामकाज की जांच करना। प्राधान्यता का मतलब है कि श्रृंखला समय के साथ काफी स्थिर स्तर पर रहती है। यदि एक प्रवृत्ति सबसे अधिक आर्थिक या व्यावसायिक अनुप्रयोगों के रूप में मौजूद है, तो आपका डेटा स्थिर नहीं है डेटा को समय के साथ अपने उतार-चढ़ाव में लगातार भिन्नता दिखाना चाहिए। यह आसानी से एक श्रृंखला के साथ देखा जाता है जो भारी मौसमी और तेज दर से बढ़ रहा है। ऐसे मामले में, मौसम के दौरान उतार-चढ़ाव समय के साथ अधिक नाटकीय हो जाएगा। बिना इन अधिकारियों की स्थिति की पूर्ति के लिए, प्रक्रिया से जुड़े कई गणनाओं की गणना नहीं की जा सकती। अगर डेटा का एक ग्राफ़िकल प्लॉट nonstationarity इंगित करता है, तो आपको श्रृंखला में अंतर करना चाहिए। अंतरफलक एक अस्थायी श्रृंखला को एक स्थिर एक को बदलने का एक शानदार तरीका है। यह पिछले एक से वर्तमान अवधि में अवलोकन को घटाकर किया जाता है यदि यह परिवर्तन केवल एक बार श्रृंखला में किया जाता है, तो आप कहते हैं कि डेटा पहले अलग किया गया है। यदि आपकी श्रृंखला काफी स्थिर दर से बढ़ रही है तो यह प्रक्रिया प्रवृत्ति को समाप्त कर देती है। अगर यह बढ़ती दर से बढ़ रहा है, तो आप उसी प्रक्रिया को लागू कर सकते हैं और डेटा को फिर से बदल सकते हैं। आपका डेटा तब दूसरा अंतर होगा स्व-सम्बन्ध संख्यात्मक मान हैं जो बताते हैं कि समय के साथ एक डेटा श्रृंखला स्वयं कैसे संबंधित होती है। अधिक सटीक, यह मापता है कि समय के साथ-साथ निर्दिष्ट अवधि के आंकड़ों पर कितना दृढ़ता से डेटा समय-समय पर एक-दूसरे से सहसंबंधित होता है। अलग-अलग अवधि की संख्या को आमतौर पर अंतराल कहा जाता है उदाहरण के लिए, अंतराल 1 के उपायों पर एक स्व-पारस्परिक संबंध है कि श्रृंखला 1 अवधि अलग-अलग श्रृंखलाओं में एक दूसरे के साथ सहसंबंध रखता है। अंतराल पर एक स्व-पारस्परिक संबंध यह दर्शाता है कि कैसे श्रृंखला के दौरान दो अवधि अलग-अलग सम्मिलित होते हैं। ऑटोकॉरेलेशन 1 से -1 तक हो सकती है 1 के करीब का मूल्य उच्च सकारात्मक संबंध को इंगित करता है, जबकि 1 के करीब का मान एक उच्च नकारात्मक संबंध दर्शाता है। ये उपायों को अक्सर चित्रलेखीय भूखंडों के माध्यम से मूल्यांकन किया जाता है जिन्हें क्रोनरलाग्राम कहा जाता है। एक अलग श्रृंखला के लिए दी गई श्रृंखला के लिए एक संबंधरेखा प्लॉट्स ऑटो-सहसंबंध मूल्य। इसे आत्मनिर्णय समारोह के रूप में संदर्भित किया जाता है और एआरआईएमए विधि में बहुत महत्वपूर्ण है। एआरआईएआईए पद्धति एक स्थिर समय श्रृंखला में आंदोलनों का वर्णन करने का प्रयास करती है जिसे ऑटोरेग्रेसिव और चलती औसत मापदंड कहा जाता है। इन्हों को एआर पैरामीटर (ऑटरेगाजेसिव) और एमए पैरामीटर (चलती औसत) कहा जाता है। केवल 1 पैरामीटर के साथ एक एआर मॉडल लिखा जा सकता है। एक्स (टी) ए (1) एक्स (टी -1) ई (टी) जहां जांच के तहत एक्स (टी) समय श्रृंखला ए (1) क्रम 1 एक्स (टी -1) के ऑटोरिएरेजिव पैरामीटर समय सीमा 1 अवधि ई (टी) मॉडल की त्रुटि शब्द इसका मतलब यह है कि किसी भी मान X (टी) को उसके पिछले मान, एक्स (टी -1) के कुछ फ़ंक्शन के साथ, और कुछ अपूर्वनीय यादृच्छिक त्रुटि, ई (टी) द्वारा समझाया जा सकता है। अगर ए (1) का अनुमानित मूल्य 30.30 था, तो श्रृंखला का वर्तमान मान 1 अवधि पहले अपने मूल्य के 30 से संबंधित होगा। बेशक, श्रृंखला केवल एक अतीत मूल्य से अधिक से संबंधित हो सकती है उदाहरण के लिए, एक्स (टी) ए (1) एक्स (टी -1) ए (2) एक्स (टी -2) ई (टी) यह इंगित करता है कि श्रृंखला का वर्तमान मान दो तत्काल पूर्ववर्ती मानों का संयोजन है, एक्स (टी -1) और एक्स (टी -2), प्लस कुछ यादृच्छिक त्रुटि ई (टी) हमारा मॉडल अब ऑर्डर करने वाला मॉडल है। 2. औसत मॉडल चलाना: एक दूसरे प्रकार के बॉक्स-जेनकिंस मॉडल को चलती औसत मॉडल कहा जाता है। हालांकि ये मॉडल एआर मॉडल के समान दिखते हैं, उनके पीछे की अवधारणा काफी अलग है। औसत मापदंडों को चलाना संबंधित अवधि के साथ ही एक्स (टी -1), एक्स (एक्स -1), एक्स (टी -1) की तुलना में पिछले समय की अवधि में हुई यादृच्छिक त्रुटियों, ई (टी -1), ई (टी -2) टी -2), (Xt-3) के रूप में autoregressive दृष्टिकोण में। एक एमए अवधि के साथ चलती औसत मॉडल निम्न प्रकार से लिखा जा सकता है। एक्स (टी) - बी (1) ई (टी -1) ई (टी) शब्द बी (1) को एमए ऑफ ऑर्डर 1 कहा जाता है। पैरामीटर के सामने नकारात्मक चिन्ह का उपयोग केवल सम्मेलन के लिए किया जाता है और आमतौर पर इसे प्रिंट किया जाता है अधिकांश कंप्यूटर प्रोग्रामों से स्वत: मैटिअल आउट करें उपरोक्त मॉडल केवल कहते हैं कि एक्स (टी) का कोई भी मान पिछली अवधि, ई (टी -1), और वर्तमान त्रुटि अवधि, ई (टी) में यादृच्छिक त्रुटि से सीधे संबंधित है। ऑटोरेग्रेसिव मॉडल के मामले में, चलती औसत मॉडल को विभिन्न संयोजनों को कवर करने और औसत लंबाई बढ़ने के लिए उच्चतर ऑर्डर संरचनाओं तक बढ़ाया जा सकता है। एआरआईएआईए पद्धति भी मॉडल को बनाया जा सकता है जिसमें दोनों आटोमैरेजिव और चलती औसत मापदंडों को एक साथ शामिल किया जा सकता है। इन मॉडलों को अक्सर मिश्रित मॉडल के रूप में जाना जाता है। यद्यपि यह एक और अधिक जटिल पूर्वानुमान उपकरण के लिए बनाता है, तो संरचना वास्तव में इस श्रृंखला को बेहतर ढंग से अनुकरण कर सकती है और अधिक सटीक पूर्वानुमान प्रदान कर सकती है। शुद्ध मॉडल यह दर्शाते हैं कि संरचना में एआर या एमए पैरामीटर शामिल हैं - दोनों नहीं। इस दृष्टिकोण से विकसित किए गए मॉडल को आमतौर पर एआरआईएए मॉडल कहा जाता है क्योंकि वे ऑटोरेग्रेसिव (एआर), एकीकरण (आई) के संयोजन का उपयोग करते हैं - पूर्वानुमान का निर्माण करने के लिए डिस्ट्रिक्शंस की रिवर्स प्रक्रिया का संदर्भ देते हैं, और औसत (एमए) ऑपरेशन चलती है एआरआईएएमए मॉडल को आमतौर पर एआरआईएए (पी, डी, क्यू) कहा जाता है। यह ऑटरेरेसेसिव घटकों (पी), ऑर्गेरिंग ऑपरेटर (डी) की संख्या, और चलती औसत अवधि का उच्चतम क्रम का प्रतिनिधित्व करता है। उदाहरण के लिए, एआरआईएए (2,1,1) का अर्थ है कि आपके पास एक दूसरा ऑर्डर ऑटरेहेडिव मॉडल है, जिसमें पहले ऑर्डर वाले ऑप्शन वाले ऑप्शन वाले ऑर्डर शामिल हैं, जिनकी सीरीज़ एक बार एकतरफापन को प्रेरित करती है। सही विशिष्टता को चुनना: शास्त्रीय बॉक्स-जेनकिंस में मुख्य समस्या यह तय करने की कोशिश कर रही है कि कौन से एआरआईएमए विनिर्देश का उपयोग करना है - i. e. कितने एआर और या एमए पैरामीटर शामिल करने के लिए यह बहुत अधिक बॉक्स-जेनकिंग्स 1 9 76 की पहचान प्रक्रिया को समर्पित था। यह नमूना स्वत: पारस्परिक और आंशिक स्वाय-पूर्णता कार्यों के ग्राफ़िकल और संख्यात्मक eval-uation पर निर्भर था। ठीक है, आपके बुनियादी मॉडल के लिए, कार्य बहुत मुश्किल नहीं है प्रत्येक में स्वत: पारस्परिक कार्य है जो एक निश्चित तरीके से दिखते हैं। हालांकि, जब आप जटिलता में जाते हैं, पैटर्न बहुत आसानी से पता नहीं चला जाता है। मामलों को और अधिक कठिन बनाने के लिए, आपका डेटा केवल अंतर्निहित प्रक्रिया का एक नमूना दर्शाता है इसका अर्थ है कि नमूनाकरण त्रुटियां (आउटलीयर, मापन त्रुटि, आदि) सैद्धांतिक पहचान प्रक्रिया को विकृत कर सकती हैं। यही वजह है कि पारंपरिक एआरआईएएमए मॉडलिंग एक विज्ञान की बजाय एक कला है।
Comments
Post a Comment