وهناك طريقة بسيطة وعامة لملء البيانات المفقودة، إذا كان لديك تشغيل البيانات كاملة، هو استخدام الانحدار الخطي. ويقول لديك 1000 يدير من 5 في صف واحد مع عدم وجود عداد المفقودين. إعداد 1000 × 1 متجه y و 1000 × 4 مصفوفة X: الانحدار تعطيك 4 أرقام ب ج د التي تعطي أفضل مباراة ل 1000 صفوف من البيانات الخاصة بك مداش البيانات المختلفة، مختلفة ب ج د. ثم تستخدم هذه b c d لتقدير (التنبؤ، إنتيربولات) مفقود wt0. (بالنسبة للأوزان البشرية، يتوقع إد أبسد أن يكون في جميع أنحاء 14.) (هناك زيليونس من الكتب والأوراق على الانحدار، على جميع المستويات. للاتصال مع الاستيفاء، على الرغم من أنني لا أعرف من أي شخص مقدمة جيدة) ستاتا: البيانات تحليل والبرمجيات الإحصائية نيكولاس J. كوكس، جامعة دورهام، المملكة المتحدة كريستوفر بوم، كلية بوسطن إغن، ما () وحدودها ستاتارسكوس الأمر الأكثر وضوحا لحساب المتوسطات المتحركة هي وظيفة ما () من إغن. ونظرا للتعبير، فإنه يخلق المتوسط المتحرك-بيريود من هذا التعبير. افتراضيا، يؤخذ على النحو 3. يجب أن تكون غريبة. ومع ذلك، كما يشير الإدخال اليدوي، إغن، ما () قد لا تكون مقترنة مع فارليست:. ولهذا السبب وحده، فإنه لا ينطبق على بيانات الفريق. في أي حال، فإنه يقف خارج مجموعة من الأوامر المكتوبة خصيصا لسلاسل زمنية انظر سلسلة زمنية للحصول على التفاصيل. النهج البديلة لحساب المتوسطات المتحركة لبيانات اللوحة، هناك خياران على الأقل. كلاهما يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. هذا هو الكثير يستحق القيام به: ليس فقط يمكنك حفظ نفسك مرارا وتكرارا تحديد متغير لوحة ومتغير الوقت، ولكن ستاتا يتصرف بذكاء إعطاء أي ثغرات في البيانات. 1. اكتب التعريف الخاص بك باستخدام توليد باستخدام مشغلي سلسلة الوقت مثل L. و F.. تعطي تعريف المتوسط المتحرك كحجة إلى بيان توليد. إذا قمت بذلك، فإنك، بطبيعة الحال، لا تقتصر على الوزن المرجح (غير مرجحة) المتوسطات المتحركة المتمركزة المحسوبة بواسطة إغن، ما (). على سبيل المثال، سيتم إعطاء متوسطات متحرکة متساوية الترجيح لثلاث فترات من خلال بعض الأوزان يمكن تحديدها بسهولة: يمكنك، بالطبع، تحديد تعبير مثل سجل (ميفار) بدلا من اسم متغير مثل ميفار. ميزة واحدة كبيرة من هذا النهج هو أن ستاتا تلقائيا يفعل الشيء الصحيح للبيانات لوحة: القيم الرائدة والتخلف يتم العمل بها داخل لوحات، تماما كما يملي المنطق يجب أن تكون. والعيب الأبرز هو أن سطر الأوامر يمكن أن يكون طويلا إذا كان المتوسط المتحرك ينطوي على عدة مصطلحات. مثال آخر هو متوسط متحرك من جانب واحد يعتمد فقط على القيم السابقة. ويمكن أن يكون ذلك مفيدا لتوليد توقعات تكيفية لما يمكن أن يستند إليه المتغير فقط على المعلومات حتى الآن: ما يمكن أن يتنبأ به شخص ما للفترة الحالية استنادا إلى القيم الأربع الماضية، باستخدام مخطط الترجيح الثابت (قد يكون الفارق الزمني 4 فترات (تستخدم عادة مع أوقات الفصول الربع سنوية.) 2. استخدام إغن، مرشح () من سك استخدم مرشح وظيفة إغن المكتوب من المستعمل () من حزمة إغنمور على سك. في ستاتا 7 (تحديث بعد 14 نوفمبر 2001)، يمكنك تثبيت هذه الحزمة التي بعد ذلك مساعدة إغنمور نقاط للتفاصيل على مرشح (). سيتم تقديم المثالين أعلاه (في هذه المقارنة قد يكون نهج التوليد أكثر شفافية، ولكننا سنرى مثالا على العكس في لحظة). يؤدي إلى تأخر سلبي: في هذه الحالة -11 يوسع إلى -1 0 1 أو الرصاص 1، تأخر 0، تأخر 1. و فيسينتس كويف، نومليست آخر، مضاعفة المتخلفة أو العناصر الرائدة المقابلة: في هذه الحالة هذه البنود هي F1.myvar . ميفار و L1.myvar. ويتمثل تأثير خيار التطبيع في قياس كل معامل بمجموع المعاملات بحيث يكون معامل التطبيع (1 1 1) معادلا لمعاملات 13 13 13 و كوف (1 2 1) تطبيع يعادل معاملات 14 12 14 يجب أن تحدد ليس فقط التأخر ولكن أيضا المعاملات. ونظرا لأن إغين، ما () توفر الحالة المرجحة بالتساوي، فإن الأساس المنطقي الرئيسي ل إغين، فيلتر () هو دعم الحالة المرجحة غير المتكافئة، والتي يجب أن تحدد معاملاتها. ويمكن القول أيضا أن إلزام المستخدمين بتحديد المعاملات هو ضغط إضافي قليلا عليهم للتفكير في المعاملات التي يريدون. المبرر الرئيسي لأوزان متساوية هو، ونحن نخمن، والبساطة، ولكن الأوزان متساوية لديها خصائص نطاق التردد رديء، على سبيل المثال الاعتبار واحد فقط. والمثال الثالث أعلاه يمكن أن يكون إما معقدا تماما مثل نهج التوليد. هناك حالات حيث إغن، مرشح () يعطي صياغة أبسط من توليد. إذا كنت ترغب في مرشح ثنائي الحدين لمدة تسعة، والتي يجد علماء المناخ مفيدة، ثم يبدو ربما أقل رهيبة من وأسهل للحصول على الحق من، تماما كما هو الحال مع نهج توليد، إغن، تصفية () يعمل بشكل صحيح مع بيانات لوحة. في الواقع، كما ذكر أعلاه، فإنه يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. نصيحة رسومية بعد حساب المتوسطات المتحركة الخاصة بك، وربما كنت تريد أن ننظر إلى الرسم البياني. الأمر المكتوب المستخدم تسغراف هو الذكية حول تسيت مجموعات البيانات. تثبيته في ما يصل إلى تاريخ ستاتا 7 التي كتبها سك إنست تسغراف. ماذا عن التقسيم الفرعي إذا لم يستفد أي من الأمثلة أعلاه من القيود. في الواقع إغن، ما () لن تسمح إذا كان سيتم تحديدها. أحيانا الناس يريدون استخدام إذا عند حساب المتوسطات المتحركة، ولكن استخدامه هو أكثر تعقيدا قليلا مما هو عليه عادة. ما الذي تتوقعه من المتوسط المتحرك المحسوب إذا كان. دعونا نحدد إمكانيتين: التفسير الضعيف: أنا لا أريد أن أرى أي نتائج للملاحظات المستبعدة. تفسير قوي: أنا لا أريد حتى لك لاستخدام القيم للملاحظات المستبعدة. هنا مثال ملموس. لنفترض كنتيجة لبعض إذا الشرط، الملاحظات 1-42 مدرجة ولكن لا الملاحظات 43 جرا. ولكن المتوسط المتحرك ل 42 سيعتمد، من بين أمور أخرى، على قيمة الملاحظة 43 إذا كان المتوسط يمتد إلى الوراء وإلى الأمام، وهو طوله 3 على الأقل، وسيعتمد بالمثل على بعض الملاحظات 44 وما بعدها في بعض الظروف. تخميننا هو أن معظم الناس سوف تذهب للتفسير الضعيف، ولكن ما إذا كان هذا هو الصحيح، إغن، مرشح () لا يدعم إذا كان أي منهما. يمكنك دائما تجاهل ما كنت دونرسكوت تريد أو حتى تعيين القيم غير المرغوب فيها إلى المفقودين بعد ذلك باستخدام استبدال. ملاحظة حول النتائج المفقودة في نهايات السلسلة لأن المتوسطات المتحركة هي وظائف تأخر و يؤدي، إغن، ما () تنتج مفقودة حيث لا توجد تأخرات و يؤدي في بداية ونهاية السلسلة. وهناك خيار نوميس يجبر على حساب المتوسطات المتحركة الأقصر غير المقوسة للتيول. في المقابل، لا تولد ولا إيجين، تصفية () يفعل، أو يسمح، أي شيء خاص لتجنب النتائج المفقودة. إذا كان أي من القيم المطلوبة للحساب مفقود، فإن هذه النتيجة مفقودة. والأمر متروك للمستخدمين لتحديد ما إذا كانت الجراحة التصحيحية مطلوبة لهذه الملاحظات، ومن المفترض بعد النظر إلى مجموعة البيانات والنظر في أي علم أساسي يمكن جلبه لتحمل. حساب المعدلات المتحركة مع القيم المفقودة مجموعة أوبس 10 أوبس كان 0، الآن 10 t تسيت t متغير الزمن: t، 1 إلى 10 دلتا: 1 وحدة تسموث ما y3 y، w (1 1 1) كانت السلاسة المطبقة (13) x (t-1) 1x (t) x (t1) x (t) 1 x (t) x (t1) x (t2) x (t) y - t (t) تساموث كما هو أفضل ما يمكن في نهايات سلسلة (التي ليست هي نفسها كما علاج حالات الفشل كما 0S، وإلا فإن النتائج المذكورة أعلاه لن يتم الحصول عليها). جيف يمكن تجاوز نتائج - tsmooth - إذا كان لا يريد ذلك. استبدال y3. إذا كان مفقودا (L1.y، F1.y) استبدال y5. إذا كان مفقود (L1.y، L2.y، F1.y، F2.y) على سبيل المثال، L1.y مفقود في بداية سلسلة ذ و F1.y في نهاية المطاف. هذا يعمل مع لوحة البيانات أيضا. بديل مكتوب من قبل المستخدم ل - ssmooth - هو وظيفة - filter - Filter () - من - enmore-. بدلا من ذلك، يرجى توضيح أي طريقة للتعامل مع ينتهي كنت تفضل. عندما أستخدم الدالة تسموث لإنشاء متوسطات متحركة لمدة 2 أو 5 سنوات، تحسب ستاتا هذه المتوسطات المتحركة حتى نهاية السلسلة الزمنية بدلا من التوقف لمدة سنة واحدة (في حالة المتوسط المتحرك لمدة عامين) أو 4 سنوات (في حالة المتوسط المتحرك لمدة 5 سنوات) قبل نهاية السلسلة الزمنية وبالتالي فهي تحسب القيم المفقودة إلى الأمام على أنها صفر. هل تعرف استراتيجية ممكنة لإصلاح هذه المشكلة أنا أحاول إنشاء المتوسطات المتحركة من خلال النظر في تأخر - تأخر 1 والقيم lag2 من المكافآت الفداء. هنا هو الصيغة الحالية (لاغ - lag2) (lag2 - lag3). ومع ذلك، لا يتم تخزين القيمة الحالية سيكنسيالي في الصفوف على التحديث. معنى، عندما أجد row4 القيمة الحالية مفقود، وأنا باستخدام هذه الصيغة للتوصل إلى المكافآت row4. الآن، row4 - gt الحالي 100 عند الانتقال إلى row5 - المكافآت الجديدة المحسوبة في الصف 4 غير متوفرة. lag1 - gt row4gt كيرنت 0 (أعتقد أن القيم المتخلفة ليست ديناميكية) داتا فتيست سيت v10 بواسطة فيد معرف المجموعة lagred1 لاغ (newredemption1) lag2red1 lag2 (نيوريدمبتيون) lag3red1 lag3 (نيوريدمبتيون) إكسكتدينكريبتس (lagred1 (lagred1 lag2red1)) - lag2red1 بريفيوسريدمغروث lagred1 - lag2red1) (lag2red1 - lag3red1) كيرنت كيرنت (إكسكتدينكريبتس بريفيوسريدمغروث) من شأنه أن يساعد حقا على فهم ما كنت تحاول إذا قمت بتوفير بعض البيانات في شكل داتاستيب للإدخال وما كنت تتوقع للإخراج لتلك البيانات سبيل المثال. أنا لا أتساءل، لأنك تقول أن الوقت الحالي يفتقد أنك تريد المبلغ الحالي (كيرنت. (إكسكتدينكريبتس بريفيوسريدمغروث) شيء يجب مراعاته: تحتاج إلى معالجة كافة القيم المفقودة المحتملة قبل القيام بالتقسيم مع القيم المتخلفة. لا وجود لاج 3 حتى تحصل على الملاحظة الرابعة. لذلك أنت ذاهب إلى تقسيم عن طريق المفقودين التي قد ترغب في النظر فيها. وإذا كان متغير نيريدمبتيون الخاص بك هو إيفرميسينغ كنت الذهاب للحصول على حسابات أخرى متقطعة مع القيم المفقودة. قيم الإغفال هي فقط للمتغيرات التي يتم قراءتها من خلال عبارة سيت أو ميرج. إذا كنت ترغب في الاحتفاظ متغير محسوب ثم يمكنك استخدام ريتين. عند إعادة تعيين إلى القيم الأولية أو مفقودة للمتغيرات الاحتفاظ بها في بعض الأحيان للاهتمام. قد ترغب في شيء مثل: الاحتفاظ تيمبكورنت 0 هذا تعيين قيمة إنتيال 0 إذا مفقود (الحالي) ثم كيرنتسوم (تيمبكورنت، (إكسكتدينكريبتس بريفيوسريدمغروث)) آخر المبلغ الحالي (الحالي. (إكسكتدينكريبتس بريفيوسريدمغروث)) ثم إعادة تعيين القيمة المحتفظ بها
Comments
Post a Comment