ستاتا -11 - الحركة - متوسط


ستاتا تحليل البيانات والبرمجيات الإحصائية. نيكولاس J كوكس، جامعة دورهام، المملكة المتحدة كريستوفر بوم، بوسطن College. egen، ما والقيود. القيادة الأكثر وضوحا القيادة لحساب المتوسطات المتحركة هي وظيفة ما من إيجن نظرا للتعبير، فإنه يخلق المتوسط ​​الافتراضي لهذا التعبير افتراضيا، يؤخذ على أنه 3 يجب أن يكون غريبا. ومع ذلك، كما يشير الإدخال اليدوي، إغن، قد لا يتم دمجها مع فارليست، ولهذا السبب وحده، فإنه لا ينطبق على بيانات لوحة على أي حال، فإنه يقف خارج مجموعة من الأوامر مكتوبة خصيصا لسلسلة زمنية انظر سلسلة زمنية للحصول على التفاصيل. المنهجية البديلة. لحساب المتوسطات المتحركة للبيانات لوحة، وهناك على الأقل خيارين كلا تعتمد على مجموعة البيانات التي كانت تسيت مسبقا هذا هو يستحق الكثير من القيام به ليس فقط يمكنك حفظ نفسك مرارا وتكرارا تحديد متغير لوحة ومتغير الوقت، ولكن ستاتا يتصرف بذكاء نظرا لأي ثغرات في البيانات. 1 اكتب التعريف الخاص بك باستخدام Gener. Using سلسلة زمنية س تعطي المعينات مثل L و F تعريف المتوسط ​​المتحرك كحجة إلى بيان توليد إذا كنت تفعل ذلك، فإنك لا تقتصر على المتوسطات المتحركة المركزة غير المرجح المرجح على أساس متساو بواسطة إغن، على سبيل المثال، على سبيل المثال سيتم تحديد المتوسطات المتحركة ذات الثلاث فترات الزمنية. ويمكن تحديد بعض الأوزان بسهولة. يمكنك بالطبع تحديد تعبير مثل سجل ميفار بدلا من اسم متغير مثل myvar. One ميزة كبيرة من هذا النهج هو أن ستاتا تلقائيا يفعل الشيء الصحيح للبيانات لوحة الرائدة والقيم المتخلفة يتم وضعها داخل لوحات، تماما كما يملي المنطق يجب أن تكون العيب أبرز هو أن سطر الأوامر يمكن أن تحصل طويلة بدلا من ذلك إذا كان المتوسط ​​المتحرك ينطوي على عدة مصطلحات. ومن الأمثلة الأخرى متوسط ​​متحرك من جانب واحد يستند فقط إلى قيم سابقة قد يكون هذا مفيدا لتوليد توقع تكيفي لما سيحدده المتغير فقط على المعلومات حتى الآن ما الذي يمكن أن يتنبأ به شخص ما r الفترة الحالية استنادا إلى القيم الأربع الماضية باستخدام مخطط الترجيح الثابت يمكن استخدام الفارق الزمني لمدة 4 فترات شائعة بشكل خاص مع المرات الفصلية. 2 استخدم إغين وفلتر من سك. استخدم مرشح وظيفة إغين المكتوب بواسطة المستخدم من حزمة إغنمور على سك في ستاتا 7 التي تم تحديثها بعد 14 نوفمبر 2001، يمكنك تثبيت هذه الحزمة من قبل. بعد ذلك مساعدة نقاط إينمور إلى التفاصيل على عامل التصفية وسيتم تقديم المثالين أعلاه. في هذه المقارنة قد يكون نهج توليد أكثر شفافية، ولكننا سوف نرى مثالا على العكس في لحظة الفواصل هي يؤدي نومليست التأخيرات السلبية في هذه الحالة -1 1 يوسع إلى -1 0 1 أو الرصاص 1، تأخر 0 ، تأخر 1 فيفينتس كويف، نوميليست آخر، مضاعفة المتخلفة أو العناصر الرائدة المقابلة في هذه الحالة تلك العناصر ميفار وتأثير الخيار تطبيع هو قياس كل معامل من مجموع المعاملات بحيث يكون 1 1 1 سوف التطبيع هو أي ما يعادل معاملات 1 3 1 3 1 3 و كويف 1 2 1 التطبيع يعادل معاملات 1 4 1 2 1 4. يجب عليك تحديد ليس فقط التأخر ولكن أيضا المعاملات لأن إغين، ما يوفر حالة مرجحة بالتساوي، و الأساس المنطقي الرئيسي ل إغين، مرشح هو لدعم حالة مرجحة غير متكافئة، والتي يجب عليك تحديد المعاملات ويمكن أيضا أن يقال أن إلزام المستخدمين لتحديد المعاملات هو القليل من الضغط عليهم على التفكير في ما هي المعاملات التي يريدون تبرير الرئيسي بالنسبة للأوزان المتساوية، فإننا نخمن، البساطة، ولكن الأوزان المتساوية لها خصائص نطاق تردد رديء، ناهيك عن اعتبار واحد فقط. المثال الثالث أعلاه يمكن أن يكون. أيهما هو مجرد مجرد معقدة مثل نهج توليد هناك حالات فيها إغن ، مرشح يعطي صيغة أبسط من توليد إذا كنت تريد مرشح ثنائي الحدين لمدة تسعة، والتي علماء المناخ تجد مفيدة، ثم. لعل ربما أقل رهيبة من وأسهل للحصول على الحق من. كما هو الحال مع نهج توليد، إغن، عامل تصفية يعمل بشكل صحيح مع بيانات لوحة في الواقع، كما ذكر أعلاه، فإنه يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. الرسوم البيانية tip. After حساب المتوسطات المتحركة الخاصة بك، وربما كنت تريد أن ننظر إلى رسم بياني تسغراف الأوامر المكتوبة المستخدم ذكية حول مجموعات البيانات تسيت تثبيته في ما يصل إلى تاريخ ستاتا 7 التي كتبها سك إنست تسغراف. ماذا سوبسيتينغ مع إف. لا أحد الأمثلة أعلاه الاستفادة من إذا القيود في الواقع إغن، ما لن تسمح إذا كان سيتم تحديدها أحيانا الناس وا نت لاستخدام إذا عند حساب المتوسطات المتحركة، ولكن استخدامه هو أكثر تعقيدا قليلا مما هو عليه عادة. ماذا تتوقع من المتوسط ​​المتحرك تحسب مع إذا دعونا نحدد اثنين الاحتمالات. تفسير صحيح أنا لا أريد أن أرى أي نتائج ل والملاحظات المستبعدة. التفسير القوي أنا لا أريد حتى لك لاستخدام القيم للملاحظات المستبعدة. هنا مثال ملموس لنفترض كنتيجة لبعض إذا الشرط، الملاحظات 1-42 مدرجة ولكن لا الملاحظات 43 على ولكن المتوسط ​​المتحرك ل 42 سيعتمد، من بين أمور أخرى، على قيمة للمراقبة 43 إذا كان المتوسط ​​يمتد إلى الوراء وإلى الأمام وهو طول 3 على الأقل، وسوف تعتمد بالمثل على بعض الملاحظات 44 فصاعدا في بعض الظروف. خمننا هو أن معظم الناس سوف تذهب لتفسير ضعيفة، ولكن ما إذا كان هذا هو الصحيح، إغن، مرشح لا يدعم إذا كان إما يمكنك تجاهل دائما ما لا تريد أو حتى تعيين القيم غير المرغوب فيها إلى المفقودين بعد ذلك ب y باستخدام استبدال. ملاحظة عن النتائج المفقودة في نهايات السلسلة. لأن المتوسطات المتحركة هي وظائف من التأخر والعملاء، إغين، أماه تنتج مفقودة حيث لا توجد تأخرات والعملاء المحتملين، في بداية ونهاية السلسلة وهناك خيار نوميس يقيس حساب أقصر، غير متحرك المتوسطات المتحركة للذيول. على النقيض من ذلك، لا تولد ولا إغن، تصفية يفعل، أو يسمح، أي شيء خاص لتجنب النتائج المفقودة إذا كان أي من القيم اللازمة لحساب مفقود، ثم أن النتيجة مفقودة ذلك هو ما يصل إلى المستخدمين لتحديد ما إذا كان وما هو مطلوب جراحة التصحيحية لمثل هذه الملاحظات، ويفترض بعد النظر في مجموعة البيانات والنظر في أي علم الكامنة التي يمكن أن توضع على تحمل. التسوق Lowess. We سوف نعمل مع البيانات من مسح الأسرة وفس المنزلية، أجري في 1975-76 أنا جدولة التوزيع العمري لجميع أفراد الأسرة وحفظه في ملف أسكي، والتي نقرأها الآن والمؤامرة. كما ترون، والتوزيع يبدو إلى حد ما أقل سلاسة من البيانات من الفلبين التي درسناها في وقت سابق هل يمكنك حساب مؤشر مايرز لهذا التوزيع. الوسائل والخيوط. أسلوب أبسط لتسهيل سكاتيربلوت هو استخدام المتوسط ​​المتحرك المعروف أيضا باسم يعني تشغيل النهج الأكثر شيوعا هو استخدام نافذة من 2k ملاحظات 1، k إلى اليسار و k إلى يمين كل ملاحظة قيمة k هي التبادل بين نعومة الخير مناسبا يجب إيلاء عناية خاصة في أقصى حدود النطاق ستاتا يمكن حساب تشغيل يعني عبر لويس مع الخيارات يعني و nowe. A مشكلة مشتركة مع وسائل تشغيل هو التحيز وهناك حل هو استخدام الأوزان التي تعطي المزيد من الأهمية لأقرب الجيران وأقل لتلك أبعد بعيدا وظيفة الوزن شعبية هو توكي ق ثلاثي مكعب، والمعروفة باسم ود 1 - d 3 3 بالنسبة إلى d 1 و 0 خلاف ذلك، حيث d هي المسافة إلى النقطة المستهدفة المعبر عنها كجزء من عرض النطاق يمكن أن يقوم ستاتا بهذا الحساب عبر لويس مع الخيار يعني إذا حذفت نويت. ص خطوط التحدید نحدد مرة أخرى حیجا لکل نقطة، وعادة ما یکون أقرب الجیران k علی کل جانب، ویناسب خط الانحدار إلی النقاط في الجوار، ثم یستخدمھا للتنبؤ بقیمة أکثر سلاسة لمرصد المؤشر ھذا یبدو کثیر من العمل، ولكن الحسابات يمكن القيام به بكفاءة باستخدام الانحدار تحديث الصيغ ستاتا يمكن حساب خط تشغيل عبر لويس إذا حذفت يعني ولكن تشمل نايت أفضل من ذلك هو استخدام خطوط تشغيل مرجحة إعطاء المزيد من الوزن لأقرب الملاحظات، وهو ما لويس أكثر سلاسة هل يتبع المتغير هذا التقدير مع عدد قليل من التكرارات للحصول على خط أكثر قوة هذا هو بوضوح أفضل تقنية في الأسرة يستخدم ستاتا لويس خط تشغيل مرجح إذا حذفت يعني و noweight. R تنفذ لاويس أكثر سلاسة من خلال وظائف لويس و اللويس الأحدث، الذي يستخدم واجهة صيغة مع واحد أو أكثر من التنبؤات وقيم افتراضية مختلفة إلى حد ما درجة المعلمة تسيطر على درجة المحلية p أوليوميال الافتراضي هو 2 للتربيعية، والبدائل هي 1 للخطي و 0 لتشغيل يعني كل من التطبيقات يمكن استخدام مقدر قوي، مع عدد من التكرارات التي تسيطر عليها المعلمة إيتر أو التكرار اكتب لوهس و لويس في وحدة التحكم R لمزيد من المعلومات في غبلوت يمكنك تراكب لويس أكثر سلاسة عن طريق استدعاء geomsmooth. The الشكل أدناه يظهر البيانات الكولومبية و لويس أكثر سلاسة مع فترة أو عرض النطاق الترددي يساوي 25 من data. You قد ترغب في محاولة بدويدثس مختلفة لنرى كيف تختلف النتائج. التمييز ديجيت revisited. Smoothing توزيع العمر يوفر وسيلة أفضل لتقييم رقمية تفضيل من مايرز مزج دعونا حساب الرقم الأخير من العمر وتجميعه على مجموعة كاملة من البيانات باستخدام الترددات لوحظ و لويس أكثر سلاسة. الترددات الخام تظهر أدلة على تفضيل للأعمار التي تنتهي في 0 و 5، وهو أمر شائع جدا، وربما 2 كذلك نحن الآن استخدام السلس كما الوزن. وتظهر الترددات أملس أننا نتوقع أقل بي أوبل في أرقام أعلى، حتى في توزيع سلس، مع أكثر تنتهي في 0 من 9 ونحن الآن على استعداد لحساب مؤشر تفضيلات أرقام، وتعرف بأنها نصف مجموع الاختلافات المطلقة بين الترددات الملحوظة وسلس. ونرى أننا سوف تحتاج لتعديل 5 5 من الملاحظات للقضاء على تفضيل الأرقام قد ترغب في مقارنة هذه النتيجة مع مؤشر مايرز .7 جيرم ن رودر غيز، جامعة برينستون. تخيل لديك بيانات عن أسعار العديد من المنتجات. لكل من المنتجات التي تسجل سعر الأسبوعية information. clear مجموعة أوبس 200.gen بروديد n. كل منتج لديه سعر متوسط ​​فريد برودبريس ربويسون 5 7. لديك بيانات عن أسعار أسبوعية لمدة 200 أسابيع توسيع 200 بوردورت بروديد جين t ر ن علامة فار t أسبوع. وهناك أيضا بعض التباين الموسمية جين الموسمية 2 الخطيئة بي تي 50. فضلا عن الاتجاه العام الاتجاه العام t 005. لا ترتبط أول ملاحظة مع أي سعر جين برودبريس 2 5 الاتجاه ربوكسون 10 10 إذا ر 1 استبدال سعر برودبريس 2 الاتجاه الموسمية 7 السعر n-1 3 ربيسون 10 10 إذا t 2 استبدال السعر برودبريس الاتجاه الموسمية 5 السعر n-1 2 السعر n - 2 2 السعر n-3 3 ربيسون 10 10 إذا t 4 استبدال السعر برودبريس الاتجاه الموسمية 3 السعر n-1 175 السعر n-2 125 السعر n-3 1 السعر n-4 3 ربويسون 10 10 إذا t 4. إنشاء غلوبابل إلى مخزن العالمية توغراف. فورف i 1 6 العالمي توغراف خط السعر t إذا بروديد i. twoway توغراف، أسطورة من عنوان اتجاهات الأسعار الحقيقية لأول ستة منتجات. الآن دعونا نتصور أن البيانات التي تم إنشاؤها أعلاه هي معلومات الأسعار الحقيقية التي هي في الأساس لا يمكن ملاحظتها. بدلا من ذلك لديك مجموعات متعددة من البيانات في الأسبوع على الأسعار التي تختلف كل من بعض الخطأ الإضافي عشوائي توسيع 3.bysort بروديد t جين برودوبس n. gen بريسكوليكت السعر رنورمال 25. ومع ذلك فإن المعلومات السعر لديك بعض الإدخالات التي 10 كانت عن طريق الخطأ دخلت خاطئ. gen إنتيرورور ربينوميال 1، 1 جين سكالارورور رنورمال 1.gen برايسوبس بريسكولكت 1 إنتيرورور سكالارورور التسمية فار برايسوبس السعر المسجل. بالإضافة إلى ذلك، لم يتم جمع 35 من بيانات السعر الخاص بك أبدا جينبينيال مفقودة 1، 35.drop إذا مفقود 1. إنشاء غلوبابل لتخزين twograph. forv العالمي i 1 6 الخط العالمي خط السعر إذا كان برودوب برودوبس 1. توواي توغراف، أسطورة أوف تيتل اتجاهات الأسعار الملحوظة لأول ستة منتجات. حافظ على t تيبوبس بروديد إنتيرور أنا أحفظ خطأ الدخول في مجموعة البيانات كوسيلة للمقارنة على الرغم من أنه لن يلاحظ مباشرة. السؤال هو. يمكنك الآن مع هذه البيانات الفوضى استرداد البيانات السعر الذي يشبه الأصلي. أول شيء يجب علينا أن نستغل هو تكرار البيانات data. scatter برايسوبس t إذا بروديد 1، عنوان فمن السهل أن نرى الانحرافات الفردية. فمن السهل أن نرى الانحرافات الفردية ولكن نحن لا نريد أن نذهب من خلال جميع المنتجات 200 لتحديد فردي القيم الشاذة نريد أن نتوصل إلى نظام لتحديد القيم المتطرفة. اسمحوا s توليد متوسط ​​من قبل المنتج والوقت بيسورت بروديد t إغين بريسيمين يعني برايسوبس. اسمحوا s العلم أي الملاحظة التي هي 120 أكبر من متوسط ​​أو 80 أقل من متوسط ​​برايسوبس بريموس علم الدولة 1 1 بريسيوبس برايسوبس 8. دعونا نرى كيف يعمل اثنين من مبعثر برايسوبس t إذا كان بروديد 1 مبعثر برايسوبس t إذا بروديد 1 العلم 1 مسيمبول لغس تيتل يمكن التعرف على بعض القيم المتطرفة فقط بالنظر إلى وسيلة الإيضاح المتوسطة off. corr فلاج إنتيرورور يرتبط علمنا بنحو 45 مع أخطاء الإدخال هذا جيد ولكن يمكننا أن نفعل ما هو أفضل. أقترح بدلا من استخدام المتوسط ​​فقط أن نبني متوسط ​​متحرك للأسعار ونرى كيف ينحرف كل إدخال عن المتوسط ​​المشكلة الوحيدة هي أن الأمر المتوسط ​​المتحرك يتطلب إكستسيت ويتطلب إدخال واحد فقط في كل فترة زمنية لذلك، ونحن نعيد متغير الوقت وإضافة في كما لو سجلت في وقت مختلف من الأسبوع رقم المراقبة. نحن بحاجة إلى توليد حديثا برودوبس لأننا لا نعرف أي ملاحظة مفقودة من كل منتج بروديس برودوبس برودوبس n. gen t2 t 4 برودوبس. كستسيت تعيين لوحة البيانات لوحة الهوية و الوقت سلسلة مستوى زتسيت بروديد t2. الأمر الذي سنستخدمه هو تسموث. يتم ترميز ذلك من خلال تحديد ما يعني يعني نقل المتوسط ​​والنافذة يقول ستاتا كم من الفترات الزمنية لحساب العدو وكم وراء في الأرياف تتحرك هذا الأمر يمكن أن يستغرق بعض الوقت تسموث ما مابريوبوبس برايسوبس، نافذة 23 0 23 23 في تأثير 5 أسابيع إلى الأمام و 5 أسابيع وراء 0 يروي ستاتا عدم تضمين نفسي في هذا المتوسط. المتوسط ​​المتحرك اثنين من مبعثر السعر إذا كان بروديد 1 خط مابريسيوبس t إذا بروديد 1 خط بريديميان t إذا بروديد 1 تيتل "المتوسط ​​المتحرك" أقل قابلية للتحويل إلى القيم المتطرفة. المتوسط ​​المتحرك أكثر استقرارا من المتوسط ​​الزمني فقط. اسمحوا s محاولة الإبلاغ باستخدام المتوسط ​​المتحرك انخفاض كاب flag2 جنرال flag2 مابريوبوبس برايسوبس 1 2 مابريسيوبس برايسوبس 8.two مبعثر برايسوبس t إذا بروديد 1 مبعثر برايسوبس t إذا بروديد 1 flag2 1 مسيمبول لغس العنوان يمكن أن يكون المتوسط ​​المتحرك أيضا أسطورة مفيدة قبالة. كور flag2 إنتيرورور. إسقاط قطرة البيانات التي تم الإبلاغ عنها إذا كان فلاج 2 1. الانهيار إلى مستوى انهيار الأسبوعي برايسوبس، من قبل بروديد t التسمية فار برايسوبس متوسط ​​السعر notes. forv i 1 6 العالمي توغع بروبيروبس t إذا بروديد i. twoway توغراف، أسطورة من العنوان اتجاهات الأسعار الملحوظة أول ستة منتجات البيانات تبحث أفضل بكثير ولكن لا يزال لدينا بوضوح بعض القيم المتطرفة غير المرغوب فيها. يمكننا الاستفادة من اتجاهات المنتجات عبر للمساعدة في تحديد القيم المتطرفة ضمن أسعار المنتجات بيغورت t إغين أفيبريس يعني priceobs. reg برايسوبس أفيبريس إذا كان بروديد 1 توقع الإقامة 1، المتبقية. ريغ برايسوبس أفيبريس إذا بروديد 2 التنبؤ Resid2، المتبقية. ريغ برايسوبس أفيبريس إذا بروديد 3 التنبؤ Resid3، المتبقية المتبقية. خط الخط Resid1 t إذا بروديد 1 خط برايسوبس t إذا بروديد 1 خط Resid2 t إذا بروديد 2 خط برايسوبس t إذا بروديد 2 خط Resid3 t إذا بروديد 3 خط برايسوبس t إذا بروديد 3 عنوان بقايا هي مؤشرات واضحة من أوبيرليز أسطورة قبالة. وأخيرا، دعونا إسقاط الملاحظات مع بقايا التي هي أكبر من 1 5 الانحرافات المعيارية من المتوسط. وي فورف i 1 200 ريج برايسوبس أفيبريس إذا بروديد أتوقع ريسيدتيمب، المبلغ المتبقي ريسيدتمب استبدال العلم ريسيدتيمب-r يعني ص سد 1 5 ريسيدتيمب-r يعني انخفاض ريسيدتمب. دعونا نرى كيف يعمل اثنين من مبعثر السعر إذا كان بروديد 2 مبعثر بريسوبوبس t إذا بروديد 2 العلم 1 مسيمبول لغس تيتل الآن مجرد محاولة إزالة بعض المتطرفين النهائيين أسطورة قبالة. التآمر المنتج 1 التسعير النسبية إلى القيم المتطرفة twograph. forv العالمية i 1 6 الخط العالمي للنسخ برايسوبس t إذا بروديد ط. وأخيرا إسقاط القيم المتطرفة تنخفض إذا علم. رسم بياني نهائي واحد twograph. forv i 1 6 العالمي توغع بعقب بروسيوبس t إذا بروديد i. twoway توغراف، أسطورة من العنوان اتجاهات الأسعار الملحوظة لأول ستة منتجات. ليست نظيفة كما الرسم البياني الأول لدينا ولكن بالتأكيد تحسنت كثيرا.

Comments