روش برآورد الگو-رگرسیون پانل دیتا:پایان نامه تاثیر تحقیق بر رشد اقتصادی

  • روش برآورد الگو-رگرسیون پانل دیتا

در اقتصادسنجی پایه، معمولاً می­خواهیم تغییرات یک متغیر را (Y) بر حسب تعدادی از متغیرها (Xها) که معتقدیم باعث تغییرات Y می­شود توضیح دهیم. اغلب این کار را در غالب یک تابع انجام می­دهیم:

Yi = f(xki);                   k=1,2,…,K;                     i=1,2,…,N           (3-1)   

k تعداد متغیرهای توضیح دهنده را نشان می­دهد. اغلب برای شروع، شکل این تابع را خطی فرض می­کنند:

Yi = β0 + β1 x1i + β2 x2i + … + βk xki + εi                                                 (3-2)

i بیانگر تعداد مشاهداتی است که از هر متغیر در دست داریم. تعداد مشاهدات می­تواند بر حسب زمان باشد. در این­صورت Xkt و yt را داریم که هر متغیر در طول سال، فصل، ماه و … اندازه­گیری می­شود و خواهیم داشت

t = 1,2,…,T

به عبارت دیگر yt و Xkt سری زمانی[1] می­باشند. یعنی یک متغیر واحد که مقادیر آن در فاصله زمانی مورد نظر بر اساس یک مکانیزم معین (مثلاً یک مکانیزم آماری) تولید می­شود. در حالت دیگر می­توان در یک زمان خاص، برای مثال سال 1380، یک متغیر را در یک جامعه آماری (مثلاً درآمد افراد مختلف در سال 1380)، اندازه­گیری کرد. در این­جا درآمد میان افراد تغییر می­کند نه در طول زمان. در این حالت یک مقطع از جامعه را در یک زمان خاص پیمایش کرده­ایم که به زبان فنی­تر آن را برش مقطعی[2] یا برای راحتی کار، مقطع می­گوییم. مدل (3-2) چه بر حسب برش مقطعی یا مقاطع، چه بر حسب زمان، ساده­ترین مدل در تحلیل رگرسیونی است. با اعمال فرض­های کلاسیک رگرسیون، مدل مذکور برای یافتن βها یا ضرایب تابع، برآورد می­شود. با نقض فروض کلاسیک با مشکلاتی چون همبستگی پیاپی[3] جملات اخلال یعنی εt در مدل­های سری زمانی و واریانس ناهمسانی[4] در مدل­های مقطعی روبرو می­شویم. آزمون­های آماری در مورد ضرایب، خوبی برازش رگرسیون، آماره­های R2 و F  رگرسیون و نظایر آن به تعداد مشاهدات یعنی، T در مورد سری زمانی و N در مورد داده­های مقطعی و تعداد پارامترها (β های) برآورد شده بستگی دارد (K+1 پارامتر یا β در مدل (3-2) برآورد می­شود). اغلب با یک مشکل عمومی در این مدل­ها روبرو می­شویم متغیرهای توضیحی یعنی Xها با یکدیگر هم­خطی دارند که باعث می­شود مقادیر درست βها برآورد نشود و استنتاج با مشکل مواجه شود. به همین جهت پاسخ به برخی سئوالات اقتصادی و آزمون برخی از فرضیه­ها در مدل سری زمانی با مقطعی با مشکل روبرو خواهد شد و گاه غیر ممکن است.

در مدل­های پانل دیتا، متغیرها را هم در میان مقاطع جامعه آماری (که تعداد آن را با N نشان می­دهیم) و هم در طول زمان اندازه­گیری می­کنیم؛ مثلاً درآمد افراد جامعه یعنی نیروی کار مختلف (پزشک، مهندس، استاد، کارشناس، دبیر، معلم، …) را در طول یک فاصله زمانی از سال 1370 تا 1385 اندازه­گیری می­کنیم. مهم است این افراد در طول سال­ها یکسان بمانند. یعنی یک پزشک خاص، مهندس خاص و … در این فاصله زمانی پیمایش آماری شود. اگر این افراد بمیرند یا مهاجرت کنند، تعقیب خصوصیات آماری آن­ها در دوره­ی زمانی مورد نظر ممکن نخواهد بود. به این ترتیب تعدادی مشاهده از دست خواهید داد و گاه مجبور خواهید شد یک رکورد (متغیرهای مختلفی که برای یک فرد خاص اندازه­گیری شده) را بطور کامل حذف کنید، یا پانل شما نامتوازن[5] خواهد بود. به این ترتیب با دو بعد سر و کار دارید: بعد زمان و بعد مقاطع (افراد)، که آن­را داده­های گروهی- زمانی[6] نیز می­گویند. واضح است که تعداد مشاهدات شما از یک متغیر، مثلاً درآمد، چندین برابر شده است، یعنی از N یا T در داده­های سری زمانی یا داده­های مقطعی به N×T در داده­های پانل، افزایش یافته است. درآمد در عرض جامعه اندازه­گیری شده و واریانس عرض، اطلاعات زیادی برای آزمون فرضیات اقتصادی فراهم می­کند. در طول دوره زمانی نیز همین متغیر اندازه­گیری شده و واریانس آن در طول زمان می­تواند اطلاعات مفیدی از پویایی­های[7] درآمد در طول زمان برای آزمون فرضیات اقتصادی با ماهیتی دیگر فراهم کند و امکان مدل­سازی پویای درآمد شبیه آنچه در ادبیات سری زمانی مطرح است، بوجود آید. کمی بعد خواهید دید چطور این پویایی­ها، در غالب یک مدل با وقفه­های توزیع شده[8]، اجازه می­دهد اثرات متفاوت یک متغیر توضیحی در طول زمان، در عرض از مبدأ رگرسیون پانل دیتا منعکس شود و سئوالات بسیار مهمی در مورد مقادیر ابتدایی[9]، مدل­سازی پویای پانل دیتا و اثرات پویای زمانی مطرح گردد و استنباط­ها با اعتماد بیشتری به عمل آید (اشرف زاده و مهرگان، 1389).

[1]. Time Series

[2]. Cross – Section

[3]. Serial Correlation

[4]. Hetoroskedasticity

[5]. Unbalanced

[6]. Longitudinal

[7]. Dynamics

[8]. Distributed lag

[9]. Initial value