plm パッケージの Males データによる結婚の賃金に対する影響力を、一時点前に結婚していたかどうか(「婚姻」と略称)を操作変数として推定しなさい。
固定効果モデルを使っても、婚姻が賃金を高める効果が、以前の例題で確認されたが、これは内生性によるバイアスを含んだものかもしれない。なぜなら、婚姻が賃金を高めるのではなく、賃金の高い人が結婚しやすく、離婚しにくいだけかもしれないからだ。また、美しさや人柄を時間的に変化しない観察されない異質性と仮定したが、これらは時間的に変化するかもしれない。このように考えると操作変数を使った分析が必要であることがわかる。
婚姻が賃金を高める効果があるとすれば、配偶者手当やモチベーションの増加が原因であると考えられる。それゆえ、前年に結婚していても、当年に結婚していなければ、配偶者手当ももらえないし、モチベーションも上がらないはずである。つまり、前年の婚姻は賃金に直接影響しないと仮定することは理に適っていると思われる。また、前年の婚姻と当年の婚姻の間に強い相関があることは、移動表のプロットで確認済みである。
婚姻は二値変数であるため、2段階最小二乗法には適しない。しかし、実際の分析結果を見ると、GMM のような方法とほとんど同じ推定値が得られることが報告されており、実用上はあまり問題がないようである。そこで、ここでは単純に一時点前の婚姻状態を操作変数として分析する。
Males データを使って結婚の効果を推定した固定効果モデルは以下のようなものであった。
library(plm)
data(Males)
levels(Males$occupation) <- c("Professionals", "Managers", "Sales", "Clerks", "Craftsmen", "Operatives", "Laborers", "Farm", "Service")
d0 <- pdata.frame(Males[, c(-10, -12)]) # 使わない変数を削除
# 操作変数と内生性が疑われる変数の相関の強さを確認
summary(plm(as.numeric(married=="yes") ~ lag(married), data=d0))
## Oneway (individual) effect Within Model
##
## Call:
## plm(formula = as.numeric(married == "yes") ~ lag(married), data = d0)
##
## Balanced Panel: n=545, T=7, N=3815
##
## Residuals :
## Min. 1st Qu. Median 3rd Qu. Max.
## -0.99600 -0.06940 0.00000 0.00406 0.92700
##
## Coefficients :
## Estimate Std. Error t-value Pr(>|t|)
## lag(married)yes 0.485793 0.014708 33.029 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 341.43
## Residual Sum of Squares: 256
## R-Squared : 0.25021
## Adj. R-Squared : 0.2144
## F-statistic: 1090.91 on 1 and 3269 DF, p-value: < 2.22e-16
# 普通の固定効果モデル
fixed1 <- plm(wage ~ married + exper + I(exper^2) + union, data=d0, model="within")
# 操作変数を導入したモデル
iv1 <- update(fixed1, ~. | .- married + lag(married))
# 残差分散の不均一性に対処するためにロバストな標準誤差を計算
library(lmtest)
fixed2 <- coeftest(fixed1, vcov=vcovHC)
iv2 <- coeftest(iv1, vcov=vcovHC)
library(texreg)
screenreg(list(fixed1, fixed2, iv1, iv2))
##
## ==========================================================
## Model 1 Model 2 Model 3 Model 4
## ----------------------------------------------------------
## marriedyes 0.05 * 0.05 * 0.08 0.08 ***
## (0.02) (0.02) (0.05) (0.02)
## exper 0.12 *** 0.12 *** 0.10 *** 0.10 ***
## (0.01) (0.01) (0.01) (0.01)
## I(exper^2) -0.00 *** -0.00 *** -0.00 *** -0.00 ***
## (0.00) (0.00) (0.00) (0.00)
## unionyes 0.08 *** 0.08 *** 0.07 *** 0.07 **
## (0.02) (0.02) (0.02) (0.02)
## ----------------------------------------------------------
## R^2 0.18 0.14
## Adj. R^2 0.16 0.12
## Num. obs. 4360 3815
## ==========================================================
## *** p < 0.001, ** p < 0.01, * p < 0.05
婚姻の係数を見ると、操作変数を投入しない場合よりも、投入した場合のほうが大きいが、モデル3の場合、標準誤差が大きくなって有意にならない。これは操作変数法の持つ欠点なので、内生性を除去したら結婚の効果がなくなった、と解釈するのは不適切であろう。以前の分析で分散の不均一性があることがわかっていたので、これを考慮してロバストな標準誤差を計算したのがモデル 2 と 4 である。操作変数を使ったモデルの方は、婚姻の標準誤差が顕著に減少し、有意になった。総合的に考えて、内生性を考慮しても、やはり婚姻が賃金を高める効果は存在すると言えるだろう。
plm パッケージの LaborSupply データで、子供の数が賃金を高めるかどうか、一時点前の子供の数を操作変数として固定効果モデル(あるいはランダム効果モデル)で推定しなさい。