この文書は第95回数理社会学会大会(2023/8/25-26 愛知大学)での萌芽セッションで使ったポスターの内容を増補し、少しだけ詳しく説明したものである。
社会学では有意抽出 (non probability sampling) が頻繁に用いられている。質的研究では数人から数十人程度の対象者が有意抽出される。量的研究でも、完全に等確率で対象者が抽出できることはなく、実際には回収率が100%になることもない。これは社会学に限ったことではなく、経験データを扱う多くの学問分野で起きていることだと思う。それゆえ、有意抽出されたサンプルの特徴について知ることは、非常に重要だが、そのような研究はマレである。
この小論では、スノーボールサンプリング(以下、SSと略称)した場合に、サンプルから計算した比率(標本比率)が、母集団における比率(真値)とどの程度乖離するのか、そして、サンプルから計算した 95%信頼区間がどの程度正確なのか、モンテカルロシミュレーションを使って検討する。つまり、スノーボールサンプルからの一般化がどの程度正確なのかを調べる。
有意抽出を多用する質的研究の教科書では、質的研究の目的は一般化ではなく解釈だ、といったことが異口同音に書かれているので、このような教科書の著者にとっては、この研究は邪道、誤った方向に進んでいる研究、ということになるのかもしれない。しかし、実際の質的調査を使った論文を読んでみると、少数の対象者から得た知識をもとに、あいまいに一般化しているような結論を導く研究は少なくない。例えば、A というエスニック・グループに属する人々の語りを複数検討し、A は ……. な意味世界の中で生きている、といった結論を導くような研究である。この研究で検討しているのは、A に属する数人の語りだけであり、その他の A の人々がどのような意味世界で生きているかはわからないはずだが、「解釈」の名のもとに、A の人々すべてが同じ意味世界に生きているかのような主張を、結論では導いてしまうのである。このような曖昧な一般化は、適切な場合もあれば、そうでない場合もあるかもしれない。いずれにせよ、私は、このような曖昧な一般化を批判したいのではなく、むしろ積極的に一般化の可能性を追求したいのである。私が批判したいのは、「一般化」と「解釈」を対置して、有意抽出にもとづく研究を一般化から遠ざけようとする人たちであり、量的研究でもそのような論調の人たちは珍しくない。今回の研究は主に質的研究を念頭に置いているが、とうぜん SS するなら、量的研究にもあてはまる。
本論では、有意抽出の中でもスノーボールサンプリング (SS) に限定して検討する。SS とは、調査対象者に次の対象者を紹介してもらい、次の対象者に次の次の対象者を紹介してもらい、次の次の対象者に… といった連鎖を繰り返して対象者を抽出する方法である。実際には機縁法 (convenience sampling) のほうが圧倒的に多く用いられている印象だが、機縁法よりもSS のほうが、対象者の選び方がはっきりしているので、シミュレーションするのが容易である。つまり、簡単にモデリングできそうだから、まずはSS について考えてみた、ということである。
また、本稿では標本から比率の推定を行うと仮定する。抽象的ではわかりにくいので、母集団は元 J リーガーで、彼らのうち、現職が自営業である人の比率を推定したいとする。後で述べるように、誤差相関の問題を扱う上では、正規分布する変数を扱ったほうが簡単だが、社会学ではカテゴリカル変数を使うことが多く、量的変数でも正規分布していないことはしばしばある。現実的な仮定を置くことを選んだということである。質的研究者は比率の推定なんかしないが、「A は ……. な意味世界の中で生きている」という結論を導くためには、A のほぼ 100% の人が 「……な意味世界で生きている」というカテゴリに分類できることを論証する必要がある。これは推測統計学的には、比率の推定をしていることと大差ない。
SS の場合、母集団において、誰と誰が知り合いで、紹介可能なのか、ということが決定的に重要である。いわゆるネットワークの構造が、得られるサンプルの特徴に影響を及ぼすことは自明である。もしも、自営の人は自営の知人が相対的に多く、自営でない人(以下、その他と呼ぶ)は自営でない知人が多い場合(統計学的には誤差相関がある、ということである)、自営の人は自営を紹介しやすく、その他の人はその他を紹介しやすくなるので、それが元Jリーガーに占める自営率の推定をゆがませたり、信頼区間の幅を大きくしたりする可能性がある。
このように考えると、最初の対象者が誰かによって、サンプルの特徴が変わってくる可能性があることがわかるだろう。誤差相関が強い場合、最初の対象者が自営ならば、次の対象者も自営になりやすく、その次の対象者も … といった事態が生じやすくなる。これがどのようなバイアスをもたらすのか検討するのがこの研究の目的である。
下記の条件で架空の母集団からスノーボールサンプリングし、比率の誤差の大きさを推定する。
上の空間誤差相関モデルは、残差が正規分布することを仮定しているし、標準誤差などは \(N\) が十分に大きな値をとらないと不正確になる可能性がある。しかし、OLSでも二値変数の予測をかなり上手にできることはよく知られているし、このモデルは比較的よく知られた推定法なので、まずはこの方法を使ってみた。
上で挙げたすべての条件組み合わせで 20 回抽出を繰り返す。真値が \(p\)、架け替え率が \(q\)、サンプルサイズが \(n\)、推定法が \(k\) のときの誤差の大きさを \(e_{pqnk}\) と表記し、 \[ e_{pqnk} = \sqrt{\frac{\sum{(p - \hat p)^2}}{\mathrm{繰り返し数}}} \] と定義する。誤差の大きさは、標準誤差とほぼ同じ定義だが、有意抽出の場合、標本平均は一致推定量とはならない (\(\mathrm{E}(\hat p) \neq p\))。この「誤差」は無作為抽出した場合、標準誤差に近似する(付録参照)。
また、95% 信頼区間に真値が入った比率(入区間率と呼ぶ) \(r_{pqnk}\) を計算した。点推定値と真値の誤差だけでなく、95%信頼区間がどの程度正確に推定できるのかも重要なポイントだろう。正の誤差相関が強いほど、標準誤差は大きくなる(と思う、未確認)。それゆえ、誤差相関を仮定せずに単純に二項分布で信頼区間を推定すると、その幅を過小に推定してしまうのは自明である。ただ、どの程度過小になるのか知りたい。また、空間誤差相関モデルでも、サンプルサイズが小さかったり、残差が正規分布していなかったりした場合にどの程度正確な推定ができるのか、知りたい。
これらが、\(p, \ q, \, n, \, k\) によってどのように変化するのか、検討する。その際に誤差と入区間率の平均値を検討する。例えば、架け替え率 \(q\) によって平均誤差がどう異なるのか調べたい場合、 \[ \frac{\sum_p \sum_n \sum_k e_{pqnk}}{4 \times 5 \times 2} \] を計算して、これが架け替え率によってどう違うか示す。
図2 は推定法別にサンプルサイズと平均誤差の関係を示したものである。どちらの方法で推定してもサンプルサイズが大きくなるほど平均誤差は縮小している。サンプルサイズが 5、10、20 の場合、単純に標本比率で推定したほうが誤差が小さいが 50 以上になると誤差相関モデルでも同程度の誤差になる。
図3 は、母集団のクラスタリングの程度(架け替え率 \(q\) が小さいほどクラスタリングは大きい)と、最初の対象者によって平均誤差がどのように異なるのか示したものである。架け替え率が大きくなるほど誤差は減少している。クラスタリングが大きい(つまり、自営は自営とつながる傾向が強い)と、最初の対象者と同じ現職の人ばかり、抽出してしまう可能性が高いということだろう。このような傾向は1番の人(つまり、その他の人とつながっている確率が最も低い人)から、抽出をスタートした場合に顕著だが、架け替え率が 0.25や 0.5 だと、知人数が最大の人からスタートした場合とほとんど同じ誤差であることがわかる。
図4 は母集団での自営率と最初の対象者によって誤差がどう異なるのか示したものである。自営率が低い(つまり母分散が小さい)場合、次数の多い人からサンプリングをスタートしたほうが誤差が小さくなるが、自営率が 0.5 に近づく(つまり母分散が大きくなる)と、むしろ次数の多い人からスタートしたほうが誤差が大きくなった。表1にしめしたように、この交互作用効果は OLS では有意になる。直感的には常に次数の多い人からスタートしたほうが、さまざまな対象者にアクセスでき、誤差も小さくなりそうにおもうが、自営率が高いとなぜかそうはならない。理由は不明である。
OLS で誤差の対数を予測した結果が表1 である。OLSでの推定が適切なのか自信がないのだが、いちおうやってみた。モデル1 は主効果のみのモデル、モデル2 は、すべての独立変数のあいだに一次の(二変数間)交互作用効果を仮定したモデルからスタートして、後退ステップワイズ法で、BIC が最大になるモデルを選んだ結果である。誤差を対数変換したのは、対数変換したほうが残差が正規分布に近似するし、決定係数も上がったからである。
サンプルサイズ \(n\) に関しては、予備的分析でそのまま \(n\) や \(1/\sqrt{n}\) をかわりに投入してみたが、\(\sqrt{n}\)を投入するのがもっとも決定係数が高かったため、これを採用している。標準誤差が\(\sqrt{p(1-p)/n}\)であることを考えると、\(1 / \sqrt{n}\) がもっともあてはまりが良いことが期待されたが、そうはならなかった(従属変数を対数変換しなくても同様の結果だった)。同様に、母自営率 \(p\) に関しても、予備的分析で、\(p\) や \(\sqrt{p}\) を \(\sqrt{p (1-p)}\) のかわりに投入してみたが、\(\sqrt{p (1-p)}\) の場合がもっとも決定係数が高かった。\(\sqrt{p (1-p)}\) も標準誤差からの類推で試してみたが、期待通りの結果であった。エッジの架け替え率 \(q\) に関しても予備的分析で \(\log{q}\) の代わりに投入してみたが、\(\log{q}\) のほうが決定係数が高かった。これについては特に理論的根拠はない。
Model 1 をみると、「次数最大の人からサンプリングをスタート」だけが有意ではなく、その他の変数の効果は有意であることがわかる。ただし、Model 2 の結果を見ると、「次数最大…」と三つの変数の交互作用効果が有意になっている。つまり、直感的には次数中心性の高い人からスタートすると、誤差が小さくなりそうな気がしたが、ケースバイケースでかえって誤差が大きくなる場合もあり、平均的には ID = 1番の人からスタートした場合と有意な差はないということである。
誤差相関モデルでの推定は、モデル1が示すように平均的には誤差が大きくなるが、モデル2 の交互作用効果が示すように、サンプルサイズが大きいほど、母比率 \(p\) が 0.5にちかづき、母分散が大きくなるほど、そして架け替え率が大きくなる(つまりランダムネットワークに近づく)ほど、誤差が小さくなる。おおむね誤差相関モデルの前提(大きなサンプルサイズと残差の正規分布)が満たされるほど、誤差が小さくなるようである。
モデル1 | モデル2 | |
---|---|---|
切片 | 0.74*** | -0.17 |
(0.13) | (0.19) | |
次数最大者からスタート | -0.08 | -0.26 |
(0.06) | (0.15) | |
誤差相関モデル | 0.28*** | 1.76*** |
(0.06) | (0.17) | |
\(\sqrt{n}\) | -0.12*** | -0.01 |
(0.01) | (0.03) | |
\(\sqrt{p (1-p)}\) | 5.03*** | 8.04*** |
(0.24) | (0.42) | |
\(\log q\) | -0.24*** | -0.00 |
(0.03) | (0.05) | |
次数最大者\(\times\)誤差相関 | -0.38*** | |
(0.08) | ||
次数最大者\(\times \sqrt{p (1 - p)}\) | 1.85*** | |
(0.32) | ||
次数最大者\(\times \log q\) | 0.14*** | |
(0.04) | ||
誤差相関\(\times \sqrt{n}\) | -0.09*** | |
(0.02) | ||
誤差相関\(\times \sqrt{p (1 - p)}\) | -3.85*** | |
(0.32) | ||
誤差相関\(\times\) \(\log q\) | -0.26*** | |
(0.04) | ||
\(\sqrt{n}\times \sqrt{p (1 - p)}\) | -0.37*** | |
(0.06) | ||
\(\sqrt{n}\times \log{q}\) | -0.03*** | |
(0.01) | ||
Adj. R2 | 0.68 | 0.85 |
Num. obs. | 320 | 320 |
***p < 0.001; **p < 0.01; *p < 0.05 |
図4を見ると、入区間率はサンプルサイズが増えるほど改善するが、二項分布よりも誤差相関モデルのほうが正確であることがわかる。しかし、誤差相関モデルでも入区間率はせいぜい 92% 程度であり、95% よりもやや低い。つまり、信頼区間の幅が狭すぎることがわかる。
図5を見ると、エッジの架け替え率が大きくなるほど入区間率が高まる傾向があるのがわかる。また次数最大の人からスタートするより、ID = 1番の人からスタートした場合のほうが入区間率は上がるが、その差はせいぜい 8ポイント程度であり、エッジの架け替え率や推定法の違いほどの効果はない。
図6 は母自営率 \(p\) が大きくなるほど入区間率が小さくなる傾向を示しているが、これはサンプルサイズが 50人以下のときであり、サンプルサイズが 100人の場合、母自営率は入区間率にほとんど影響しないことがわかる。
表1と同じ要領で、入区間率を推定した結果が表1である。「次数最大者からスタート」は、主効果も交互作用効果も BIC の改善に寄与しないため、Model 2 からは落ちている。モデル2の交互作用効果を解釈しよう。誤差相関モデルのほうが入区間率が高いが、この優位はサンプルサイズが大きくなるほど縮まっていくことは、図4 で確認したとおりである。
Model 1 | Model 2 | |
---|---|---|
切片 | 72.91*** | 122.20*** |
(5.04) | (5.97) | |
架け替え率 \(q\) | 23.22** | 23.24*** |
(7.65) | (6.11) | |
次数最大者からスタート | -2.49 | |
(2.80) | ||
\(n\) | 0.32*** | -0.24* |
(0.04) | (0.10) | |
誤差相関モデル | 43.73*** | -5.89 |
(2.80) | (7.02) | |
\(\sqrt{p (1-p)}\) | -138.19*** | -293.64*** |
(10.76) | (14.99) | |
\(n \times\)誤差相関 | -0.27*** | |
(0.06) | ||
\(n \times \sqrt{p (1 - p)}\) | 1.94*** | |
(0.24) | ||
誤差相関\(\times \sqrt{p (1 -p)}\) | 167.01*** | |
(17.18) | ||
Adj. R2 | 0.60 | 0.75 |
Num. obs. | 316 | 316 |
***p < 0.001; **p < 0.01; *p < 0.05 |
以上の結果は、いくつかの机上の仮定のものとに成り立っているので、どこまで現実のサンプリングにあてはまるのかはわからない。しかし、ある程度、現実のサンプリングにも当てはまるのであれば、以下のような示唆が得られたことになる。
以上のような解釈に対しては、以下のような批判や課題が考えられる。
本論では比率について論じているが、ここでは平均について論じる。それは、標準誤差と「誤差」の関係を論じる場合、比率よりも平均について議論するほうが簡単だからである。比率とは 0 または 1 の値をとる二値変数の平均値なので、平均値に関して言えることは、ほぼ比率に関しても一般化できる。一般化できないのはサンプルサイズが小さい場合と、母比率が 0 または 1 に非常に近い場合だけである。
\(Y\) という変数の母平均 \(\bar Y\) を推測したい。母集団から \(N\) 個の事例 \(i \; (i = 1, \; ..., \; N)\) を抽出する。これを \(M\) 回繰り返す。\(M\) は非常に大きい。\(j\) 番目の標本の \(Y\) の平均を \(\bar Y_j \; (j = 1, \; ..., \; M)\)、 \(j\) 番目の標本の \(i\) 番目の事例の \(Y\) の値を \(Y_{ij}\) とすると、 \[ \bar Y_j = \frac{\sum_{i=1}^N Y_{ij}}{N} \tag{5.1} \] と定義する。また、「誤差」 \(\mathrm{s}(Y)\) は、 \[ \mathrm{s}(Y) =\sqrt{\frac{\sum_{j=1}^M \left( \bar Y_j - \bar Y \right) ^ 2}{M - 1}} \tag{5.2} \] と定義する。
無作為抽出の場合、\(M\) が十分に大きければ、本稿でいう「誤差」は標準誤差に近似する。
標準誤差とは標本平均(本稿の本論では標本比率)の標準偏差(分散の平方根)である。無作為抽出の場合、標本平均の期待値は母平均と一致する \(E(\bar Y_j) = \bar Y\)。これを式 (5.2) に代入すると、 \[ \mathrm{s}(Y) =\sqrt{\frac{\sum_{j=1}^M \left( \bar Y_j - E(\bar Y_j) \right) ^ 2}{M - 1}} \tag{5.3} \] だが、式 (5.3) は \(M\) が十分に大きければ \(\bar Y_j\) の標準偏差、すなわち標準誤差に近似する。
以上で証明終わり。
中心性の概念の説明はネットワーク分析の教科書なら必ず扱っているが、R でのプログラミングも含めて 鈴木 (2017) を参考にした。↩︎