数理社会学会 (Japanese Association for Mathematical Sociology: 以下 JAMS と略称) の 30 周年記念シンポの事前のやりとりの中で数理社会学の現状に対する危機感がいくつか表明されていた。特に狭い意味での数理社会学についての危機感が述べられているので、その点をこのレポートでは検討してみたい。危機の中身についてあまりはっきり述べられていないが、このレポートでは狭い意味での数理社会学の報告数が減少しているのかどうかを明らかにしていく。
JAMS の会員数は 300 人前後でこの十数年推移しているし、機関紙である『理論と方法』も安定的に刊行されており、これらに関しては特に危機的な状況とは言えない。また、学会大会の報告数も近年「萌芽的セッション」と呼ばれるポスターセッションを中心に増加している印象がある。こういった事実だけをみれば JAMS の状況は悪くない。
しかし、報告数の増加を支えているのは計量社会学(以下では「計量」と略称)の研究成果報告であって、狭い意味での数理社会学(以下では「数理」と略称)ではないかもしれない。計量がデータから帰無仮説を検定したりモデルのパラメータを推定したりすることを主要な方法とするのに対して、数理は公理系から演繹的に命題を導出することを重視する。それゆえ両者は数学を使うという点では共通しているが、計量は帰納的、数理は演繹的な志向が強い。社会学界全体では研究者の数でも書かれている論文の数でも計量のほうが圧倒的に多いので(Tarohmaru, et al. 2002, 太郎丸他 2009)、数理は少数派と言える。その少数派がさらに減っているのならば危機感をいだくのは当然と言える。
JAMS が数理と計量の両方を包含する学会であることは、「数理社会学会設立趣意書」にも明記されているし、『理論と方法』の投稿規程にも数理に限らず分野を問わず社会学とその関連領域の論文であれば受け付けると書かれている。それゆえ JAMS 大会の報告も数理と計量の両方があるし、数理的でない理論研究や事例研究なども少数ではあるが存在している。以下では JAMS の大会報告を、計量とその他(主に数理)に分類して、それぞれの数がどのように推移してきたのか記述する。
データは第 1~61 回 JAMS 大会(1986~2016)の報告要旨集である。JAMS は年に二回(秋と春)の大会を開いている。報告要旨集が手元にない場合はプログラムを見て、報告数を数えている。会長講演、学会賞受賞者の講演、シンポにおけるコメントは「報告」と見なしていない。また、初期にはオープンセッションというセッションがあり、報告申し込みには間に合わなかった人のために空けてある時間帯があった。しかし、結果的にどんな報告がなされたのか調べられていないので、これらについても報告は無かったものとみなしている。
報告は計量と数理に分類して報告数を数えてあるが、数理には数学を使わない理論研究や事例研究も含まれている。つまり、実際の分類では計量とその他に分類している。このような分類をしているのは、数理と計量以外の残余の数がそれほど多くないということもあるが、残余の多くは数理寄りの内容が多いからである。例えば「数理社会学はいかにあるべきか」といった問題を扱う場合のように、メタに切り上がって数理社会学について論じる報告は少なくない。しかし、こういった報告そのものの中で数理モデルが展開されているかといえば、そうでない場合も多い。また、入会地の事例を社会的ジレンマとの関係で論じている場合のように、数理モデルとの関係が意識されている事例研究が多い。
私自身が数理と計量を研究してきたし、実際に聞いた報告も少なくないので、ほとんどの発表はタイトルと発表者名、セッションのタイトルから数理か計量か判別できたが、迷う場合は報告要旨の内容をチェックして分類している。
また、数理社会学会では 2003 年の春(大分大学で開催)にポスターセッションをはじめて導入しており、2004 年に一度消滅するものの、2005 年からは「萌芽的セッション」の名称でポスター報告が続けられている。口頭かポスターかについても分類し、それぞれの報告数を数えた。それゆえ報告は
の 4 種類に分類してそれぞれの数を大会ごとに数えてある。
データは、一つの大会を 1 ケースとみなした時系列データデータであり (\(N=61\))、各種の報告の数が変数として入力されている。以下は直近の 7 回の大会のデータである。
## year season place poster.math poster.stat oral.stat oral.math
## 55 2013 s 東北学院 7 7 13 13
## 56 2013 f 関学 6 8 14 7
## 57 2014 s 山形 6 13 12 6
## 58 2014 f 日本女子 6 6 7 9
## 59 2015 s 久留米 8 25 20 11
## 60 2015 f 大経大 7 19 13 11
## 61 2016 s 上智 12 24 21 15
それぞれの種類の報告数と報告総数 (total) の記述統計と相関行列は以下のとおり。
## poster.math poster.stat oral.stat oral.math total
## Min. : 0.00 Min. : 0.00 Min. : 1.00 Min. : 4.00 Min. : 7.0
## 1st Qu.: 0.00 1st Qu.: 0.00 1st Qu.: 4.00 1st Qu.: 7.00 1st Qu.:12.0
## Median : 0.00 Median : 0.00 Median : 7.00 Median : 9.00 Median :17.0
## Mean : 1.84 Mean : 2.95 Mean : 7.39 Mean : 9.38 Mean :21.6
## 3rd Qu.: 2.00 3rd Qu.: 4.00 3rd Qu.:10.00 3rd Qu.:11.00 3rd Qu.:28.0
## Max. :12.00 Max. :25.00 Max. :21.00 Max. :20.00 Max. :72.0
## [1] "標準偏差"
## poster.math poster.stat oral.stat oral.math total
## 3.1 5.7 4.5 3.6 13.9
## [1] "相関行列"
## poster.math poster.stat oral.stat oral.math total
## poster.math 1.00 0.88 0.71 0.31 0.89
## poster.stat 0.88 1.00 0.76 0.30 0.93
## oral.stat 0.71 0.76 1.00 0.33 0.87
## oral.math 0.31 0.30 0.33 1.00 0.56
## total 0.89 0.93 0.87 0.56 1.00
まず報告数全体のトレンドから確認しよう。下の図 1 の最上段のパネルが JAMS での報告総数の推移を示しており、その下が 2 時点分の移動平均である。移動平均を見ると、概ね 1986–1995, 1996–2009, 2010–2016 の 3 つの時期にわけられそうである。1986–1995 年期は報告数は横ばい、1996-2009 年期は緩やかな上昇、2010–2016 年期は急激な上昇期と言える。
3 つ目のパネルは季節要因の効果を示している。春は全体の平均よりも 1.07倍報告数が多く、秋は全体の平均よりも 0.93倍しか報告がない、という結果である。図はこの 2 つの数値を繰り返しプロットしているだけである。見方を変えれば、秋と春の報告数を比較すると、平均的には、春のほうが 1.14 倍、報告が多い。たいした違いではないと感じるが、回帰分析で季節要因について検定してみよう。下の表 1 は報告数がポアソン分布すると仮定して(ただし、dispersion parameter はデータから推定しているので負二項分布を仮定しているのとほとんど同じ)、最尤推定法で回帰分析した結果(従属変数は対数変換)である。誤差相関などは仮定していない。これを見ると、Fall Dummy (秋の大会ダミー)は Model 1 以外では 5% 水準で有意である。大会の行われた年 (Year - 2001)、およびその二乗 ((Year - 2001)^2) の効果は一貫して有意であるが、三乗の効果は有意ではない。それゆえ、表 1 の中では Model 3 が最良のモデルと言える。
## [1] "表1: ポアソン回帰による報告数の予測"
##
## ===========================================================
## Model 1 Model 2 Model 3 Model 4
## -----------------------------------------------------------
## (Intercept) 2.96 *** 2.86 *** 2.73 *** 2.75 ***
## (0.12) (0.06) (0.06) (0.06)
## Fall Dummy 0.20 0.16 * 0.15 * 0.14 *
## (0.16) (0.07) (0.06) (0.06)
## Year - 2001 0.06 *** 0.06 *** 0.05 ***
## (0.00) (0.00) (0.01)
## (Year -2001)^2 0.00 *** 0.00 **
## (0.00) (0.00)
## (Year -2001)^3 0.00
## (0.00)
## -----------------------------------------------------------
## Deviance 442.90 91.20 73.09 71.88
## Num. obs. 61 61 61 61
## ===========================================================
## *** p < 0.001, ** p < 0.01, * p < 0.05
次に残差について検討しよう。図 1 の一番下のパネルが移動平均でも季節要因でも説明できない、そのときの大会に固有の残差であり、乗法モデルなので 移動平均と季節要因から予測される報告数に比べて、実際の報告数が何倍であったかを示す。それゆえ、1 より大きければ移動平均と季節要因から予測されるよりも実際の報告総数は多く、1 よりも小さければ予測よりも少なかったということである。移動平均からの残差なので波動を繰り返すのは自明であるが、この残差の標準偏差は 0.16 で、季節要因の標準偏差が 0.07 であるのに比べて顕著にバラつきが大きいことがわかる。
次に表1 の Model 3 の残差の自己相関について調べてみた結果が図2 である。これはコレログラムと呼ばれるもので、左がゼロ時点前から 17 時点前までのゼロ次の自己相関、右が 1 時点前から 16 時点前までの偏自己相関を示している。青い点線は 5% 水準の検定の限界値を示しており、これらよりも大きい絶対値を取ると、統計的に有意である。これらを見ると、 6 時点前(つまり3年前)とのゼロ次の自己相関が -0.31 で有意であることがわかる。この傾向は偏自己相関係数でも同じである。12 時点前とのゼロ次の自己相関も有意であるが、偏相関をとると有意にならないので、これは無視してよさそうである。つまり 3 年前に報告が少ないと当年の報告は多くなりやすいということだが、特に理由も思いあたらないので、偶然有意になっているだけなのかもしれない(何回も検定を繰り返すと 1 回以上有意な結果が出る確率は 5% よりもずっと大きくなる)。
以上の結果からは誤差相関はあったとしてもそれほど大きくないことがわかり、おおむね無視してもよさそうである。
次に口頭とポスターの報告数を示したのが下の図3 である。波打っている線が実際の報告数で直線は回帰直線である。
これを見ると、ポスター報告が 2003 年の導入以来、波動しながらも増加を続けていることがわかるが、口頭報告も増え続けているのがわかる。 OLS で単純に報告数を年次に線形回帰させると、図のような回帰直線が得られる。口頭報告数の傾きは 0.54 で 0.1% 水準で有意である。ポスターの傾きも 0.1% 水準で有意になる。
ポスターがはじめて導入された 2003 年春の大分大学での大会と一番最近の大会である 2016年春の上智大学での口頭とポスターの報告数、およびそれぞれの増加数は下の表2のとおりであった。
表2: 2003年と2016年のあいだの報告数の増加
報告の種類 | 2003年春の報告数 | 2016 年春の報告数 | 増加数 |
---|---|---|---|
口頭 | 23 | 36 | 13 |
ポスター | 2 | 36 | 34 |
計 | 25 | 72 | 47 |
すべての報告数を見ると、25 から 72 に増加しており、47 増えているが、そのうち \(34 / 47 =\) 0.72 がポスター報告の増加によるものであるから、ポスター報告の導入が数理社会学会の活性化につながっているという認識は間違っていないように思える(が、そのような因果関係がこの分析で証明できるわけではない)。
数理と計量の報告数を示したのが、下の図 4 である。これを見ると、2014 年頃までは数理と計量の報告数はほぼ同じか若干数理のほうが多かったが、2015 年の春から 3 期続けて計量が数理よりも多い状態が続いている。
以下のようにすべての報告に占める数理の比率を推定すると、 1986–1990 年には 7 割程度で有意に過半数を超えていたが、2011–2016 年期には 4 割程度で有意に過半数を下回っている。
## [1] "1986-1990年の報告に占める数理の比率の検定(帰無仮説は数理の比率 = 0.5)と区間推定"
##
## 1-sample proportions test with continuity correction
##
## data: as.table(n1), null probability 0.5
## X-squared = 17.12, df = 1, p-value = 3.508e-05
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.6069581 0.7857192
## sample estimates:
## p
## 0.7037037
## [1] "2011-2016年の報告に占める数理の比率の検定(帰無仮説は数理の比率 = 0.5)と区間推定"
##
## 1-sample proportions test with continuity correction
##
## data: as.table(n2), null probability 0.5
## X-squared = 14.881, df = 1, p-value = 0.0001145
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.3690451 0.4572783
## sample estimates:
## p
## 0.4124748
次に報告総数の場合と同じようにポアソン分布を仮定して、回帰分析した結果が下の表 3 である。
## [1] "表3: 数理と計量の報告数のポアソン回帰分析 1986-2016"
##
## =====================================
## 数理 計量
## -------------------------------------
## (Intercept) 2.22 *** 1.83 ***
## (0.08) (0.08)
## Fall Dummy 0.13 0.16 *
## (0.09) (0.08)
## Year - 2001 0.03 *** 0.08 ***
## (0.00) (0.01)
## (Year - 2001)^2 0.00 0.00 **
## (0.00) (0.00)
## -------------------------------------
## Deviance 67.39 52.83
## Num. obs. 61 61
## =====================================
## *** p < 0.001, ** p < 0.01, * p < 0.05
確かに計量のほうが急激に増加していると言えるだろうが、数理の報告数も右肩上がりで増加しているということは強調しておきたい。なお、数理と計量の残差の相関をとると 0.22 でわずかに相関しているが、有意ではない。人気の観光地や東京のように利便性の高い場所で開催される時には報告数が増える印象があるので、そのせいで多少の相関が生じていると思う。なお残差の自己相関もそれぞれ検討したが、報告総数の場合とほぼ同じで無視しても構わないと思われる。
最後に計量の増加とポスターの増加に関係があるのか検討してみよう。もしも計量とポスターの相性が良いならば、ポスターの導入によって計量が増えたという仮説も考えられるからである。まずポスターが導入された 2003年以降に関して報告の種類(口頭かポスターか)と方法(数理か計量か)で 4タイプに分類してそれぞれの報告数の推移を示したのが図 5 である。赤い線が数理、青い線が計量であり、実線が口頭報告、破線がポスター報告である。
若干、ポスターで計量が多く、口頭で数理が多いようにも見えるが定かで無いので、報告を分析の単位にして大会別に 種類\(\times\)方法 の \(2\times2\) のクロス表を作って対数オッズ比を計算してプロットしたのが図 6 である。0 より大きければ、数理は口頭と、計量はポスターと結びつく傾向があるということである。
対数オッズ比は大きく波動しているが、0 より大きい時のほうが多いことがわかる。対数オッズ比は 2003–2016 年のあいだ変化がないと仮定して推定すると、0.33 (\(p=\) 0.04) で、有意である(対数線形モデルで対連関モデルを推定した)。あまり大きな関連ではないが、計量のほうがポスター報告しやすいという傾向が見られる。 つまり、ポスター報告が増えたから計量が増えたのか、計量が増えたからポスター報告が増えたのかはわからないが、計量とポスター報告の増加には多少の関連があるということである。
図 4 で示したように数理の報告は増加しており、数理の研究が減少しているとは考えにくい。もちろん、このレポートでは「数理社会学」の定義を非常に広くとっているので、狭くとればまた違ったトレンドになるかもしれない。しかし、数理社会学に限らずどんな分野でも、理想的なホンモノの研究だけを数えようとし始めると、ホンモノなどほとんど存在しないということになってしまい、どんな分野でも常に「危機」にあるということになってしまいがちである。大まかに見れば、確かに計量の報告数のほうが増加のペースは早く、最近は数理よりも計量のほうが報告数が多くなっている。しかし、それは数理の研究が減少しているというわけではなく、数理も増加しているのである。常に危機意識を持つことは良いことだと思うが、あまり数理社会学の現状に関して悲観的になる必要はないように思う。
このような現状に鑑みれば、数理か計量かを問わず多くの報告者を呼びこむのが JAMS としては得策であり、萌芽的セッションの効用を特に強調するのが良いように思う。「数理」社会学会という名称が、JAMS の敷居を高くしているという印象を、これまで大学院生の反応などから受けてきたのだが、この「萌芽」的セッションという名称が、その敷居を低くする役割を果たしているのかもしれない。また、JAMS の萌芽的セッションは日本社会学会のポスターセッションに比べると、一発表あたりの聴衆数やディスカッション時間が顕著に多い印象があり、こういったアクティブな聴衆の存在が萌芽的セッションで報告することのメリットを高め、それが報告数の増加につながっているのかもしれない。 JAMS の外部にこういったメリットの大きさを伝えることができれば、さらに参加者を呼びこむことが可能かもしれない。
このような議論は、できるだけ、
ということが JAMS の利益にかなっているということを前提にしている。しかし、このような前提に同意しない JAMS 会員もいるかもしれない。なぜなら「ココロザシの高い少数の研究者からなる学会にしておきたい。」といった意見を聞いたこともあるからである。このような問題については稿を改めて論じる(あるいは別の場で議論する)ことにしたいが、上記の前提は多くの JAMS 会員が共有しているものだと私は信じている。