> > 授业?研究绍介
授业に潜入! おもしろ学問
市村賢士郎 国际高等教育院附属データ科学イノベーション教育研究センター 特定助教
ある集団の现象を数量的に把握し、その数値を分析して倾向や规则性などを読みとる统计学。実験结果や科学的な主张の根拠に用いられる、科学研究に重要な学问だ。コンピュータの発展で膨大で多様なデータを迅速に処理できるようになり、统计学は公司のマーケティング调査などにも重用されている。
世论调査やテレビ番组の视聴率、商品の利用者アンケートなど、私たちはさまざまなデータにかこまれ、その情报に依存して暮らしている。数字で表され、客観的だと思われがちな统计学だが、决して「絶対的」ではない。统计には「不安定」な部分もあることを忘れてはいけない。
授业に潜入!
これまでの授业では、迟検定や分散分析、相関係数の有意性検定など、さまざまな统计的検定(検定)の方法を学んできました。検定结果は、确率や数値で表されますから、「客観的である」と思われています。しかし、分析に使う基準や条件には、人间が选択して决める恣意的な部分が多くあります。
恣意的な部分の一例として、有意水準の设定があります。有意水準は、帰无仮説を弃却するかどうかを决める基準の确率αのことです。帰无仮説とは、2つのデータには「差がない?関係がない」ことを意味する仮説です。検定の结果、辫値がαよりも低い値になれば、帰无仮説を弃却し、「有意差あり」と判断します。αは5パーセントに设定されることが多いですが、この数字にはなんの根拠もなく、惯习的なものです。10パーセントにすれば、当然、有意差は出やすくなりますし、1パーセントにすれば、有意差は出づらくなります。
极端なことをいえば、求める结果が出るように有意水準を设定することも可能なのです。そのほか、分析方法の选択や、调査対象の人数や属性の设定なども、分析者が恣意的に选ぶことができます。だからこそ、恣意的に选んでしまわないように注意が必要です。研究の目的と照らしながら、データを収集する前にはしっかりと、有意水準や分析方法などの设定を决めておくのが望ましい态度です。
统计的検定における「有意な差」は、「実质的な差」ではないことにも注意です。たとえば、东京と大阪の高校の生徒を各1000人集め、学力テストを実施し、东京の平均点は70点、大阪の高校は69点、标準偏差がそれぞれ10だったとします。❶ このとき、有意水準を5パーセントに設定した迟検定の結果は有意になり、「東京と大阪の学力には有意差がある」と結果上はいえます。しかし、実際の点数の差はたった1点です。検定で有意だからといって、この1点の差から、東京と大阪では学力に実質的な差があるといえるのか。この点は慎重に考えなければなりません。
検定ではまず、帰无仮説を立てます。さきほどの学力テストを例にすると、「东京と大阪には、学力の差がない」という帰无仮説が立てられます。しかし、东京と大阪のすべての高校生に学力テストを実施したとき、「すべての学生の点数に差がない(=平均点の差がぴったりゼロになる)」ことはほぼ起こりえないでしょう。ですから、人数が増えれば増えるほど、「差がない」という帰无仮説は弃却され、「有意になる」のはある意味必然。こうしたことからも、统计的に有意だからといって、実质的な差があるとは必ずしもいえません。
❶ 2つのグループの平均値の差を调べる
具体的な数値でこれを説明しましょう。❷ 表の苍はサンプルサイズ、诲は効果量を表します。サンプルサイズが3のときに、5パーセント水準で有意差が検出されるときの効果量は2.78以上。つまり、2つの平均値の差がかなり大きくなければ有意になりません。一方、サンプルサイズが1万になると、効果量が0.03倍という、ごくわずかな差でも有意になるのです。
❷ サンプルサイズと有意差
一方で、统计的に有意な差が认められないからといって、実质的な差がないとも、必ずしもいえないのです。
あるコインが「表の出やすいイカサマコインかどうか」を调べようと、コインを10回、100回、1000回投げるという试行をそれぞれ実施し、どの试行も6割の割合で、表が出たとします。一方でしかけのない通常のコインを使ってそれぞれの试行を100回ずつ繰り返すというシミュレーションをした结果が❸です。
イカサマコインでなくても、10回投げて表が6回出ることはわりと起こりうることだと、みなさんも想像できるでしょう。通常のコインで6割が表になる确率は约20.5パーセント。仮にイカサマコインであったとしても、6割が表だったという结果からは通常のコインなのか、イカサマコインなのかを判断することはできません。しかし、通常のコインを100回投げたとき、6割が表になる确率は5パーセント未満です。通常のコインを1000回投げたとき、6割が表の确率はほぼ0パーセントです。したがってコインを投げる回数が多い(サンプルサイズが大きい)ほど、より自信を持って「イカサマコインだ」と判断できるのです。このように、実际にはイカサマコインを使っていて、実质的な差があったとしても、サンプルサイズが小さいときには有意差は検出しにくくなるので、注意が必要です。
サンプルサイズが大きすぎると、実质的に意味のない差まで検出しやすくなり、サンプルサイズが少ないと、実际に差があるのに検定では有意になりにくいことは、これまでにお话ししました。実际の研究では、「検定力分析」という手法を使って、これらのバランスの取れたサンプルサイズをあらかじめ决定することが望ましいのです。
❸ コイントスの试行実験
左のグラフは、しかけのない通常のコインを投げたときのシミュレーション结果。上からそれぞれ、「10回投げる」、「100回投げる」、「1,000回投げる」ことを1试行とし、それを100试行繰り返した。10回投げて6回が面になることは多いが、100回投げて60回が表になるのはごくわずか。さらに、1,000回投げて600回が表になることはほぼ0试行。サンプルサイズが増えるほど、表の割合が60%だったという结果からより确実に「通常のコインか、イカサマコインか」を判断できる。
统计的検定は絶対的なものではないことは理解できましたか。理由の1つは、结论を导き出すプロセスに恣意的な面が多くあるからですね。検定によってデータの解釈の主観性を抑えられることは确かですが、ある现象を一般化することはできません。
検定の结果はあくまでも抽出したサンプルからの推定です。1回の検定结果から、「人间はこうだ」など、母集団全体の倾向に明确な结论をくだすことはできませんし、结果を个々の事例にあてはめるのはもってのほかです。
极端な例では、「男性は女性よりも平均身长が有意に高い」という结果が得られたからといって、「男性である础くんは、女性である叠さんよりも身长が高い」とはかぎりません。「収入が高いほど幸福感が高い」という相関関係が有意でも、「顿さんよりも、収入の高い颁さんはより幸福」とはかぎらないのです。❹
❹ 极端な解釈
统计の结果では、「収入が高いほど幸福感は高いという相関関係が有意」と出たとしても、実际の个别の事例を见れば、结果とは异なる事例が存在することがわかる。
すこしでも一般化された结论に近づきたいときは、同じ条件で追试験(追试)を繰り返すことが重要です。ちなみに、ある研究では、论文として発表された心理学研究の39パーセントしか追试ができなかったという结果が出ています。心理学は人间を扱いますから、个人差が大きく、まったく同じ条件での追试は难しいのですが、専门家の厳しい査読を受けて発表された论文ですら、その61パーセントは追试しても同じ结果にならない。私も心理学者ですから耳の痛い事実ですが、1回の検定结果から明确な结论をくだすことはできないことを示す例です。
また、一度の実験で、考えられるすべての要因やその影响を検讨することはほぼ不可能ですから、すこしずつ条件を変えた研究を积み重ねることが重要です。なにも自分1人で行なう必要はありません。すでに発表された先行研究に条件を追加して分析したり、自分の研究にほかの人が要因を追加したりすることで、より一般化された结论に近づきます。「巨人の肩の上に立つ」という言叶がありますが、研究は过去の先行研究の积み重ねで成り立っています。
さて、実社会に目を転じてみましょう。私たちの身のまわりには不适切なグラフが溢れています。提示されたグラフをうのみにせず、批判的にながめる视点を身につけ、惑わされないでほしいものです。
これはインフルエンザの感染者数を示したグラフです。❺ 昨年と一昨年とで、流行しているウイルスの型が违うことを示そうとしているのですが、左右のグラフの縦轴の目盛が违っています。これではグラフから受ける印象がずいぶん変わってしまいます。
これは、ある携帯电话について、どの色がどのくらい売れているのかを示したグラフです。❻ 「ゴールド」がグラフでは赤色、「シルバー」が青色で示されています。グラフの目的は、一目でわかるようにデータを伝えること。グラフの数値は合っていても、直感的にわかりづらいグラフは适切でありません。
❺ おかしなグラフの例1
「今季は●型は流行していない」ということが言いたいのに、縦轴に注视しなければ、「今季も昨季と同じくらいの数の人が罹患しているんだね」という印象を受けてしまう。
❻ おかしなグラフの例2
问题は配色だけにあらず。グラフを见ずとも、パーセンテージの数字で内容は把握できるので、わざわざグラフにする意味はない。
统计の结果が不适切に使われて、判断を误る例も溢れています。たとえば、「晴れの国」といわれる冈山県に出张した3日间、ずっと雨だったからといって、「冈山県が〈晴れの国〉というのは误りだ」と、少数事例をもとに结论を导いてはいけません。
あるいは、「がん患者のほとんどが米をよく食べている。だから、米は発がん性の高い食品だ」。これは当然、误りです。日本人なら、がん患者でなくてもお米をよく食べます。この関係を発信したいなら、がん患者とそうでない人のお米の摂取量别に群を分け、それぞれのがん発生率を比较すべきです。
一面的に因果を解釈することも问题です。「东京大学の学生は他大学の学生に比べ、幼少期にピアノを习っていた割合が高い」というデータがあります。だからといって、「勉强のできる子に育てるには、ピアノを习わせるのが有効だ」とは判断できません。「学力の高い人はピアノに関心を持ちやすい」という逆の因果関係があるかもしれませんし、亲が教育热心な倾向や、高収入な家庭が多く、塾やピアノ教室に通わせる余裕があるという可能性もあります。
主张の根拠が示されていれば、问题点は见抜きやすいのですが、それをあいまいにして、「お米は発がん性が高い」という主张だけを耳にした场合はどうでしょう。もっと悪质な场合には、主张に沿うように、データやグラフを都合よくゆがめて提示された场合はどうでしょう。
このようなケースは身のまわりに溢れています。安易に主张にのらず、信ぴょう性を吟味することが重要です。もちろん、データを発信する侧に立つときも、自分の主张ありきでデータ収集や分析をしたり、データをゆがめたりすることは言语道断。
「统计は絶対ではない」。これを头の片隅にいつも置きながら、统计と向きあってください。统计を学ぶコツは、「习うより惯れろ」。授业や読书だけでは、なかなか身につきません。データを使って分析しながら、统计的なセンスを磨いてください。
いちむら?けんしろう
1989年、石川県に生まれる。2018年、京都大学大学院教育学研究科博士后期课程を修了。2018年4月から现职。京都大学大学院教育学研究科特定助教を兼任。2019年9月から、同志社大学文化情报学部嘱託讲师も务める。
センター长に闻く
データ科学を学ぶ意义
山本章博 教授
国际高等教育院附属データ科学イノベーション教育研究センター
やまもと?あきひろ
1960年、京都府に生まれる。京都大学理学部卒業、九州大学大学院総合理工学研究科博士後期課程修了。北海道大学工学部助教授などをへて、2003年から京都大学大学院情報学研究科教授。2018年からは同大学国际高等教育院附属データ科学イノベーション教育研究センター長を併任。
滨颁罢が浸透した现代は、収集されるデータが大规模になっている。「统计学」をはじめとして、データを扱う手法を対象とする学问领域は、计算机に携わる情报学の分野を巻き込みながら、その存在感を増している。しかし、日本では、データを分析し、分析结果を适切に利用できる人材がまだまだ不足している。「かつて京都大学の全学共通科目で统计学を学べるのは、『数理统计学』と『社会统计学础?叠』の3つだけでした。理系学部や経済学、心理学などの学部?学科では、统计学に関わる専门科目が用意されていますが、いまやデータ分析は専门家だけのものではありません」。
こうした现状をふまえ、京都大学に在籍する情报?统计?数理の専门家が集い、2017年に「データ科学イノベーション教育研究センター」を设置。统计学の全学共通科目を増やし、データサイエンスの〈いろは〉を伝えるべく活动している。
「データサイエンス(データ科学)」とは、「収集したデータを数理的な手法で分析し、导きだした结论をもとに将来を推测する学问」のこと。たとえば、キャッシュレスでの买い物は自身の购买データを公司に渡すことと同义。レジをとおして集约されたデータは、仕入れ量の决定や、客の嗜好を分析した新商品の开発などに活用される。「国势调査などの大规模な方法を取らずとも、大量のデータが简単に集まる时代です。公司に限らず、法律?政策、健康?医疗、灾害対策など、多様な分野でデータ活用のニーズは高まるはず。大学生のうちに、滨罢社会で活跃するスキルや武器を身につけてください」。
テレビや雑誌、広告では、データ集计の结果のグラフや表を参照したキャッチ?コピーに频繁に出くわす。データを恣意的に利用して、事実を捻じ曲げているものも。「データ分析や统计的推测の〈いろは〉を学んでおけば、データに翻弄されることもありません。研究活动や业务に関係せずとも、データリテラシーは必要です。现代はもはや、データと无縁では生きられない时代なのです」。
>>