なぜ世界は「べき則」であらわされるのか -ビッグデータの新しい統計法則の発見-

ターゲット
公开日

梅野健 情報学研究科教授、新谷健 同修士課程学生(現?フォルシア株式会社社員)は、株価や為替変動といった金融市場の価格変動分布、地震が起こる間隔などの確率統計分布、そしてインターネットのトラフィック等の世界中の様々なビッグデータに現れる「べき則」の普遍性を説明する、新しい統計法則を発見しました。この統計法則は、統計学の基本法則である中心極限定理を一般化した一般化中心極限定理を更に拡張したもので、「超一般化中心極限定理」と呼ぶことのできる画期的なものです。データ上に普遍的に現れる本法則によって、世界の様々な現象の統計モデルが構築できると期待されます。

本研究成果は、2018年4月2日午前10時に日本物理学会の国際学術誌「Journal of the Physical Society of Japan」の速報版にオンライン公開されました。

研究者からのコメント

左から、梅野教授、新谷修士课程学生

かつての伟大な研究者の発见である中心极限定理や一般化中心极限 定理に触れた时、とても美しく素晴らしい内容だと思いましたが、一方で、 现実のデータに适応するには少々数学的な制约が厳しいと感じたの がこの研究の始まりでした。ビッグデータの时代と言われる昨今、べき 则に従うデータは数多く観测されており、この研究が、 そういった世の中に遍在するべき则を分析するための一助になれば と思っています。

概要

世界はべき则で溢れています。金融市场の株価変动や為替変动といった価格変动分布、地震が起こる间隔などの确率统计分布、そしてインターネットのトラフィックなど世界中の様々なビッグデータが、べき则であらわされることがデータ解析によりわかってきました。ただ、なぜ、べき则が、异なる现象に普遍的に现れるのかといった基本的问题が、未解决なまま残されていました。最近では金融取引の自动化が进み、株価や為替変动の高频度化に伴ってデータ量がますます多くなり、データ上にべき则が现れるというこの倾向が、よりはっきりとしてきました。従来、统计学で用いられるデータ解析では、データの数 N を無限にとった時に現れる基本的な統計則として、中心極限定理や 一般化中心極限定理が用いられてきました。しかし、現代のビッグデータでは、個々に異なるべき則分布の和においても、ある基本形のべき則(レビの安定分布)になるという現象が見られます。これは従来の極限定理では捉えきれないものですが、そうした現象が現れる理由は解明されていませんでした。

本研究では、现実のデータを反映した、従来の统计则である极限定理では捉えることができない、异なるべき分布を个々に持つ独立な确率変数の和という统计モデルを定式化しました。その上で、データの数 N を无限にする极限において、レビの安定分布に収束するという极限定理を导出しました。

この极限定理は、统计学の基本法则である中心极限定理をべき则に一般化した一般化中心极限定理を、さらに异なるべき则の和の极限に拡张したもので、「超一般化中心极限定理」と呼ぶことができます。より一般化された状况でも成立する极限定理としての统计学的な意义があるとともに、现実世界の至るところに现れるべき则の普遍性を示すビッグデータの特徴を正确に记述する基本统计则としての意义も持つと考えられます。

详しい研究内容について

书誌情报

【顿翱滨】

【碍鲍搁贰狈础滨アクセス鲍搁尝】

Masaru Shintani and Ken Umeno (2018). Super Generalized Central Limit Theorem — Limit Distributions for Sums of Non-identical Random Variables with Power Laws —. Journal of the Physical Society of Japan, 87(4), 043003.