ターゲット
公开日
河原達也 情報学研究科教授、松浦孝平 同修士課程学生、三村正人 同研究員らの研究グループは、消滅危機言語に認定されているアイヌ語の音声を自動で認識し、合成する人工知能(AI)を研究?開発しました。
北海道のアイヌ文化は多くが口头で継承されてきましたが、アイヌ语は2009年に鲍狈贰厂颁翱により「极めて深刻な」消灭危机言语に认定される事态となっています。以前から口头伝承を録音?记録する活动が様々に行われてきたが、その书き起こし?アーカイブ化には膨大な手间とアイヌ语の知识を必要とするため、多くが未整备のままでした。
本研究グループは、アイヌ民族博物馆と平取町立二风谷アイヌ文化博物馆から提供いただいた计10名?约40时间の民话(ウエペケ?)の音声データを用いて、音声认识の単位?构成?学习法について様々な検讨を行いました。その结果、音节(子音-母音または子音-母音-子音)を単位として用いることで、深层学习に基づく贰苍诲-迟辞-贰苍诲モデルにより、94%の音素认识率?80%の単语认识率が実现できることを示しました。また、前记の音声データのうち1人当たり10时间以上ある话者について、同モデルにより音声合成を构筑しました。
本研究により、アイヌ语のアーカイブ构筑の効率化への寄与が期待されます。実际に、アイヌ民族博物馆において音声と书き起こし同期のための対応付けに活用され、1时间のデータに対して、人手で1日要する作业がほぼ完全に自动化できました。
本研究成果は、2020年9月9日の日本音响学会で报告され、10月12日に公表されました。
図:本研究の概要図
详しい研究内容について
书誌情报
- 京都新聞(10月13日 27面)、産経新聞(10月15日 28面)および読売新聞(2021年5月7日 21面)に掲載されました。