この度、国立国語研究所、機関拠点型基幹研究プロジェクト「日本語学習者のコミュニケーションの多角的解明」の研究成果として、『BTSJ日本語自然会話コーパス(トランスクリプト・音声)2021年3月版』を公開する運びとなりましたので、お知らせします。

本コーパスには、発話の重なりや沈黙など、語用論的分析に不可欠な情報を付与する『基本的な文字化の原則(BTSJ: Basic Transcription System for Japanese)』によって文字化されたトランスクリプトと音声が収録されています。

本コーパスの会話データは、場面や話者同士の関係などの条件が統制して収集され、「会話グループ」ごとにまとめて収録されていることが特徴です。 『BTSJ日本語自然会話コーパス(トランスクリプト・音声)2020年版』の377会話に69会話が追加され、合計446会話、総時間6753分8秒(約112.5時間(音声付きデータは316会話、4419分6秒(約73.5時間)、5.07GB)の自然会話が収録されています。

現在公開されている「自然会話(トランスクリプト・音声付)のコーパス」としては、国内外において最大規模のものの一つです。

下記のURLから「利用申込み」をしていただければ、無料で配布します。

URL:https://ninjal-usamilab.info/btsj_corpus/

本コーパスについての詳細情報、利用に際しての注意事項をご確認の上、お申込みください。

また、万が一、データの不備等に気づかれた場合は、お手数ですが、下記事務局までご連絡ください。

その他、本コーパスに関するお問い合わせも、下記事務局宛てにお願いします。

なお、『基本的な文字化の原則(BTSJ)』、本コーパス及びその前身にあたる2020年版コーパスを利用して論文を執筆された方は、下記リンクより書誌情報が入力できますので、その旨、ご報告いただければ幸いです。(過去の論文も歓迎します。)

「BTSJ使用報告はこちら」

https://ninjal-usamilab.info/lab/btsj_form/

または、

https://ninjal-usamilab.info/btsj_use-report/

関連分野における研究成果を共有することで、研究の相互促進を図ることを企図したコーパス公開ですので、是非、書誌情報の提供にご協力をお願いします。

本コーパスが、少しでも皆さんの研究のお役に立てば幸いです。

 

宇佐美まゆみ

国立国語研究所 日本語教育研究領域

 

【本コーパスに関するお問合せ】

国立国語研究所 日本語教育研究領域

『BTSJ日本語自然会話コーパス』事務局

btsjcorpus@ninjal.ac.jp

電話番号 042-540-4572