本研究室では言語行動の分析を通して人間を追究します。また言語教育学を人間同士の対話の学として捉え直していきます。

BTSJ日本語自然会話コーパスについて(2011年版)

宇佐美まゆみ監修(2011)『BTSJによる日本語話し言葉コーパス(トランスクリプト・音声)2011年版』について

1. 公開の目的

近年、自然会話分析が数多く行われるようになり、話し言葉のコーパスも様々な種類のものが公開されています。しかし、音声学的な分析や、形態素分 析、構文の分析のためではなく、人間の相互作用としての「言語運用」の分析に適した形で文字化され、蓄積された「話し言葉のコーパス」は、未だほとんどな いのが現状です。また、自然会話をデータとして用いる研究では、会話の収集、文字化といった基礎的作業をはじめ、その後の分析にも多大な時間と労力を要し ます。そのため、このような研究を効率的に進めていくには、自然会話データを共有化することが必要です。

そういう状況の中、宇佐美研究室では、多様な場面・言語(日本語、韓国語、中国語、英語など)の自然会話データを収集し、膨大な時間と労力を投入し て『BTS(Basic Transcription System)による多言語話し言葉コーパス』の構築に取り組んできました。2011年までに、研究成果として公開していたコーパスは以下の3つです。

  1. 『BTSによる多言語話し言葉コーパス-日本語会話1(日本語母語話者同士の会話)2007年版』116会話、1435分54秒(約24時間)
  2. 『BTSによる多言語話し言葉コーパス-日本語会話2(日本語母語話と学習者の会話)2007年版』37会話、691分11秒(約11時間)
  3. 『BTSJによる日本語話し言葉コーパス-日本語会話1(初対面・友人、雑談・討論・誘い)』99会話、1604分(約27時間)

上記1から3のコーパスに、新たに44会話252分(約4時間)分のトランスクリプト・音声データ、及び、既存のトランスクリプトの音声データ92 会話1005分11秒(約17時間)分を追加したものが『BTSJによる日本語話し言葉コーパス(トランスクリプト・音声)2011年版』です。本コーパ スには、294会話、総時間4000分31秒(約66時間)の会話が収録されており、そのうち音声付きデータは136会話、1164分43秒(約20時 間)です。整備にあたっては、記号などの表記を「改訂版:基本的な文字化の原則(BTSJ: Basic Transcription System for Japanese) 2011年版」に改めました。

2. 公開内容

会話参加者の年齢、性別、話題などが統制された形で集められていますので、様々な観点から比較・対照研究ができるようになっています。会話データ は、収集の条件や研究目的ごとに、ひとつの「会話グループ」に入っています。

また、BTSJの背景理論となる言語社会心理学、及びその方法論である総合的会話分析では、会話自体の分析のみならず、データの収集法、被験者の属 性調査など、「録音された会話」以外の部分の分析も、人間の相互作用としての「会話分析」のために、極めて重要だと捉えています。各会話グループの実験計 画や話者の年齢・性別・属性等のデータベースも入っていますので、分析にご活用ください。

表1に、本コーパスの概要を示します。

1994c「性差か力 (power) の差か: 初対面二者間の会話における話題宇佐美まゆみ(1994)導入の頻度と形式の分析より」『ことば』15、現代日本語研究会: 53-69.
1994b宇佐美まゆみ(1994)「場面に応じた「ね」の使い分け」『職場における女性の話しことば』(東京女性財団1993年度助成研究報告書)、現代日本語研究会: 51-60. 10頁. 1994年5月.
1994a宇佐美まゆみ(1994)「言語行動における “politeness” の日米比較」『スピーチ・コミュニケーション教育』7、日本コミュニケーション学会: 30-41. 12頁.

データ提供者は、以下の方々です(50音順)*クリックで表示
李恩美、伊集院郁子、宇佐美まゆみ、カチマレク・ミロスワバ、北見奈津子、木林理恵、金銀美、木山幸子、黄瓊芸、施信余、鄭賢児、関崎博紀、蘇玉 萍、高森絵美、張鈞竹、鄭榮美、藤田朋世、松本剛次、松本紫帆、宮武かおり、林君玲(50音順・敬称略)

  •  

研究室ブログ

PAGETOP
Copyright © 宇佐美まゆみ研究室 All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.