Hatena::Grouprekken

murawaki の雑記

2012-06-03

The Accentual History of the Japanese and Ryukyuan Languages

Moriyo Shimabukuro, The Accentual History of The Japanese and Ryukyuan Languages: A Reconstruction, Global Oriental, 2007.*1

表題が要点を押さえて簡潔。琉球諸方言を中心にとしたアクセントの通時的な研究。最終的には日本語祖語 (Proto-Japonic) のアクセント体系を再構している。

まさにこういう本が欲しいと思っていた。私の要求は、まずはアクセントに関する知識を更新すること。知識が金田一春彦の全集を読んだ状態でほとんど止まっていた。最近の進展を知りたいが、専門外なので個別の論文を読むのはつらい。*2 こういうモノグラフで網羅的に書いてくれると助かる。特に 2 章の関連研究に 70 ページも費やしている。昔の人がてんでバラバラなことを言っていて面白い。

やりたいのは日本語内部 (諸方言) の系統の解明。個人的にはこれがデータを計算機処理で実現できたらなおうれしい。最近では基礎語彙を glottochronology 的に処理する研究を雑記で取り上げた。しかし、語彙から攻めるのは難しそうな感じがする。それに対して、アクセントは有望な手がかりではないかと前々から期待している。日本語の方言間で何が異なるかと言えば、こんなに違いが大きい特徴は素人目には他にない。自分が話している言葉 (神戸弁) が東京のと別言語という確信があるのは、アクセントが違うから (京阪式アクセントと東京式アクセント)。しかしアクセントは難しい。問題が込み入っている。整理のために書きだしてみる。

アクセントの通時的研究は、比較言語学で普通に sound change を追いかけるのとは少し違う。一つは比較の単位が違う。普通は単語同士を比較する。例えば、water と Wasser とか。アクセントの場合は単語をグループ化し、グループ同士を比較する。『類聚名義抄』に基づく「類」というやつが広く使われている。「端」は 2.1 (2 拍 1 類)、「橋」は 2.2、「箸」は 2.4 という具合。何がうれしいかというと、一つの言語が簡潔に表現できること。普通なら一つの言語は語彙集合で表現され、言語のペアの比較は語彙集合同士の比較で実現される。これは文字列同士のアラインメント。計算機に処理されるのが大変。アクセント体系同士なら簡単に比較できそう。その分、通常なら計算上の制限からできないような複雑な推論がアクセント体系ならできそう。

もう一つの違いは、取り得る状態が閉じている (いそう) か否か。普通の音韻変化の場合に有り得そうな罠は、言語 A から言語 B への変化の過程に中間状態 X が想定でき、その X には A、B のいずれにも出現しない音素が出現するというもの。適当な手法で言語の系統樹を作ろうとしたとき、まず音素集合の時点で解空間が閉じているのかわからない。そのため、現実的には開始時点で系統樹上のノードを (少なくとも部分的に) データが観測された言語に限定せざるを得ない。アクセントなら、H か L の 2 種類。1拍内で変化する場合 R (LH)、F (HL) を加えても 4 種類。2 拍なら有り得なさそうなのを含めたとしても上限は 16 種類 (実際のデータは『類聚名義抄』で5種類)。*3 観測された言語同士を結びつける経路に観測されていない途中状態の言語を考える、つまりノード数を仮定しない推論も行えそうな気がしてくる。

しかし、このあたりからわからなくなってくる。ある言語があったとして、その言語を 1 ホップだけ変化させた言語の候補集合を (かならず正解が集合に含まれるように) 定義できるだろうか。もしそれができたら、各言語をノードとする有向グラフが作れる。その部分集合からなる木が一つの系統樹の候補となる。*4どういうものを想定しているかというと、奥村 (1990) が 2 拍名詞を処理して作った九州諸方言の系統樹みたいなの。『方言アクセントの誕生』(p.31) が引用している。引用者が指摘しているし、後で書くように、アクセントを音韻的に解釈すると、奥村説は怪しい。locus + register の体系が locus のみの体系を経由して register のみの体系に変化していることになる。計算を通じてこの問題を解決したい。

ある系統樹が別の系統樹よりもっともらしいとどうすれば言えるか。各アクセント変化に対して起こりやすさを評価できればよさそう。ちょうど音韻変化で

p → ɸ → h

という変化は自然だけど、逆は起こりにくいという具合。起こりやすいアクセント変化というものは、古くは金田一も議論していたけど、ピンとこない。上述の奥村 (1990) の系統樹も、ぱっと見ただけでは本当に正しいのかわからない。よく分からないので計算機にやらせたい。大量の方言データを与えて、簡潔な系統樹を好むように推論させたら、同時に起こりやすいアクセント変化も浮かび上がってくるという幸せな展開。数百方言で同じ形式のデータがあればマイニングできそう。残念ながら、現時点ではそんなデータは存在しない。島袋も、過去の研究で採取されたデータを利用してはいるものの、言語数を絞って、生の報告から再構成し、足りない部分は自分で補っている。

もう少し使える制約がある。一度失われた区別は回復しない。例えば現代京都方言では 2.2 (例えば「橋」) と 2.3 (例えば「花」) は合流して HL となっている。これが将来再び 2.2 と 2.3 に分離することはない。

ここで落とし穴に気づく。アクセントに閉じた変化を追っていると、現状の区別を維持するか、区別を失って単純化するしかないということになる。実際にはそうではない。奥村 (1990) の系統樹をよく見ると、例えば豊前の「安心院式」では 2.3 が広母音と狭母音で分離して、狭母音は 2.4-5 と合流している。要するに、変化がアクセント内部に閉じているという仮定が間違っている。アクセントの区別が増えるとき、それはアクセント体系の外から来る。広母音/狭母音の対立の他には、長母音/短母音の対立、通常の拍に対する促音 Q や撥音 N など (島袋も 4.2.3-6 節で議論している)。一つの対策は、『類聚名義抄』に基づく「類」よりも細かいグループを設定すること。観測ずみの言語が持つ区別を最大公約数的に反映させたグループ。現代の方言データから過去にさかのぼる分には、とりあえず誤魔化せるかもしれない。しかし、未来を予測する場合にはこれでは駄目。もう一つの対策は、撥音などを含む語は無視して、典型的な構成 (CV の連続) からなる語に対象を絞り込むこと。広母音/狭母音の対立は多分広母音を採るのだろう。そういうことをしてデータを減らしていくと、グループに所属する語がなくなってしまう。

H や L はあくまで音声的な表現。音韻的な解釈は別。何が弁別的かに着目する。島袋が採るのは register と locus鹿児島のは register のみ。東京locus (アクセントの滝というやつ) のみ。京都は register と locus の両方。5 章で詳述される琉球諸方言は入り乱れていてカオス。例えば、同じ八重山方言でも石垣は register、西表島祖納は locus (5.5 節)。

音韻的解釈の利点はある言語内の整合性が見通せること。*5例えば、1拍、2拍名詞は register の区別だけど、3拍名詞は locus の区別という体系は不自然。欠点は職人技が必要なこと。音韻論は本当に解釈なので、音声的な表現から異論なく導ける気がしない。音声表記を入力として、音韻体系を出力するアルゴリズムが書けるかというと厳しそう。例えば祖納の例だと、1 音節名詞だけ見ると register っぽいけど、2, 3 音節名詞との整合性を考えて locus とみなすという解釈をとっている。

音韻的解釈は基本的にはある言語の体系だが、島袋は言語間の関係 (変化) も音韻層で変化を追う。さらに個々の変化に名前をつけている。F-loss (Final Accent Loss)、C-simp (Contour Pitch Simplification), L-sprd (Low Pitch Spreading) とか。見通しは良くなっている。しかし職人技に職人技を重ねる。恣意性が入らないように計算機で実現するのは難しそう。計算機でなにかするときには、どこかで割り切って暴力的にいかなければならない。

島袋は実質的に系統論に commit していない。Proto-Amami とか Proto-Okinawa とか、いろんな祖語の体系が再構している。しかし、それらの存在を仮定することへの正当化があまりない。あくまで比較分析によって導かれる作業仮説という感じが強い。素朴な疑問として、Proto-Amami を大島名瀬、沖永良部島上城、徳之島亀津から再構するのは妥当なのだろうか。一般に聞く話では、沖永良部は沖縄北部に近い方言で、大島よりも今帰仁に似ているはず。上城を沖縄側に入れた場合も検討して、いずれが適切か検討してほしいところ。しかしそんなことをやりだすと、ただでさえ込み入った議論がさらに複雑になって人間が読める代物ではなくなりそう。

そもそも島袋は事前に設定した言語 (ノード) 間のパスは描くが、事前に設定した木構造はいじらない。祖語を共有する二つの子孫がどの時点で分岐したかに無頓着。試しに自分で作業してみる。Proto-Ryukyuan -> Proto-Amami (5.8.1 節) と Proto-Amami -> Kamishiro (5.2.3.2 節) を繋いだものと、Proto-Ryukyuan -> Proto-Okinawa (5.8.2 節) と Proto-Okinawa -> Nakijin (5.3.4.1 節) を繋いだものをノートに書いて比較してみる。まったく重なる途中ノードがない。例えば 3 音節名詞に着目する。Proto-Ryukyuan で a, b, c, d, e, f の 6 種類の区別があり、今帰仁では a-b, c-d-e-f の 2 種類、上城で a-b, c-d, e-f の 3 種類。a, b は無視して、c から f までに注目する。Proto-Ryukyuan -> Proto-Amami で c, d の区別が失われ、Proto-Amami -> Kamishiro で e, f の区別が失われている。一方、Proto-Ryukyuan -> Proto-Okinawa では、まず c と f が合流、次に c-f と e が合流し、Proto-Okinawa -> Nakijin で c-e-f と d が合流している。沖縄側で真っ先に c と f が合流していることになっている一方、上城では現在でも c と f は区別されている。おかげで上城を沖縄側に付け替えられないようになっている。しかしこの再構案は怪しい気がする。どうして Proto-Okinawa で首里と今帰仁が区別しない c-e-f と d が区別されているかといえば、粟国方言で区別されていることになっているから。証拠は2語だけ。「むかで」(3.2) と「こよみ」(3.4)。基礎が危うい。解釈次第でもっと別の系統樹が想定できそう。

あとは本文に散りばめられている面白い話について適当に書き散らす。そのひとつは、現代京都は類聚名義抄の直接の子孫ではないという主張 (4.2.1 節とか)。3 拍名詞のアクセント変化が類聚名義抄からでは説明できない。

Proto-Ryukyuan を再構した結果が register と locus を両方持った体系。HHH(H) とかあって、京阪アクセントみたい。あのあたりの方言は register だけだったり locus だけだったりする。しかも分布が入り乱れている。普通に再構すれば両方持っていたという結論になる。島袋も紹介しているが、昔からの議論で、京阪式と東京式のどちらが古いかというものがある。分布を見ると、京阪式は東西に東西を東京式に挟まれていて、おまけに吉野が飛び地で東京式。普通に考えれば東京式が古形で、京阪式が変化したという周圏論的解釈になる。でも、京阪式の方が古いということで決着している。要するに日本語の変化はひたすらアクセント体系が単純化するというもので、京阪式の東西でどうやら独立に同種の単純化が起きたらしいという解釈になっていた。今回、Proto-Ryukyuan も同じような変化を遂げたという主張が付け足された。だから、現代九州のどこかの方言を適当に変化させたところで Ryukyuan にはならないだろう。

与太話。データがないので議論しようがない話。日本語は変。声調に関する通時的な議論は、たいてい tonogenesis。興味は声調がどうやって発生したかにある。例えばチベット語やタイ語では綴字と発音の関係から声調の発生理由が推測できる。要するに声調は歴史時代になってから発生している。子音 (クラスタ) の消失や子音間の区別の消失を埋め合わせる形で。漢語も、中古音は日本漢字音から想像できる範囲だが、上古音はチベット語の綴りのような面妖な重子音が想定されている。さらにそれ以前には複数音節だったと見られる。ベトナム語は今では冗談みたいに複雑な声調体系を持っているが、tonal でないクメール語の親戚。*6 世の中不思議。どの言語もさかのぼれば声調発生前が推測できる。日本語だけが、さかのぼっていくと、現代より、あるいは文献で attest された上代語より、複雑な声調体系になる。声調発生前にたどりつけない。島袋も Conclusion で Vovin (2000) を引きつつ少しだけ言及している。日本語の固有語の子音に有声/無声の対立がなさそうなのは、声調体系と関係があるだろう。常識的に考えて。Vovin (2000) によれば、あともう一つは母音の長さが関係しているらしい。

*1:著者の漢字表記は島袋盛世。

*2:Cross-linguistic Studies of Tonal Phenomena という何度か開催されたシンポジウムの予稿集なんかを読んだりしたが挫折気味。あとは Proto-Japanese: Issues and Prospects 中のいくつかのアクセント関係の論文とか。

*3:本当は後続する助詞が H か L かも含めないといけない。

*4:二つのパスが一度分岐したあと同じ状態にたどりつくことはありえるから、この説明は正確ではない。この場合、同じ状態の別ノードと扱わないといけない。

*5:もうひとつ、音声表記では、名詞自体のアクセントだけでなく、後続の助詞の高低を議論していた。音韻的には名詞内の音韻表記だけで処理できる。

*6:クメール語も一部の方言は最近は声調が発生しつつあるらしいけど。