Hatena::Grouprekken

murawaki の雑記

2014-08-15

方言等語線

時間が経ったが、アイヌ語諸方言の系統樹の話の続き。系統樹の代わりに等語線 (isogloss) を引いてみる。

問題意識。方言群を系統樹で解釈するのは無理がある。接触による語彙伝播で説明するほうが良さそう。ではどうするか。ひとまず簡単に作れる別の表現を試す。ということで出てきたのが等語線。接触となると、とりあえず隣同士の関係を見ればすみそう。

思いつくままに系統樹と等語線の違いを挙げてみる。可視化される情報という点では、等語線は地理的に隣り合う方言同士の関係だけ。離れた方言同士の関係は可視化しない。等語線は隣同士であればすべて可視化する。系統樹は隣り合っていない関係も可視化するが、木を作るために一部だけを採用し、他を切り捨てる。

見ている情報という点では、等語線は隣との関係だけ。方言間に違いにはいろんな要因がある。該当方言だけの局所的な変化だとか、大方言群同士の境界だとか。等語線ではそうした要因はわからない。系統樹は木にそって要因を分割した結果。

御託を並べたところで、結果を見ていく。まずはアイヌ語

f:id:murawaki:20140701225807p:image:w400,h400

original authors: Lee S, Hasegawa T (2013); doi:10.1371/journal.pone.0062243.s001.

バイナリ化された基礎語彙の 0/1 の境界に線を引いている。太さが境界が置かれた数。不明 (?) の扱いがいい加減だが、大きな影響はないだろう。服部・知里論文の第3表 (p.62) にある同源語の一致率にほぼ相当する。表に並んだ数字を眺めていても分からない。こんな風に可視化した方が良い。

線は一部を除いて垂直二等分線。旭川は石狩水系だが、同水系の他の言語のデータがない。道南日本海側のデータもない。おかげで西側の南北境界が実際よりも北に引かれているのではないかという気がする。樺太の落帆と内路の間には無理矢理境界を設定した。Lee の系統樹では最初にくっつけていたので。落帆-美幌長万部-旭川長万部-宗谷なども無理矢理感がある。

気付いた点を挙げてみる。同じデータをそのまま見ているだけなので、服部・知里とくらべて特に新しい知見があるわけでない。

  • やはり北海道樺太の断絶が大きい。
  • 樺太はどこをとっても断絶が大きい。南部の多蘭泊-落帆間の断絶が一番大きい。結果的に、この2つが最後に (一番昔に) 結合するような木が推定されている。
  • 北海道北部、南西部、東部に3分されている印象。北部と東部をひとまとまりにする分類を別文献で見かけたが、両者の差異も大きそう。
  • 八雲-長万部と平取-貫気別-新冠はそれぞれまとまっている。両者の間の幌別中間的で、木を作る際にも困っている様子。
  • 服部も指摘しているが、日高南部の様似が新冠と似ておらず、むしろ釧路に近い。
  • 系統樹では宗谷北海道の外れ値となっているが、宗谷名寄の差はそこまで大きいわけではない。クラスタリングの都合で取り残されたことが確認できる。

あとは可視化には成功していないけど、データを眺めていて気付いた点。

  • 語同士が独立ではない。考えてみれば当たり前。調査票にある意味を表す語を聞いて回って、A を使う群と B を使う群が得られたら、A と B は相補的に分布する。多少の重複はあるけど。同じ調査項目の競合関係を系統モデルは無視する。
  • 全体に広がっているけど穴がある場合、あるいはその反対の局所的な分布は新しい変化と解釈できる。地理的に離れた複数の地点で使われている場合は、周圏論的に古いと解釈できる。分布がきれいに分断されている場合は、いずれが古いか、あるいはいずれも新しいか判断できない。
  • 南北境界はもちろん北海道樺太の間が一番大きいが、宗谷の南に引かれる例も目立つ。名寄の南に引かれる例もある。樺太南部北海道北部が共通することがあるが、北海道全土+樺太南部 という分布を持つ語はないみたい。北海道 + 樺太虫食い は樺太内部での局所的な改新だろう。一般には南北どちらが新しいか判断がつかない。
  • 北海道側の改新は複数の拡散パターンの重ねあわせっぽい。単一の中心点がある感じはしない。
  • 系統樹観点からすると、拡散領域が複数あるとして、重なりがなかったり、包含関係にあるなら木の形になる。複数の拡散領域が部分的に重なり合っていれば木にならない。そう考えるとやはり宗谷は重要。宗谷には劣るけど、幌別中間的で面白い。

ついでなので日本語も。

f:id:murawaki:20140704173012p:image:w400,h400

original authors: Lee S, Hasegawa T (2011); doi: 10.1098/rspb.2011.0518.

こちらは量が多いので機械的に処理しただけ。個別の語の分布は検討していない。

  • 八丈方言はどことも離れている。系統樹では八丈・静岡が100年ちょっと前に分岐していて変だと思ったが、静岡と特に近いわけではない。もっと昔に分岐したと考える方が自然なくらい違っている。いまの系統樹は、八丈方言ではここ100年ほどで急激な変化が起きたと解釈していることになる。おそらく、静岡に別の方言をくっつけていくと、祖語の内部状態が八丈からさらに離れていく。だから仕方なしにさっさとくっつけている。
  • 八丈方言と近い順に並べると、群馬鳥取静岡東京和歌山三重栃木となる。なぜ鳥取?
  • 個人的には兵庫京都大阪とやや離れているのが気になる。採取地点が播州加古川だから中国寄りなのだろう。それにしてもプロットしている点が西に寄り過ぎ。
  • 東西対立でいうと、北の糸魚川はそこそこ明確だけど、南側はぼやけている。
  • 九州熊本・大分が比較的似ているが、あとは離れている。そんなつながりがあったっけ?
  • 本土で一番離れているのは秋田鹿児島
  • 鹿児島・名瀬 (奄美) の差が注目されることが多い。実際、この断絶は秋田鹿児島よりも大きい。でもよく見ると、沖縄・池間 (宮古)、沖縄平良 (宮古) の差の方がさらに大きい。琉球というのはあくまで比較言語学が産んだ仮想的な群であって、実体としては存在しないのだろう。
  • それにしても、琉球諸方言の内部の差異は大きすぎる。考古学的な証拠からすると、宮古八重山への日本語話者の移動はあまり遡れない。となると、比較的短期間のうちに急激な変化が起きたことになる。あくまで推測だが、少数の話者が孤立しているとこういうことになる。言語変化を牽引するのはおそらく世代交代だから、通婚圈が狭いとなおさら。沖縄共同体の慣習を「ゆい」と言って変に理想化する言説も見られるけど、異常なほどの閉鎖社会だったんじゃないか。
  • 地図には載せられなかったが、上代語との距離でソートすると、上位は中古語、東京北海道山梨滋賀岐阜栃木の順。本土の下位は、佐賀鹿児島秋田青森の順。同じことを中古語でもやってみる。上位は東京北海道山梨長崎栃木。下位は佐賀秋田、宮崎、福岡青森。辺境が遠いのは分かるが、東京が近いのが謎。現代の関西諸方言が思ったよりも遠い。関西限定の改新が多かったということか。