Hatena::Grouprekken

murawaki の雑記

2016-12-10

UNESCO Atlas of the World's Languages in Danger の悲惨さとそれに関連するいくつか

Christopher Moseley ed. 2010. Atlas of the World’s Languages in Danger, 3rd edition. UNESCO Publishing. (online version).

UNESCO から出ている、世界の危機言語を地図に示した本。以下、危機言語本とよぶ。UNESCO を権威としてありがたがる人をいまでも時々見かける。彼らは現物を確認したことがあるのだろうか。実は、この本の日本に関する部分は、目を覆うばかりの悲惨な品質。本記事ではまずはこの本がいかにひどいか示す。

危機言語の保存というのは政治運動。なぜそんなものを取り上げるかというと、運動家*1が権威づけに利用しようと、言語研究 (特に系統や分類に関するもの) の成果に対して誤解、曲解、恣意的選択を行っているから。アホなことばかり言っていると槍が飛んでくるくらいが健全な状態だと思うが、当の研究者の対応は微温的。私の研究的な立ち位置*2は運動家と変わらないくらい周辺的だが、気づいてしまったからには書いてみることにする。

この話題を思い出したのは「種問題」ははてしなく続くというブログ記事を今年の9月に見かけたから。*3「言語多様性」という怪しげな政治的概念は「生物多様性」から借りてきたものだと思うが、生物側でも政治への対処が大変そうである。ただ、言語側には生物側とはおそらく事情が違う部分もある。昨今の言語研究の流行はこの手の政治運動にとって都合の悪い方向を向いている。この点にも触れる。

危機言語本の粗雑さ

危機言語本は2009年2月にオンライン版が発表されたのが最初で、本の出版は翌年にずれこんだようである。3rd edition となっているように、UNESCO からこの種の本が出るのは3度目。第3版といっても一から書き直された別物。第1版、第2版の編者はオーストラリアの Stephen Wurm だったが、Wurm は第2版が出版された年に亡くなっていて、第3版は同じくオーストラリアの Christopher Moseley が引き継いでいる。私が確認したのは第2版*4と第3版で、第1版は未見。

危機言語本の日本における受容は、日本には8つの危機言語があるという主張に焦点があてられている。すなわち、Ainu (Hokkaido), Hachijō, Amami, Kunigami, Okinawan, Miyako, Yaeyama, Yonaguni。今回はアイヌ八丈島は置いておく。問題は残り、いわゆる琉球諸語。一番の問題は言語認定の恣意性だが、その前に、危機言語本がこれらの「言語」をいかに粗雑に扱っているか見ておく。

atlas というのは地図を集めたもので、説明文をともなうことが多い。危機言語本の紙版も地図の他に本文がついていて、むしろこちらの方に紙面を割いている。本文は全体的な説明のあとに、地域別の説明 (Europe and the Caucasus, Greater Pacific area, North-east Asia など) が続いている。

では、問題の「言語」、例えば Amami はどのように説明されているのだろうか? 驚くなかれ、実はまったく出てこないのである。地図以外は、末尾の索引に載っているだけ。日本が載っていてもおかしくない章は North-east Asia と Greater Pacific area だが、いずれにも登場しない。

North-east Asia の章は Juha Janhunen が担当。Juha Janhunen はウラル語族アルタイ諸語を手広くやっている言語学者。この章では、Siberia の節で系統不明の弱小言語群を説明しているが、そこでついでにアイヌ語に言及している。それより南の話は出てこない。

Greater Pacific area の章は Darrell T. Tryon が担当。冒頭で以下のように宣言する。

The Greater Pacific area comprises Japan, Taiwan (China), the Philippines, insular Malaysia, Indonesia, Papua New Guinea, the Solomon Islands, Vanuatu, Fiji, Micronesia, Polynesia, Australia and New Zealand, as well as Hawaii.

しかし、日本については以後一切言及がない。なお、Darrell T. Tryon の専門はオーストロネシア語族

ちなみに第2版では Greater Pacific Area の章に Japan の節があって、The Japanese langauge of Japan と Ainu を簡単に紹介していた。第3版になってむしろ後退している。

ここまでくればわかったと思うが、危機言語業界 (?) には南北の縄張りがあって、辺境にあたる日本はぞんざいな扱いを受けている。

扱いの雑さを示す証拠はまだまだある。オンライン版は Google Maps を使っているから気づかないが、紙の地図は複数枚にわかれている。日本はちょうど南北の境界になっていて、八重山・与那国だけ別の地図にわけるという嫌がらせを受けている。大判の世界地図もあるが、言語が密集している地域は拡大図を載せている。そう、お察しの通り、八重山・与那国は台湾の拡大図に押し込まれている。

いったい誰の責任だろうか? 紙版ではそれがわからない。Contributers という章に貢献者一覧が載っているが、分担を書いていない。

オンライン版は言語ごとに貢献者と出典を載せている。Amami から Yonaguni までの貢献者はすべて Tapani Salminen。「お前誰やねん」とつっこまざるをえない。このあたりの言語を扱った論文でこの人が引用されているのを見たことがない。それもそのはず、貢献者欄で a specialist of Finno-Ugrian studies と紹介されており、本文の Europe and the Caucasus の章を担当している。要するに非専門家危機言語本というのは世界中からマイナーなところだけ集めてくる事業だから、難しいのだとは思うが、もう少し何とかならなかったのか。

出典として以下の3つを挙げる。

言語学者の論考は一番上の上村幸雄のだけ。残り2つは、こんなもの引用して恥ずかしくないのかと思う悲惨な代物だが、それについてはまた機会があれば取り上げる。ここで問題にすべきは、出典になっていないこと。すなわち、危機言語本の以下の主張は、上記の文献に対応物を見いだせない。

Uemura (2003) において、Amami (the dialects of the Amami region) は奄美群島全体を範囲とする。同様に、Okinawa(n) は沖縄本島 (及び附属島嶼) を指す。国頭地方の諸方言は North Okinawa dialects とよんでいる。当然ながら、奄美群島南部沖縄本島北部の総称として Kunigami を使うことはない。結局、危機言語本におけるこれらの「言語」の出典は不明のまま。

そもそも言語をどうよぶかなんて、大言語を扱っている限り当たり前すぎるが、マイナー言語を扱っているとそうもいかない。Glottolog という大規模な言語目録を作成している Martin Haspelmath が、最近命名方針を整理している。11ある方針の5番目がこの問題に関連する。

New language names are not introduced unless none of the existing names is acceptable for some reason.

話者が嫌っているとか、そういう特別な理由がないかぎり、先行研究が採用した名前を尊重すべきであり、勝手な命名をして混乱をもたらすなということ。まあ当たり前の話。そして、危機言語本は、そんな当たり前のこともできていない。

この3つの命名はいずれもひどい。地理的に国頭に含まれない鹿児島県沖永良部島与論島をひっくるめて Kunigami とよぶのは、大国主義 (?) 的で、無神経にもほどがある。こんなことをやりながら言語多様性をうたうなど笑止千万

問題はこれにとどまらない。認定された「言語」の範囲にも問題がある。この問題を実感するには、遠回りになるようだが、研究史を振り返るとよい。

研究史 (1): ISO 639-3 言語コードとその出典

危機言語本は無視しているが、これらの言語群に対する研究には膨大な蓄積がある。挙げていくときりがないし、私がまだ把握していないものも多い。ここでは国際的に知られているものに絞って紹介する。

ISO 639-3 言語コードというものがある。国際標準っぽいし、実際そうなのだが、登録作業SIL International という民間団体が行っている。そして、登録内容は SIL が発行している Ethnologue という言語目録に載っている。*5

危機言語本認定の「言語」には、対応する ISO 639-3 言語コードが記載されている。例えば、Amami に対して ryn, ams, kzg。これに限らず、Ethnologue は、いわゆる琉球諸語に対して、全部で11の言語コードを付与している。これの出典は明らかに以下の文献。

S.A. Wurm and Shirô Hattori ed. 1981-1983. Language atlas of the Pacific area.

1人目の編者は危機言語本第1版、第2版の編者でもある。2人目は言わずと知れた服部四郎。この文献は地図のシートを束ねたもので、裏面に説明文がある。Maps of the Japan Area の Sheet 28 Ryūkyūan Dialects が元ネタ。担当者は、仲宗根政善、上村幸雄、外間守善中本正智。この分野の第一人者が勢揃いしている。そして Introduction を服部四郎が書いている。1980年頃の研究の到達点と見てよい。

この説明文の重要なところは、集落 (シマ) ごとに異なる方言があることを強調している部分。分類をはじめる前に、

enourmous number of small dialects

we could even say that every hamlet has its own.

説明する。そして、仲宗根政善の母が生前、今帰仁与那嶺からそれほど遠くない名護に行ってみたいと願っていたが一生叶わなかったという有名なお話が、各シマの孤立っぷりを示す例として挿入されている。さらには、分類について議論したあと、最後に

It is not surprising at all that the Yaeyama Islands have so many isolated dialects when one recalls the fact that every hamlet has its own dialect even on such a small flat island as Kikai in the north.

と繰り返す念の入れよう。異常なまでの言語多様性は、実際、言語の保存を行う上で、重要で、難しい性質である。この問題へ言及しているか否かは保存運動のまともさを判定するテストとして使える。この問題に触れないのは論外だし、軽視する奴は詐欺師だと思えばよい。

さて、分類だが、どういう基準で行うかも重要。服部は「全体的な構造」に従って方言をグループに分類すると宣言する。

classify the dialects into several groups in terms of overall structures

つまり、何が重要な違いで何がそうでないかについて、研究者直観以上に何かあるわけではない。牧歌的な話。日本の他の地方を見ても、Sheet 26 Ainu Area: Hokaidō and Southern Sakhalin では、服部・知里による言語年代学に基づく基礎語彙共有率を使って方言間に線を引いている。Sheet 27 Japanese Dialects では上野善道がアクセント体系によって本土諸方言を分類している。一貫性も何もあったものではない。

結論として、地図には日本と台湾を分離する Language Boundary がまず引かれている。日本内部には5種類の Dialect Boundaries が設定されている。Level No. 1 が本土琉球を分離し、Line No.2 が Northern (Amami-Okinawan) と Southern (Sakishima) を分離する。ここから先は論争があったことが記されている。奄美群島徳之島沖永良部島の間に Line No.3 が引かれている。もともと上村が Line No.4 を提案していたが、仲宗根が Line No.3 を提案し、中本、外間、服部が賛成して採用されたという。与論島沖縄本島の間の線は中本が Line No.3 とすることを提案したが、外間が否決したという。

そもそも線の基準が謎だが、下位の線は以下のように説明される。Line No. 4 は mutual communication generally impossible or very difficult で、Line No.5 は noticeable dialectal difference which is not so great as to cause impossibility of mutual communication という。

Ethnologue は Line No.4 以上を言語認定していることになる。参考までに服部らが地図に載せた名称を載せておく。上位が Group。

  • Amami-Okinawan Group
  • Sakishima Group

その下に Dialects。もちろん複数形である。

  • Kikai Dialects
  • Northern Amami-Ōshima Dialects
  • Southern Amami-Ōshima Dialects
  • Toku-no-shima Dialects
  • Oki-no-erabu Dialects
  • Yoron Dialects
  • Kunigami Dialects
  • Central Okinawan Dialects
  • Miyako Dialects
  • Yaeyama Dialects
  • Yonaguni Dialects

さらに宮古Line No.5 で細分類されている。

  • Miyako-jima Dialects
  • Irabu-jima Dialects
  • Tarama-Minna Dialects

線は引かれていないが、いくつかの集落に ▲ が記されており、isolated characteristics when compared with the neighboring dialects と説明される。奄美大島の佐仁、喜界島の小野津、沖縄の久高、鳥島は本文に説明がある。宮古大神説明がない。八重山には ▲ が記入しまくってある。執筆時点では分類を確立するには調査不足だっただけではないかという印象を受ける。

あと、意外と重要なのは、分類以外の線も引いてあること。Sphere of strong/less strong/weak influence of the Shuri Dialect という 3 種類の線が引いてある。同様に奄美大島の名瀬方言も影響圏を図示。

まとめ。

  • 服部らは「全体的な構造」、要するに言語学者の直観によって分類を行っている。
  • Ethnologue は危機言語本よりも細かい粒度で言語を認定している。おおよそ島単位。
  • 服部らは Amami-Okinawan を南北で2分割して、その境界徳之島沖永良部島の間に引いている。この分類は珍しいし、作成者の間でも議論があった。
  • 危機言語本の Amami に相当するグループが設定されているが、名前は与えられていない。仕方がないので Ethnologue は Northern Amami-Okinawan とよんでいる。Amami-Okinawan の北半分という意味であって、地理的意味での沖縄は範囲外。
  • 危機言語本の Kunigami に相当するグループはない。Kunigami は国頭地方の諸方言を指す。
  • 危機言語本の Okinawan に相当するグループは Central Okinawan とよばれている。

研究史 (2): Uemura (2003)[1992]

危機言語本で出典として挙げられていた Uemura (2003) は、元は『言語学辞典』の「琉球列島の言語」という項目で、これを英訳したもの。

上村幸雄は上述の Language atlas of the Pacific area の作成者の一人であり、唯一存命である。Uemura (2003) は出版時期こそ比較的最近だが、旧世代研究者

基本認識はこれ。

A detailed classification would see that each community in the archipelago has its own dialect, but more roughly put there are large dialect divisions just about between each large island.

上村は琉球王国覇権を強調しすぎているきらいと、言語と方言の用語の区別に拘泥しすぎている印象があるが、そこまで変なことは言っていない。分類の節に入る前に言語の数について簡単に議論している。

If, when deciding whether two related languages or dialects should be called languages or dialects, one focusses only on mutual intelligibility and linguistic differentiation, then the term 'Ryūkyūan language' would be appropriate. If one looks at major differences between dialects on the Ryūkyū archipelago in the phoneme inventory and the like, then at least two languages (Northern Ryūkyūan and Southern Ryūkyūan), or even five languages (Amami, Okinawan, Miyako, Yaeyama, Yonaguni) could be recognised, and one could speak of the Ryūkyūan languages.

原文は日本語で、単複が曖昧なので、訳者 (Wayne Lawrence) の解釈が入っているように思う。音素目録とかの違いで分類するというのと相互理解可能性との関係が不明瞭。ともかく、Kunigami は数に入っていないし、Amami, Okinawan の範囲も、明示はしていないが、常識的には奄美群島沖縄諸島に対応するのだろう。

分類に関する議論は Subclassification of the Ryūkyūan language という節に書かれている。この節では分類基準を明示していない。大きく Amami-Okinawa Dialect Group と Miyako-Yaeyama Dialect Group に分けるところ、Miyako-Yaeyama を Miyako, Yaeyama, Yonaguni に 3 分割するところは以前と同じ。Amami-Okinawa Dialect Group の下位分類が違う。この節の構成はちょっと面白い。上村はまず8つの下位分類を示す。例によって dialects と複数形。

  1. Kikai-jima dialects
  2. North Amami Ōshima dialects
  3. South Amami Ōshima dialects
  4. Tokunoshima dialects
  5. Okinoerabu dialects
  6. Yoron dialects
  7. North Okinawa dialects
  8. South Okinawa dialects

服部らからの目立った違いは Central Okinawan が South Okinawa になっていることぐらい。

そのうえで、中間的な分類を提案していく。まず 2-3-4 と 5-6-7 が音素体系的に対立すると言う。前者に名前はつけないが、後者は Okinoerabu-Yoron-Northern Okinawa group とよんでいる。この範囲を指す包括的名称が存在しない以上、上村が3つの名前を並置したのは自然。狂っているのは危機言語本の Kunigami という命名の方。

1 の喜界島は 5-6-7 と同じ音韻的特性を持つと上村は言う。1-5-6-7 というグループを提案しない理由を説明していない。喜界島の北端の3つの集落だけその特性を持たないので、扱いに困っているのだろう。一連の議論の最後に 5-6-7 と 8 は対立すると説明する。

この次に別の中間的分類を提案する。奄美群島 1-6 と沖縄諸島 7-8 の対立。上村は、この対立は17世紀初頭に薩摩藩奄美の直轄支配を始めて以降の歴史を反映しているとして、

a subdivision on these principles does not reflect the genetic relationships among the dialects.

と主張する。唐突に genetic という議論が登場する。まるで、それまでの分類は系統的関係を求めていたかのような口ぶり。議論が混乱している。

まとめ。

  • Uemura (2003) は音素目録とかの違いで分類すると言いつつ、後になって genetic relationships がどうこうと言い出すなど、議論が混乱している。
  • Uemura (2003) は言語の数は2つ (Northern Ryūkyūan and Southern Ryūkyūan) あるいは5つ (Amami, Okinawan, Miyako, Yaeyama, Yonaguni) と主張しており、6つ認定する危機言語本と一致しない
  • Amami-Okinawa の下位分類は、Ethnologue と同じく、おおよそ島単位。中間的な分類は、言語学者が操作する抽象的な単位というニュアンスがうかがえる。
  • 危機言語本の Amami の相当するグループは (喜界島を無視すると) 設定されていると言えなくもないが、名前は与えられていない。
  • 危機言語本の Kunigami に相当するグループは Okinoerabu-Yoron-Northern Okinawa とよばれている。
  • 危機言語本の Okinawan に相当するグループは South Okinawa とよばれている。

研究史 (3): Glottolog と Pellard (2009)

さて、前置きが長くなったが、ここからが本番。実は、Uemura (2003) 以降、あるいは危機言語本のオンライン版が出た後に、状況が一変している。最近の成果は Glottolog に反映されている。

既に触れたように、Glottolog は大規模な言語目録で、ISO 639-3 (Ethnologue) と同じように言語にコード (Glottocode) を割り振っている。統計的研究を行う際、複数の言語データベースを統合することがあるが、言語コード名寄せに利用できる。私も以前は ISO 639-3 を使っていたが、情報が古すぎて前処理時地獄に苦しめられた。最近は Glottocode を使っている。

さて、Glottolog の琉球諸語の分類はこれまで見たものとは全然違う。

  • North Ryukyuan
    • Amami
      • Kikai
      • Nuclear Amami
        • Okinoerabu-Tokunoshima
        • Oshima
          • Northern Amami-Oshima
          • Southern Amami-Oshima
      • Yoron
    • Okinawa
      • Central Okinawan
      • Kunigami
  • Ryukyu Sud
    • Macro-Yaeyama
      • Yaeyama
      • Yonaguni
    • Miyako

ほぼ二分木になっていてやたら階層が深かったり、、Yaeyama, Yonaguni をまとめた Macro-Yaeyama があったり、Ryukyu Sud という謎のフランス語があったり。North Ryukyuan が Amami と Okinawa に二分されているところが新しい。沖縄を南北に分割するのはこれまで通りだが、奄美の中の分類は何が起きたのか理解できないくらい違う。

Glottolog は Pellard (2015) を出典とするが、この文献には分類結果だけが書いてあって議論はない。議論は以下の博士論文にある。

Thomas Pellard. 2009. Ōgami: Éléments de description d'un parler du Sud des Ryūkyū. Linguistique. Ecole des Hautes Etudes en Sciences Sociales (EHESS).

表題の通り宮古大神方言を記述したものだが、9章前半で琉球諸語の分類を議論している。この論文は私の最近の趣味の研究にも関連していて面白い。言語学者が生物学由来の統計的系統モデルを使っているという驚きの内容。ただ、この21世紀に学術研究の成果をフランス語で発表されても困る。英語版を出して欲しいところ。

Pellard (2009) の一番の貢献は、何のために分類するかを明確にしたこと。系統樹を作ることに特化している。Pellard (2009) 以前の分類は、現代語群をそれらが持つ特徴群の類似度 (あるいはその反対の距離) によって階層的にクラスタリングしていた。しかし、何を類似度とすべきかに明確な基準がなかったし、そもそも唯一の正解が存在する性質の問題ではない。だから矛盾する証拠が見つかったときに何を優先すべきか不明だった。系統樹を作るという目的を定めると、基準が明確化する。すなわち、ある言語対が同じ特徴を持っている理由は以下の4つに分類できる:

  • 偶然の一致
  • 普遍的に起こりやすいから
  • 接触の影響
  • 共通祖先から引き継いだから

系統樹を作るために必要な特徴は最後の一つだけ。残りの特徴は邪魔なので捨てるべきということになる。

この方針は、分類のための特徴として何を採用するかにも影響する。以前は音韻的な分類が採用されていたが、Pellard (2009) はこれを却下する。例えば、p > ɸ > h や k > h が Amami-Okinawa の分類に採用されていたが、これらは起きやすい変化なので、独立に起きたか、接触による影響の可能性が高い。ちゃんと系統樹を作るには、共通祖先から引き継ぐ可能性が高い特徴に着目しなければならない。

Pellard (2009) は不規則な音変化、基礎語彙の発生、意味変化など、計70個を特徴として採用し、統計的系統モデルによって系統樹を作っている。Pellard (2009) の特徴はバイナリという点では Gray-Atkinson 系の同源語特徴と同じだが、中身はかなり違う。Pellard (2009) のデータでは、共通祖語の段階では 0 であり、系統樹上のどこかで一度だけ不規則な変化が起きた (0 > 1) ような特徴が集められている。特徴の喪失 (1 > 0) は、モデルの上では系統樹上の複数の箇所で起こり得ることになっているが、その確率は低い。

Pellard (2009) は最近流行りの Bayes モデルではなく、PHYLIP という大昔からあるソフト (具体的なモデルは cliquedollop) を使っている。それは別に悪いことではない。この研究の肝はデータの作り方にあるから。Pellard (2009) が採用した特徴は、偶然の一致の可能性が低いし、不規則変化を見ているので普遍性もない。ただ、個別の特徴をある言語が持つに至った要因が接触 (横) か系統 (縦) かを識別するための手掛かりが欠けている。仕方がないので、特徴群全体をうまく説明するような系統樹を探している。このあたりは改良の余地がある気がする。

得られた系統樹は、Glottolog のものと大体同じだが、いくつか重要な違いがある。

  • 奄美沖縄は安定的に分離されている。Uemura (2003) はこの区分は genetic な関係ではないと主張していたが、Pelleard (2009) はこれこそが genetic な関係という主張。
  • Amami-Okinawa (Northern Ryukyuan、Glottolog の North Ryukyuan) は従来自明のものとされていたが、このノードはできたりできなかったりする。Pellard (2009) は図9.5で、? という謎ノードを描いている。ただし、Pellard (2015) は Northern Ryukyuan を復活させている。
  • Pellard (2009) では喜界島はそもそもデータに含まれていない。Glottolog が Kikai を Amami の子供にしている根拠は不明。
  • Glottolog の Nuclear Amami, Okinoerabu-Tokunoshima にあたるノードに Pellard (2009) は名前をつけていない。
  • Pellard (2009) は Okinawa を Nord と Sud に分割しており、Glottolog の Kunigami と Central Okinawan という名前は Pellard (2009) に基づかない。Pellard (2015) はそもそも Okinawa よりも下の分類を載せていない。

まとめ。

  • Pellard (2009) は系統樹を作るという明確な目的のもと分類している。
  • 言語と方言の違いなんてものはこの議論と無関係であり、無視されている。
  • 危機言語本の Amami に相当するノードは存在しない。系統樹上でずたずたに分断されている。
  • 危機言語本の Kunigami に相当するノードも存在しない。
  • 危機言語本の Okinawan に相当するノードは Okinawa Sud とよばれている。

ここ数年で出版された文献は、Pellard (2009) をもとにした Pellard (2015) の系統樹を採用している印象がある。Pellard (2015) を収録した Handbook of the Ryukyuan Languages田窪行則編. (2013).『琉球列島の言語と文化』、田窪行則ほか編. (2016). 『琉球諸語と古代日本語』など。よく考えると、すべて Pellard が関わっているけど。

言語研究と保存運動の乖離

ここまで延々と従来研究を紹介してきた。見てわかるように、危機言語本が認定する「言語」は、名前がまずいだけでなく、学説によっては存在すら否定されている。Pellard (2009) のおかげで最近は特に旗色が悪い。ただし、Pellard (2009) が決定版かというとそんなことはない。今後の研究の進展によってこの説が上書きされる可能性が高い。重要なのは、そういう学術論争の対象となるような抽象的かつ不安定な単位でしかないこと。話者がその存在を想像するような地に足の着いたまとまりではない。そんなものを保存運動に持ち出して何の意味があるのか。学問を権威づけに利用して、自分たちが望む単位を話者に押し付けたいのだろうか。

具体的な分類が今後どうなるかは別として、分類方針の転換は覆らないだろう。昔のような現代語のまとめあげは流行らない。明確な基準の存在しない不良設定問題であり、複数の対立する説のなかからどれを選ぶべきか決められない。系統樹なら、何が正解かはともかく、何をすべきかは明確。

言語研究の系統樹への指向は、保存運動にとって都合が悪い。以前なら、分類の結果得られる中間ノードは、いくつかの現代語をまとめあげた現代のまとまりだった。系統樹における中間ノードは祖語である。昔の言語であって現代語ではない。現代語のまとめあげなら、面を被覆しないとサマにならないが、系統分類はそうでもない。点と点の関係を議論すれば充分に研究になる。実際、Pellard (2009) のデータには喜界島が欠けている。

目的の明確化とともに手法も先鋭化している。本質主義の色彩すら帯びている。Pellard (2009) の議論にあるように、ある言語対が共有する特徴のうち系統分類に必要なのは共通祖先から引き継いだものだけ。他の特徴は分類のさまたげとなるので排除する。系統樹作成に使われたアルゴリズム (clique と dollop) は、単純な距離に基づくクラスタリングとはまったく異なる結果を吐き得る。ある言語対が似ていると素朴に思っていたら、その類似は本質的ではないと怒られて、別の差異を持ち出されるのである。

それで言うと、Uemura (2003) のように「琉球王国」を持ち出すのは筋が悪いし、服部らの地図に示された「首里方言の影響圏」なんてものは排除の対象である。いわゆる琉球諸語内部の分岐は、明らかに琉球王国の誕生に先行する。琉球王国の影響で生じた接触は、系統樹を作る立場からするとノイズでしかない。

こうして議論が整理されてくると、「琉球」という命名が失敗に思えてくる。歴史的には「琉球」はそんなに広い範囲を指す言葉ではない。もともと「琉球」は沖縄本島のこと。*6訳語系の資料を見ると、漢語の「琉球」を琉球語(?)では一貫して「沖縄」と翻訳している。琉球王国が征服した奄美宮古八重山は、琉球の属領ではあっても琉球の一部という感じはない。つまり「琉球」とは琉球王国であり、系統樹作成に際して排除すべき対象である。そうして頑張って「琉球」を取り除いて残ったものを「琉球」とよぶのはいかにも都合が悪い。同じように「琉球」以前の姿を追い求める傾向にある民俗学にならって「南島」とよぶのがよいと思う。*7

言語研究と保存運動の乖離はこれにとどまらない。昔の研究はいかにもな方言調査だったが、最近は普通に記述言語学をやるようになっている。文法、辞書、テキストをそろえて体系的に記述しようという方向。上述の Pellard (2009) は宮古大神方言を記述したものだし、他にもひたすら奄美大島の湯湾方言をやったり、与那国方言をやったりしている人がいる。驚くほどストイック。

ここで問題になるのは、集落ごとに異なる方言があること。危機言語本のいう「言語」は一つの体系ではない。相互理解可能性はここでは関係ない。原理主義的には、別の体系があれば別に記述すべきということになる。与那国島なら内部の差異が少ないから一つで良いかもしれないが、奄美大島ならそうもいかない。実際、記述系の人は、大神とか湯湾のような集落を対象にしている。

調査対象の集落の選定も保存運動に都合が悪い。奄美大島北部の中心は名瀬だが、調査対象に選ばれたのは宇検村湯湾のようなど田舎。おそらく方言の残存状況を考慮してのことだろう。大神が選ばれる理由は簡単で、めずらしい特徴を持っているから。いずれにしても、危機言語本の認定する「言語」をまとめあげる求心力を持たない。そもそも、喜界島のように、同程度の威信の方言が林立していて中心が存在しない場所もある。あるいは、危機言語本が奄美大島徳之島、喜界島を範囲として Amami を認定していることに従うと、喜界島はまるごと奄美大島徳之島と一体化させなければならないのだろうか。そんな馬鹿な話はない。

ここまではいわゆる琉球諸語を議論してきたが、ここで挙げた諸問題は何も琉球諸語に限ったものではない。系統分類でもめている言語群なんて世界中にある。記述の対象が「言語」よりも下位の単位になることもありふれている。

Glottolog のような最近の言語目録はこうした状況を前提とした設計になっている。Glottolog の設計を議論する Nordhoff and Hammarström (2011) は、言語と方言の区別なんて言語学者にとってはどうでも良いと宣言する。

The question of what is a dialect and what is a language is a very old one, and up to now, there are no agreed upon criteria how to resolve it. While it is a hotly debated topic among the general public, there is general consensus among linguists that this question is of relatively minor interest.

そして languoid という概念を導入する。

Languoids replace the traditional concepts of dialects, languages, and language families in the Glottolog/Langdoc project. Languoids are mathematically sets, which can contain other languoids, or doculects. Languoids may not be the empty set.

例えば、Yuwan, Amami Ōshima, Ryukyuan などは一律に languoid。

趣旨は同じだが、Gord and Cysouw (2013) はさらに議論を先鋭化させている。念頭にあるのは、ちょうどここまで見てきたような分類をめぐる混沌とした状況。

However, consensus about the identification of languages is often hard to achieve and, moreover, often turns out to be incorrect as new facts becomes known. Therefore, we expect that language experts will never be fully satisfied with the range of decisions that are taken to develop a standard like ISO 639-3, especially with regards to the delineation of groups of closely related speech variants into specific languages. In some cases, it may be that a given expert simply disagrees with current consensus. In others, it may be that a lack of information has made that consensus inherently fragile, and everyone agrees that it could change quite abruptly if more was known about the linguistic situation of a specific group or area.

そこで過激な解決策が提案される。言語目録を作る上で一番の基礎であり、論争の少ないところまでさかのぼる。ある文献である言語が説明されているということ自体が争われる可能性は低い。ある文献で説明されたある言語を doculect とよぶことにする。文献の数だけ doculect がある (一度に複数の言語が説明されていればそれ以上)。doculect A, doculect B, doculect C が同じものを指していることが自明の場合もあるだろう。その場合は、{A, B, C} という集合で languoid a が定義される。A と B は同じだが C は違うという主張があった場合は、a と並行して languoid b := {A, B}, languoid c := {C} をたてる。文献上は a と b が同じ名前でよばれる場合があるかもしれない。ちょうど危機言語本が既存の言語名を別の意味で使って混乱をもたらしているように。仕方がないので doculect や languoid には ID をふって ID で管理する。あと、厳密に書くのは大変なので、ここでは「言語」とよんだけど、もちろんそれは方言かもしれない (あるいは語族かもしれない)。そんなのどうでもよいし。

おわりに

危機言語本はあっけにとられるほど雑に日本を扱っている。危機言語業界において日本は南北の縄張りのはざまに位置するから。その内容はこれまでの研究経緯を無視していて、混乱をもたらすだけの有害無益なもの。しかも直後に出た研究成果によってオワコン化している。悲惨の極み。

個別の事例以前に、「言語」を認定していくという設計方針自体が実態にそぐわない。危機言語本のいう「言語」は、学術論争の対象となるような抽象的かつ不安定な単位でしかない。議論の出発点は、集落 (シマ) ごとに言語が異なるという現実を直視することであるべき。

保存運動において言語と方言の区別は本質的ではない。そもそも境界事例の扱いに困ってえいやと基準を決めるのは分類問題の常。この世界には一方には言語とよべる実体がありそうだし、もう一方には方言とよべる実体もありそうである。そこまではよいのだが、対象を網羅しようと思ったら、どこかで線引きをしないといけない。相互理解可能性というのはそういう文脈で登場する基準に過ぎない。「本土では東北から九州まで相互理解可能性の連鎖が途切れないが、琉球諸島では途切れる」と得々と語っても、知性の欠如をさらすだけ。当の話者からすれば、「だからどうした」というほかない机上の空論

そんなこんなで、危機言語本やそれに群がっている人がアホなのは明らかだと思うのだが、正面からの批判を意外なほど見かけない。私が知る限りでは、西岡敏が懸念を表明しているくらい。例えば、呉人恵編『日本の危機言語』所収の西岡 (2011) では次のようにいう。

問題はこれらの「~語」がいったい何を指すかである。さきほども述べたように,琉球諸島で話されていることばは,集落ごとに異なる。それを「~語」という言い方でくくった場合,危機言語の中でも,より有力な言語のみを滅亡から救い,より弱小な言語を見捨てることにつながって行くのではないかという懸念が生ずる。

一応他にも、「~方言」から「~語」へのラベルの張り替えは問題の本質から目をそらすだけという別の人の批判も見た記憶がある。しかしいかにも手ぬるい。変なことを言っている人がいて、それが影響力を持っている場合には、ちゃんと滅ぼしておくのが世界平和のためだと思うけど。

ただ、言語研究者危機言語本の枠組みに従っている感じはなく、単にスルーしているように見える。だいたい『日本の危機言語』からして、有名どころの水海道方言を入れたり、あえて東京弁を取り上げたりして、危機言語本の枠組みをあからさまに無視している。いわゆる琉球諸語の研究者も、危機言語本の「言語」を無視し、集落を単位として粛々と記録と継承に取り組んでいるように見える。例えば、田窪行則編『琉球列島の言語と文化』がまさにそんな感じ。

保存の単位を何にするかは究極的には話者に委ねるほかない。通じようと通じまいと、話者が同じと思えば同じだし、違うと思えば違うのだろう。もちろん話者は複数いないと始まらないし、「我々」というのは曲者である。n人をグループ化する方法の総数はベル数とよばれ、たった6人で203通りに膨れ上がる。さらには非対称性もある。集団 A は集団 B を「我々」の一部だと主張し、B は A とは別だと主張するというようなことは普通に起こりえる。一般には話者が多いほど保存に成功する確率は高まると期待される。表記の確立や教育の問題で、どのみち標準化は避けられない。保存を成功させるには、大勢の人間を同じ方向に動かさないといけない。それはまさに政治運動なわけだが、私がひとまず運動家とよんだ人々はなぜかそこを避けている。不思議に思っていろいろ理由を考えてみた。遅れた人々を啓蒙する進歩的な自分に酔っているだけで、泥臭い仕事を嫌っているのかと最初は思った。しかし、どうもそれだけではない気がする。そもそも話者のほとんどいない言語を子供に継承させるのは、経済的に非合理的な選択。非合理的選択をさせるためには非合理的な何かが必要で、それはナショナリズムにとてもよく似たもの。ところが保存運動 (のイデオロギー) にはまるような「進歩的」な人はナショナリズムは悪というドグマに縛られていて、自己矛盾を抱え込んでいるのではないか。「言語多様性」は苦し紛れに作られた概念だろう。この概念を危機言語話者に向けるのは冷静に考えるとひどい。たまたま辺鄙なところに生まれてしまったら、全体への奉仕を強要されるということを意味するのだから。

言語研究からは相当離れてしまったことだし、今回はこのあたりで打ち切る。頭が整理されたまた続きを書くかも。

*1:とりあえず運動家とよぶことにしたが、あまり適切でない気もしている。というのも、彼らが本当に言語を保存したがっているとはとても思えない。保存について議論すること自体が目的化しているように見える。

*2:私がやっているのは言語現象統計モデル化。言語の記述などにはまったく手を出していないし、そうした研究者との接点もほとんどない。

*3:またブログ記事を書くのに3ヶ月もかかってしまった。

*4:ちなみに、第2版は UNESCO/Japan Trust Fund for the Preservation of the Intangible Cultural Heritage の資金提供で作成されたとのこと。

*5:SIL はキリスト教布教という不純な目的を持った団体なので、この体制はいかがなものかと思っている。

*6:より古い「流求」についてはここでは考えない。

*7:英語だと意味的に Austronesian とかぶるので、訳さずにそのまま Nantō を採用すればよい。

2016-11-03

Hmong-Mien Langage History

Martha Ratliff. (2010). Hmong-Mien Language History.

なぜか一般受けした駄文を一時の気の迷いで書いてしまったが、平常運転に戻る。本の紹介。それも、アフィれない程度に入手困難な本。

モン・ミエン語族に関する本。現代語の紹介とかぬるい話は抜きにして、ひたすら Proto-Hmong-Mien を再構。現時点で最新に近いと思われる。*1

話の前提として、上古音 (Old Chinese) 再構問題がある。最近の定番は Baxter and Sagart. (2014). Old Chinese: A New Reconstruction (再構結果はウェブで公開されている)。*2 この本にあるように、Old Chinese が類型論的にクメール語のような構造を持っていたことはほぼ確実。すなわち

  • 声調はなかった。中古音の平声 (A) は *-∅;、上声 (B) は *-ʔ、去声 (C) は *-h (< *-s)、入声 (D) は -p, -t, -k に由来する。
  • 音節とは限らない。例えば、「壯」が *k.dzraŋ で、「脰」が *kə.dˤok-s。具体的には tightly attached preinitial consonants と loosely attached presyllables の 2 種類が想定されている。完全な音節の前に、単純な構造の弱い音節 (あるいはそのようなもの) が先行する。クメール語説明では sesquisyllabic という用語を見るが、Baxter and Sagart (2014) はこの用語を使わない。こうした語はおそらく元は 2 音節語にさかのぼる。
  • 派生接辞を盛んに用いる。接尾辞 *-s で動詞から名詞を派生させたり、接頭辞 *N- で他動詞から状態の自動詞を派生させたり。

こうした特徴は典型的にはクメール語に見られる。同じオーストロアジア語族のなかでは、ベトナム語は声調言語で単音節孤立語。でも、オーストロアジア祖語にまでさかのぼらなくても、Vietic の親戚に sesquisyllabic で派生形態素を持つ非声調言語が見つかる。Kra-Dai は Proto-Tai の時点で sesquisyllabic だったらしい。派生接辞の話は聞かないけど。

では、大陸部東南アジア (MSEA) 言語連合*3のなかで、残る Hmong-Mien はどうか。Ratliff (2010) によると、上述の Old Chinese の特徴は Proto-Hmong-Mien にもあてはまる。声調はなかった。Ratliff (2010) は disyllabism と言っているが、Baxter and Sagart (2010) が Old Chinese について言っているのと同様に、tight *NC- と loose *N-C- の 2 種類が存在した。派生接辞はというと、漢語の場合と同じような doublet が存在するので、接辞の痕跡を見ているっぽい。

面白い議論が 2 つ。一つは声調発生 (tonogenesis) の時期 (Chapter 3)。鍵となるのは漢語からの借用語。Hmong-Mien に見られる漢語からの借用語には、両者の間で tone category が一致するものがある。一次的な ABCD の分化だけでなく、語頭の有声無声の対立が高低に転化したと推測される二次的分化 (A1, A2, B1, B2, ...) も対応する。借用元 (漢語) と借用先 (Hmong-Mien) はどの段階だったか。tonal か atonal かで 2x2=4 通りの組み合わせが候補に挙がる。Ratliff (2010) は他の言語間の借用事例を見ながら、その一つ一つ検討する。その結果、声調が規則的に対応し得るのは双方が atonal な場合だけだと主張する。なお、従来の説では、声調のシステムそのものが漢語から Hmong-Mien に借用されたと考えられていたとのこと。Ratliff (2010) に従うと、そうした借用は Old Chinese の時期に発生し、その後、tonogenesis が並行的に起きたことになる。それはそれで不思議な話。

ここからは私の妄想。超大雑把に言って、MSEA 型の tonogenesis は

disyllabic (atonal) -> sesquisyllabic (atonal) -> monosyllabic (tonal)

という過程をたどったことになる。狭義の tonogenesis は最終段階にすぎない。その前段階として、少なくとも sesquisyllabic になっていることが、狭義の tonogenesis の条件 (precursor) となる。sesquisyllabic というのも変わった特徴であって、MSEA の地域的特徴と言える。漢語Kra-Dai の大半、Vietic のいくつは、Hmong-Mien は MSEA の核だけど、その周辺に、クメール語や、別の過程を経て tonal になった sesquisyllabic なビルマ語が存在する。オーストロネシア語族はその外側に位置する。Austronesia と Kra-Dai を兄弟とする仮説はおそらく正しいと私は思うし、そうでなかった場合も、両者の接触があった可能性は高い。広義の tonogenesis は Proto-Austronesian が離れてから発生したということになるか。そして日本語はさらにその外側にいる。稲作とか、文化的には関係があってもおかしくなさそうなのに、言語的にも遺伝的にもまったく無関係っぽいのが不思議なところ。

もう一つ面白いのは numeral classifier に関する議論。Hmong-Mien は numeral classifier を義務的に使うらしい。しかし、Ratliff (2010) は、助数詞のシステム自体を漢語から借用したと推測する。それどころか、Old Chinese においても商周時代の助数詞の使用は限定的であり、この地域における classifier の発達は同時期に起きたかもしれないと推測する。Hmong-Mien には numerical classifier と機能的にかぶるところが多い classifying prefix というのがある。接頭辞の起源が古いことを考えると、後者の方が古いはず。文法化という面では、noun => classifier と class noun => prefix は起きているが、class noun => classifier が起きていないとか。あと、Aikhenvald (2000) を引いて classifier system は通言語的に借用しやすいと言っている。ここはよくわからない。助数詞を使うシステムが既にある言語が新たな助数詞を借りるのが容易という話なのか、システム自体も容易に借りられるという話なのか。

Nichols (1994) は助数詞、声調、二人称代名詞 m- を人類による Pacific colonization の第3層だと主張していた。代名詞は置いておくとして、最初の2つは、こうして仔細に見ていくと、時間的にさほどさかのぼらない可能性が高い。しかも、系統的 (縦の) 関係ではなく、空間的 (横の) 関係を反映しているようである。

それにしても、横の関係は現象として謎すぎる。何とかして機序を解明したいところ。

2016年11月5日追記: 流音について、松本 (2006) は、lateral l と rhotic r の複式、いずれかだけの単式、いずれも持たない欠如型という類型を設定し、日本語を含む「太平洋沿岸言語圏」は単式流音によって特徴づけられるとぶちあげている。松本 (2006) は、ミャオ・ヤオ諸語の 8 サンプルをすべて単式に分類するのみで説明を付していない。これに対して、Ratliff (2010) は、Proto-Hmong-Mien に *l- と *r- の 2 種類を再構している。ただし、異説が少なくない様子。West Hmongic の [l] と [ɭ] の対立を Proto-Hmong-Mien にさかのぼらせる説や、*r- をまったく再構しない説などもあるらしい。Ratliff (2010) は West Hmongic の [ɭ] は *lj- に由来すると見ている。

漢語については、松本 (2006) は複式から単式に変化したとし*4、「この言語に純粋に内部的な要因だけで説明するのは無理であろう」(p.335) と述べて接触的変化を想定する。ただし、Bodman (1980) を引いて、「ある種の環境 (たとえば語末) では、l と r の区別が漢の時代まで保たれていたらしい」と言う。Baxter and Sagart (2014) は当然複式を採用している。Old Chinese の *r が Middle Chinese で retroflexion を引き起こしたというのが、中古音を説明する鍵になっている (例えば「住」 *dro(ʔ)-s > drjuH -> zhù)。Middle Chinese の l- は Old Chinese の *r(ˤ)- に由来する (例えば、「犂」 *C.r[ə][j] > lij > lí)。証拠はいろいろあるが、例えば Proto-Min で *z- に対応すること。*r > l は、先行して *l が消滅した穴を埋めたもの。Old Chinese からは *l- > y-, *lˤ > d-, *lˤr- > dr- と変化したという (例えば、「夷」*ləj > yij > yí、「田」*lˤiŋ > den > tián)。*lˤ > d の最初の証拠は紀元後1世紀だというから、*r > *l はさらに下ることになる。あと *l-, *r- に対応する無声の系列の *l̥-, *r̥- も再構していて、Middle Chinese の th- に対応するという (例えば、「湯」*l̥ˤaŋ > thang > tāng)。

松本 (2006) を読むと、素朴な印象として、流音の類型は安定的という割には例外を頑張って説明し過ぎではないかと思う。漢語に対する説明もひっかかる。チベット・ビルマ系の言語が「言語接触、それもクレオール化と呼ばれるような言語混合を伴った激しい接触的変化」(p.335) を受けて漢語が成立したというには、流音まわりの変化の時期が新しすぎる。仮に激しい言語接触があったとして (これ自体はおそらく正しい)、Old Chinese は接触後の言語ではないか。もし Proto-Sino-Tibetan では複式だけど Old Chinese までに単式に変化したというなら納得できる。実際には Old Chinese は複式。その後単式に移行した原因を接触に求めるのは妥当なのか?

*1:この記事を書いている最中に新しい論文を見つけた。Weera Ostapirat. (2016). Issues in the Reconstruction and Affiliation of Proto-Miao-Yao.

*2漢語音韻学業界はジャーゴンに満ち溢れていて近寄りがたいことが多いが、Baxter and Sagart (2014) は普通の用語を使っていてわかりやすい。

*3:Ratliff (2010) は Matisoff に従って Sinosphere と言うが、Sinocentrism の香りが微妙。

*4英語の Korea は、l ではなく r だから日本語に由来するという私の議論は、松本 (2006) の議論の応用。

2015-09-08

アイヌ学入門

瀬川拓郎. 『アイヌ学入門』(2015)

アイヌとその言語には、日本語の起源との関わりから興味を持っている。といっても、本腰を入れて追いかけているわけではない。本書のような新書*1であっても私にとっては新情報だらけ。

本書では、主に文化面について、著者の最近の主張が提示されている。一般の、中高の教科書レベルの認識では、アイヌ縄文人シーラカンスのように生き残ったかのように思われていそうだが、実際には大きな変化があったこと、その変化に日本が大きく関わっていることを著者は指摘する。

私にとっての新情報は後半、3章から7章までを中心に展開されている。*2 しかし、この部分については、私が著者以外の情報源を把握していないので、「へー」とか「ほー」とか間の抜けたことしか書けない。この雑記では、主に2章までの、私が他の情報源を多少は知っている部分について、コメントを書き散らす。

DNA

The history of human populations in the Japanese Archipelago inferred from genome-wide SNP data with a special reference to the Ainu and the Ryukyuan populations (Journal of Human Genetics, 2012) を引いて、「弥生時代朝鮮半島から渡来した人びとが縄文人と交雑して和人 (本土人) になり、周縁の北海道琉球には縄文人の特徴を色濃くもつ人びと、つまり琉球人とアイヌが残ったといいます。」(p.39) と要約しているのは少し乱暴。この研究が直接主張するのは主に次の2点。

この結果が従来の二重構造モデルと整合的だと慎重に議論している。現代人の DNA を調べただけでは直接故地を推定するのは難しい。交雑の時期についても今回は推定していない。

データに関しては、平取のサンプルが本当に (北海道) アイヌ全体を代表しているかが以前から気になっている。もう一つ、アイヌとニブフの関係については、先行研究を引くのみだが、データを採って分析してほしいところ。上記論文が引いている Genetic origins of the Ainu inferred from combined DNA analyses of maternal and paternal lineages (2004) はまだちゃんと読んでいない。

ちなみに、今年になって続報が出ている。Unique characteristics of the Ainu population in Northern Japan (Journal of Human Genetics, 2015). アイヌのデータは 2012 年版と同じだが、別ソースのデータと重ねあわせている (図 2)。このデータは本土のサンプル数が 1,000 程度と大規模で、関東に限らず、各地方のデータが使われている。大きな発見は、東北は (北海道) アイヌと似ていないこと。

その先に出てくるのが 3-population test (f3) や f4-ratio test。交雑の時期や割合を推定する話だが、モデルの詳細をまだ理解していない。言語に応用できなそうなモデルだし。アイヌ縄文の代わりに、漢人朝鮮人弥生の代わりとして使うのは微妙ではないかという感想を海外のブログで目にした。

あとは、細かいけど気になったのが、ハプログループがミトコンドリアのみに関するものであるかのような記述 (p.44 と p.55)。

2015年10月27日追記: Choongwon Jeong, Shigeki Nakagome, and Anna Di Rienzo. Deep History of East Asian Populations Revealed Through Genetic Analysis of the Ainu. Genetics. (2015) も読んだ。同じ平取のサンプルを使っているけど、分析が違う。

  • アイヌのサンプルは PCA で見ると heterogeneous だけど、ADLER で admixture time を推定すると、2 pulse model で古めに見積もっても 30-40 generations ago。弥生時代はもちろん、オホーツク文化との接触と比較しても新しすぎる。
  • ADMIXTURE (K=8) だと、アイヌは独自クラスタ。Japanese と Ulchi にアイヌ要素が見られる。
  • TreeMix をやると East Asian の中で outgroup を作る。でも Itelmen-Nganasan よりも内側。アイヌ白人幻想へのカウンターにはなっている。
  • allele の positive selection の話が面白い。East Asian に多い EDAR V370A をアイヌの 25% しか持っていない。ただし、同じく East Asian に多い OCA2 H615R はアイヌも高頻度に持っている。APO gene cluster の positive selection が海洋生物への依存を反映している可能性を指摘。

縄文人の南下

考古学的な詳細を知らないまま、修辞を追いかけていて気になった部分。

p.50 あたり。「オホーツク人の集落は海岸線から二キロメートル以内にしかな」い一方、「アイヌの集落は縄文時代以降近世まで、沿岸から内陸奥地にまで設けられてい」るのに、「アイヌはこれ [注: オホーツク人の南下] を避け、北海道の南半に押しこめられるかたちにな」ったのはなぜ? これだけ読むと、素朴には、沿岸を占拠されても、上流域は引き続き確保できそうなものである。オホーツク人が「クマなどの毛皮獣も多数捕獲していた」ことと関係ある?

東北のアイヌ語地名の担い手

東北のアイヌ語地名をいつ誰が残したのかという問題は、私にとってアイヌに関する最大の関心事の一つ。本書では、p.52 での導入に続き、p.70 以降で議論している。

本書は、「古墳時代の四世紀になると、北海道の続縄文文化の人びと (アイヌ) はこの [注: 本州の] 鉄製品を手に入れるために、古墳社会の前線地帯だった仙台新潟付近まで南下していました」(p.71) とさらっと記述している。この主張にどの程度強い根拠があるのか気になる。「そのため東北地方の遺跡からは、当時の北海道と同じ土器や墓がみつかります」(p.71) と書くが、典拠を付けていない。

関連文献のうち、本書が引く (松本 2006) は未見。同じ著者による『蝦夷(えみし)とは誰か』(2011) は読んだ。それによると、「東北北部では、弥生時代後期~古墳時代中期に併行する時期、すなわち1世紀後葉~5世紀前半ころの住居は発見されていない」(p.96) が、「3世紀後半ころ~5世紀後葉までは、東北北部でも、北海道の続縄文土器とほぼ同じものが作られていた」(p.97) とのことである。北海道と東北北部が同じ文化圏に属していたというだけで、この時期に南下が起きたとは言っていない。松本は、前時代との連続性を想定しているようである。

南下を主張するには、前時代との断絶を示す必要があるように思う。

接頭辞優勢言語?

アイヌ語は接頭辞が優勢」(p.68) という話。あまり気にしてなかったが、確かにそうだ。(中川 2010) は未見。

WALS で Feature 26A: Prefixing vs. Suffixing in Inflectional Morphology を見ると、アイヌ語は Equal prefixing and suffixing に分類されていた。ケット語は Weakly prefixing。周辺を見るとチベットビルマ系のギャロン語が Weakly prefixing、台湾のルカイ語とパイワン語が Equal prefixing and suffixing。

最近ケットと同系かもしれないと言われている北米のナ・デネ語族を見ると、結構接頭辞が優勢。

  • Slave, Tanacross, Chipewyan, Navajo が Strong prefixing
  • Sarcee, Hupa が Weakly prefixing
  • Tlingit, Apache (Western) が Equal prefixing and suffixing

最近考えている語順変化のモデルに例として使えるかもしれない。

相互理解可能性

北海道サハリンの基礎語彙残存率が70%程度で、宮古首里のペア*3と同程度であるから、「意思の疎通も困難なほど異なっていたというわけではありません」(p.85) という。ここで引いている (金田一, 1960c) は未見 (そればっかり...)。

相互理解可能性はそもそも 0/1 で割り切れる性質のものではないが、一般に聞く話では宮古沖縄は相互理解不可能。それもかなり昔からそうだったらしい。1390年に宮古の与那覇勢頭豊見親が首里朝貢したが、言葉が通じないので「怜悧の者二十名を選んで学ばせ」、3年にして言葉が通じたという (出典?)。

北海道サハリンは実際のところどうなのだろうか?

基礎語彙残存率と相互理解可能性の相関を真面目に調べた研究は存在するのだろうか?

Bayes 系統モデル

Lee and Hasegawa (2013) を「言語年代学的にあらためて計算しなおし...」(p.87) と説明するのは変。服部四郎が採取したデータこそが言語年代学の遺産。彼らの手法は、言語年代学というか語彙統計学の研究が低迷している間に発展した進化生物学統計的手法に由来する。正確には、進化生物学から直接借りてきたのではなく、他の研究グループがインド・ヨーロッパ語族に適用して話題になったので、同じ手法アイヌ語適用したもの。

「この [注: 年代] 推定をもとに考古学的な事象を解釈し、もともとサハリン方言とはオホーツク人の言語だったのであり、オホーツク人が八世紀に北海道全域へ拡散し、アイヌと融合するなかで、アイヌ語北海道方言が成立した、とのべています」(p.87) という結果の要約も変。彼らの主張は以下の通り。

系統モデルの性質上、全子孫の共通祖先にたどり着いたら終わりで、それ以前の状態は推定しない。彼らの主張はその祖語が北海道北部で成立したというだけ。考古学的知見の解釈についても、その言語を縄文人オホーツク人のどちらから引き継いだかについては何も言っていない。

もう少し真面目な言語学議論で、アイヌとニブフの接触を扱ったものを最近見つけた。Alexander Vovin の On the Linguistic Prehistory of Hokkaidōアイヌ語とニブフ語に共通する特徴 (接頭辞と語彙) を認定したうえで、主にアイヌからニブフへの借用を推測している。しかも、いくつかの要素は北海道アイヌ語にも確認され、アイヌ祖語にさかのぼるとみられる。ニブフ側も、サハリン・ニブフだけでなく、アムール・ニブフにも確認できる。このことから、オホーツク人が北海道 (のオホーツク海沿岸) でアイヌ語話者と接触したと推測している。たいした根拠があるわけではないし、話半分に聞いておくぐらいで良い。

*1:想定読者を広く設定すると仕方がないのかもしれないが、個人的には新書という形式は好きではない。引用しにくいし。典拠不明の記述が多いのも不満。本書は要所要所では文献を引いているけど。

*2:特に3章のコロポックル伝承の起源と展開が刺激的。以前、同じ著者の『コロポックルとはだれか』(2012) を読んで感心したが、本書はそこから何歩も先に議論を進めていた。

*3:「琉球語における宮古方言と首里方言」という表現が気になる。「琉球語」は存在しない。首里の言語をそう呼ぶのでないなら。そもそも「言語」と「方言」の識別に関して取り得る立場は2つある。日本語族に属する lect を分類すると taxonomy ができる。一つの立場はすべての階層のノードを「方言」と呼ぶもの。この場合、当然「琉球語」は出てこない。もう一つは、相互理解可能性という怪しげな基準を使って「言語」と「方言」を識別するもの。この場合も、具体的に何言語を認定するかは別として、それらは琉球よりも下位の階層に位置する。よって、琉球ノードは「琉球語」となる。どこかに「琉球語宮古方言」を支持する立場の人がいたりするのだろうか? 「言語」と「方言」の識別は、分類学者が「科」なのか「亜科」なのかと悩むようなもので、本質的に重要な区別ではない。しかし、社会的には方言は言語よりも劣るという観念が根強いようである。ある種の質の悪い言説は、このような社会的背景を認識しているにも関わらず、「言語」の認定と危機言語の保存運動を同時に行おうとする。この言説は、方言に対する社会的偏見をむしろ強化するという点で有害である。そもそも、この手の言説は、「言語」という分類学上の階層が保存運動の単位となる階層とどう対応するかを一切説明しない。これは自明ではない。話者自身が認識するまとまりは、一般に「言語」と対応しない。おそらく、保存運動とは、進歩的な自分たちが、遅れた話者に対して、学問の権威を背景に下す神託だと考えているのだろう。

arch74324arch743242015/09/10 19:47問題点のご指摘をいただき、ありがとうございました。明らかな誤り、勘違い、説明不足など、どれもご指摘のとおりとおもいます。現在別著にかかっておりますので、それらの点をふまえて論じてみたいとおもっております。お礼申し上げます。

murawakimurawaki2015/09/11 10:38こんな半可通の雑記にコメントいただいて恐縮です。次の本も楽しみにしております。

2012-03-20

Manchu: A Textbook for Reading Documents

Gertraude Roth Li, Manchu: A Textbook for Reading Documents, University of Hawaii Press, 2000.

Notes

  • p.88, Notes 2: erei da sekiyen mafa gebu Paihanpar. As noted by the arthor, this sentence has a topic-comment structure. Is Manchu a topic-prominent language?
  • p.101, Vocabulary, the 5th line from the bottom: se bahambi. As noted at page 103, se in this context seems a plural suffix.
  • p.130, last line: wang ni jalin faššaha. Li gives the translation "exerted himself on behalf of the emperor" (p.331). Referring to the emperor by wang sounds strange. I suspect this is a literal translation of some Classical Chinese idiom. 勤王?
  • p.134: hoise sei banin kelfišeme kenehunjere mangga. Another topic-comment construction.
  • p.135: mayan tatabumbi is clearly a literal translation of Chinese 掣肘.
  • p.141, 3-4th lines: ser sere be seremšeme badaran be sibuki sere gūnin. Li gives the translation "a policy with protects small leaders and restrains powerful ones" (p.332). I think this phrase is a literal translation of Chinese 防微杜漸. An English translation would be "nip something in the bud."
  • p.141, 7th line: dere de eterakū ombihe. Li gives the obscure translation "would not have overcome the situation" (p.332). I think dere means 面子 in this context. The following would be a better translation: "[Osman] could not hurt [Gaopu's] feelings."
  • p.149, 5th line: olji be jafaha hūlha be waha gungge ilibuha ... Li translates this phrase as "excelled in taking prisoners and killing rebels" (p.334). jafaha and waha form a coordinate structure. I wonder why jafaha but not jafame or jafafi is used. Without contextual support, it would better be read: "excelled in killing rebels who had taken prisoners."
  • p.150, 4th line: beile i jergi gūsai beise. Li translates this phrase as "beile prince of the rank of a beile" (p.334). Either one of them must be beise.
  • p.152, last line: yadahūn banjici ojorakū ofi ... It seems that yadahūn alone forms a clause although no glue marker is attached.
  • p.171, Note 61: Akim ini deo be ujen weile baharahū seme (also in Review 9 at page 175). Li gives the translation "because Akim feared that his younger brother might have committed a serious crime." I do not see why Li choses the conditional perfect. According to (Gorelova, 202:307-308), -rahū can be analyzed as -ra + akū. baharahū refers to an action that might take place in the future. A better translation might be: "because Akim feared that his younger brother might incur a felony conviction."
  • p.176, Review 13, v): Hotien should be either Khotan or Hetian. I wonder why she uses Wade-Giles.
  • p.194, 11th line: ambasa umai sehe akū aise. I do not see why the Kangxi Emperor used the peculiar expression sehe akū instead of the standard sehekū (also, why did Li ignore this?).
  • p.203, lines 4-5: G'aldan mimbe kemuni Bosihi sei sasa elcin unggiki serede (When Galdan wanted to send me as envoy to go along with Bosihi). A possible SOCV construction. Why is elcin left unmarked?
  • p.203, lines 5-6: G'aldan emu yargiyan ba akū bime. I wonder why de is absent. It should be placed right after G'aldan. A topic-comment structure?
  • p.204, 6th line: yalure jeterengge (provisions and transportation). An interesting example of coordination + the nominalizer -ngge.
  • pp.206-7: G'aldan i ya ici genere. jai G'aldan i gūnin arbun. tubai yaya baita be ... narhūšame wesimbure babi. Li's translation (p.338) is as follows: "But which direction he will turn depends on his intentions. ... I will report in more detail on the situation there." Li treated G'aldan i ya ici genere as a subject and G'aldan i gūnin arbun as a predicate. Can arbun be translated as "depends on"? I think gūnin arbun might be a phrase. Also, as these two phrases is connected with jai, I think that they are coordinated, and that the entire phrase is part of the object of wesimbure.
  • p.208, line 1: (also the transliteration at p.210, and Note 9): giyamun deri genebuhe. To me, the Manchu text seems to represent benebumbi (the causative of benembi), not genembi.
  • p.214, lines 1-2: niyalma largin, jugūn de feksire de tookajara de isinambime ... (the number of people would be large, making for delays during travel). It seems that niyalma largin is a subject-complement construction without a copula. largin is syntactically unrelated to jugūn, which immediately follows largin. Really confusing. We can see a tseg after largin but Li ignored it (p.217).
  • p.226, Transliteration, (220) 3rd line Noyan gelung. Looks like Li interprets this phrase as a personal name (Noyan) plus a title (gelung). Both look like common nouns. Noyan means a lord in Mongolian, and gelüng (from Tibetan dge slong) is a title for Buddhist priests. I am not sure if noyan was used as a personal name in Mongolian.

Typos

(might be corrected in the second edition)

  • p.37, 7th line: sargūsarkū (typo in the original?).
  • p.42, last example: jjihejihe.
  • p.59, Vocabulary: banjimbi sainbanjire sain.
  • p.62, Vocabulary: jecen toktobure ici ergi aisilara jiyanggiyunjiyanggiyūn.
  • p.83, Transliteration: kūmsokomso.
  • p.87, Vocabulary, (75), 4th line: Tsewang RaptanTsewang Rabtan.
  • p.161, (127), 3rd line: ubui i nonggime. Li often corrects typos without comment, but here the original spelling is preserved. This must be ubui nonggime or ubu i nonggime.
  • p.164, (146), 2nd line: insert i after Ūdui.
  • p.171, Note 61, 3rd line: rahurahū.
  • p.175, Review 9, 6th example: sildirarasilhidara.
  • p.211, Review 2, 4th example: weleheiweilehei.
  • p.242, Note 8. 'Is the the bad person to prevail?' → ???

2011-04-09

满语365句

何荣伟 ed. 满语365句, 辽宁民族出编社, 2009.

This book is accompanied by a CD, and Manchu utterances were recited by a Sibe announcer. I am curious about exactly what this language is. She pronounced Manchu spellings rather faithfully. But judging from recent field studies I have checked, it clearly different from Modern Spoken Sibe, which should, for example, drop final vowels. Is there any tradition about literary pronunciations in Sibe? Or is this just a modern reinvention? Or do Sibe people actually speak like this?

5: goidame sabuhakū bihe.

(Gorelova, 2002:312) states that goidame, which is derived from goidambi (last for a long time, to endure) means "long ago," "long since," and "for a long time."

6: hanciki de sain yabume biheo.

Does hanciki mean temporal proximity? The glosses and examples given by (Hu, 1994:386) imply that it only means spatial proximity. By contrast, (Li et al., 1984:296) only gives temporal proximity for Sibe:

hanqiki /hanchiki/ 近来, 最近。

Also I suspect de is unnecessary here.

biheo sounds something like /biho/.

10: bi yabume oho.

The syntactic pattern V-me oho cannot be found in grammar books on Written Manchu I have. It is clear from context that this refers to an action that is about to start, but I am not sure about its exact function.

(Kim et al., 2008) contains three examples of V-me oho.

  • 076: te bi 就 jeme oho. 那就不客气了 ???
  • 079: bi neneme yabume oho. 我先走了
  • 133: bi amgame oho. 我要睡觉了

As for Sibe, (Li et al., 1984:50) explains -m oⱨui as "现在-将来完成时" and "表示行为现在已经完成." (Kogura, 2007:147) translates -me o-hui into "~しそうだ" and provides one example.

  • bi sade-maqe buce-me o-hui. (私は疲れてもう死にそうだ)

Quote from (Li, 2000:306):

The verb forms -me oho and -me ohobi, or the negative form rkū oho are very common in Sibe. Examples: ice bele jime oho 'they are about to bring the new grain'; singgeri boo gurime ohobi 'Mr. Mouse is about to move' turigen be bajen de afaburkū oho 'they will no longer turn in rent to the landlords'; duleke de adališarkū oho 'it is no longer as in the past'. This type of oho parallels the Chinese word le 了 with the meaning 'to be about to' or in a negative sentence 'is no longer' or 'no more'.

15: ererengge sini embi jai mudan acaki.

Not sure about the syntactic relation of ererengge to acaki. Looks like it is a topic but not the subject of acaki.

18: ai arame ilihabi.

V-me ilihabi means some action or situation is in progress (Li, 2000:359). Maybe a trait of Sibe. However, (Guan et al., 2002:77) refer to V-me ilihabi as a present form (of Written Manchu).

In a grammatical sketch of Spoken Sibe, (Kida, 1999:52) explain [ilam] as "動作が進行・反復・継続している状態を示す。日本語の「てある、ている」に相する。" He provides six examples, all of which use the -m (-mbi) form.

23: bi ere juwe inenggi šahūrakabi.

juwe sounds like /ju/.

24: bi ergeme geneme oho.

Another V-me oho construction.

25: si ainahabi.

The announcer clearly attached ye to the end of the utterance although it is not shown in the book. According to Li, ye and na are "[p]articles/suffixes for emphasis and questions" (Li, 2000:311). They are described in the chapter of Sibe.

34: sikse dobori de sain amgahabio.

I wonder why de is attached to sikse dobori. The Japanese counterpart "ni" is used only for temporal nouns of absolute dates. "Last night" is not followed by "ni" because it depends on the point of time it is mentioned.

36: majige yasai amu isinjiha.

Quote from (Li et al., 1984:277):

yasim /amu/ 困倦。

yasim /amu isinzhimbi/ 瞌睡。

I suspect Sibe yasim actually corresponds to Written Manchu yasai amu, not amu.

38: ombi, erdeken i erge.

It seems that erdeken is always followed by the instrumental -i. erdeken (erde + -kAn) appears more like a noun than an adjective-adverb.

42: minci juwe se amba bihe.

I do not see why bihe is used for the current state.

44: teike sini emgi yabuha asihata weci.

The initial consonant of teike does not sound like "t" at all to me.

It is clear from context that asihan is used as a singular noun. However, (Kawachi et al., 1994:178) interprets asihata as the combination of asihan and the plural marker -ta. (Hayata, 1998) discussed the very problem. A number of Manchu dictionaries explain asihan as a young man (singular) and asihata as the plural form of asihan, but his analysis on the gin ping mei bithe revealed that asihan was an adjective and that asihata was used as a singular noun. In Sibe, asihata refers to a young man. I guess -ta is a derivational suffix used to form nominal words with semantics of quality (Gorelova, 2002:199).

(Gorelova, 2002:135) gives asihata as an example of the plural marker -ta, but (Gorelova, 2002:370) excerpts a singular form example from SIDI KUR. A Sibe-Manchu Version of "the Bewitched Corpse":

tere tasha aniyange ašikta ainci muke de buce-he dere (That guy who was born in the year of the tiger probably died in the water)

(Norman, 2013:23) gives "2. youth (often used as a singular)."

In the 清文啓蒙・兼漢滿洲套話 (28-1), asihata corresponds to Chinese 小夥子們 (i.e., plural).

At the entry of we, (Hu, 1994:807) lists two examples of weci that is placed at the end of utterances to form who-questions. No grammar books explain this syntactic pattern.

According to (Kawachi, 2014:1175), the 大清全書 gives: 是誰, 那幾個. coohai ejete[O ejente]weci 領兵者是那幾個. 兵主是誰.

(Norman, 2013:403) gives "2. who (plural), (plural of we)." However, asihata is a singular noun in this context.

In the 清文啓蒙・兼漢滿洲套話 (44-2), weci corresponds to Chinese 是誰.

47: i kemuni ajige, teni emu se tuleke.

The Chinese translation "才过一岁" suggests that tuleke (present: tulembi) means "to have passed," but I cannot find this meaning in dictionaries. (Hu, 1994:750) only gives "(1) 下网, 张网, 下套。(2) 套, 套上。" for tulembi. Also, Hu does not mention the -ke form. It was pronounced as /tuleke/, but tuleke must be a misspelling of tulike (present: tulimbi).

48: omšon biya ice ninggun de banjiha inenggi be dulebuhebi.

biya was pronounced as /bi.ya/, not /bja/.

According to (Li, 2000:391) and (Hu, 1994:202), the causative of dulembi is dulembumbi, and dulebumbi is not mentioned.

50: sini boode udu anggala bi.

53: sinde udu ahūn deo eyun non bi.

55: sinde udu jui bi.

86: sini boo ya bade bi.

120: gūwa ai jaka gaimbi..

141: ainu tenteke kangkahabi.

155: si ai omimbi.

157: bi, omimbio.

159: ombi. kara omimbio, embici sun be labdukan i suwaliyambi.

165: si aibide weilembi

175: si ya ba de weilen arambi.

182: tere ya ba de weilembi.

184: tere ai weilen arambi.

223: si an i ucuri de ai gisun be gisurembi.

229: ere be manju gisun i gisureci ai sembi.

246: enenggi ai bithe tuwaki sembi.

255: giya de genefi ainahabi.

273: ya ba deri yabumbi.

298: si tacikū de ai kicen tacimbi.

Untranscribed final ye. Looks like ye almost always follows bi.

60: suweni booi gūwa niyalma ubade terakūn.

suweni sounds like /sen.ni/.

I wonder if suweni can be replaced with sini in this context. They are talking about the listener's family and some other members of his/her family have been mentioned, but only the listener is present in the conversation. The Chinese translation of suweni boo is "你家."

76: ini gebu simengge sembi, tunggiya hala.

Typo: replace terei with ini (only the romanization is wrong; the Manchu script is correct). The announcer used ini, not terei.

85: bi beijing hoton de weilen arambi.

Manchu has weile and weilen. The meaning of the latter seems to have been narrowed.

89: yamjishūn de šolo bi nio.

Is de necessary here? See also No. 34.

90: bi, ai baita.

Untranscribed final ye after bi, but in an affirmative. (Li et al., 1984:70) states that ye "表示惊异, 赞叹, 或疑问语气."

91: sinde šolo bici, emu niyalma be takabume buki.

bumbi is used as an auxiliary verb. I cannot find such a usage in Written Manchu. As for Sibe, (Kida, 1999:53) explains it as one of auxiliary verbs: [bum] (くれる、やる、あげる) 日本語の「やる」「くれる」は区別なく [bum] で表される。私が主格である時には「やる」であり、自分以外の人間が主格で、自分に対してある有利な行為を行えば「くれる」と訳せるだけである。

Also, there are two examples in Sanjiazi Manchu. Quote from (Kim et al., 2008:210-1):

  • 316: bi sefu de meni tokso julen be ǰaŋnan (讲-na-me?) buhe. 我给老师讲了关于我们村子的故事.
  • 317: bi eniye de bithe be hūlame buhe. 我给妈妈读书了.

92: ere weci.

Another weci. See also No. 44. Also, ye is attached, but not to bi.

98: ulintai, erei onggolo si simengge be sabume dulekebio.

onggolo takes a genetive form, and even the demonstrative ere changes its form to erei in the transcript. But I cannot recognize the final i in the utterance.

I cannot find an explanation for the syntactic pattern V-me dulekebio in Manchu grammar books. Looks like a literal translation of the Chinese aspect marker "过" (past experience). As for Sibe, (Kogura, 2007:147) provides the following explanation:

-me dulu-xui 「ーしたことがある」(dule-: 過ぎる*)

* 漢語でも経験を表すのに,同様に動詞+「過」(過: すぎる) という構造が用いられる.

100: tuttu oci, bi imbe sinde takabume bihe.

Pronouns are used as if they cannot be dropped. Aren't they obvious from context?

104: bi inenggidari ningguci erin de ilimbi.

I cannot find the 12/24-hour time system in Written Manchu. Quote from (Li, 2000:295):

When telling time, colloquial Sibe usually uses the word erin. not jungken. It may also omit the ordinal ci.

106: bi inu teni ilihabi, buda jetere unde.

The final ye after ilihabi in the utterance. See also No. 90.

107: muse emu bade erdei buda jeki.

I suspect the genitive i in erdei buda is unnecessary.

emu bade means "together" (in one place -> in the same place). The semantic extensions of emu (one) are really confusing. It can refer to an indefinite object (one, not zero). On the other hand, it can mean "the same" (one, not two or three).

108: tuttu oci bi antahararakū oho.

This is the first appearance of V-rakū oho although Nos. 10 and 24 use the syntactic pattern V-me oho. -rakū seems to substitute for -me here as Manchu converbs lack negative counterparts.

antaharambi derives from antaha (guest) and literally means "to be/act as a guest." I am not sure about the exact nuance but it seems to mean "to be polite or modest." I see a parallel with Chinese 客/客气. They can be found in Written Manchu.

113: sain, jetere de umesi sain.

A comma is placed after sain, but no pause is confirmed.

I think this sentence can be translated as "very good to eat." Need to find other examples of V-ra de sain.

114: coko i umgan jembio.

Again, I suspect the genitive i in coko i umgan is unnecessary.

115: bisire oci, emke bureo.

I don't understand how bisire oci differs from bici. The latter alone might be too short to form a clause.

emke is acually realized as emken. (Li et al., 1984:36) and (Kida, 1999:23) suggests that "one" is emken in Sibe.

119: jeme muterakū oho.

V-me mutembi is certainly used in Written Manchu. (Li, 2000:92) reviews V-me mutembi together with V-ci ombi and V-me bahanambi, but does explicitly not explain the difference in nuance. (Gorelova, 2002:306) does not either. Quote from (Kida, 1999:83):

動詞 [om (なる)]、[mutum (できる: 能力がある)][banem (できる: 修得してできる)] などを使って表現する。... [om] と [mutum] はともに可能を表すが、その意味には差があり、[om] は条件として可能であるという場合で、[mutum] は能力として可能であるという場合に使用する。

123: efen, nasan sogi, sun cai, ememu erin de uyan buda jembi.

(Hu, 1994:698) among others gives sun i cai.

124: bi ere hacin i jemengge be cihalambi.

It is surprising that "to like" is expressed with a verb taking an accusative case in Manchu as Mongolian uses the syntactic pattern N-д дуртай/дургүй.

125: si ai buda jeme cihalambi.

149: arki omime cihalambio.

The syntactic pattern V-me cihalambi. (Gorelova, 2002:296) excerpts one such example from SIDI KUR. A Sibe-Manchu Version of "the Bewitched Corpse":

ši ere ba-de banji-me cihala-ci men'i ere abka i ba-de sasa banji-ki. (If you wish to live in this place, live together with us in heaven.)

129: suwe ai jembi.

suwe sounds like /swe/.

131: sini cihalara buda sogi be sonjo.

buda sogi seems an idiom, but does not appear in dictionaries. According to a blog, it is used in the nišan saman i bithe. It might be a literal translation of Chinese 饭菜.

136: sile be majige gaimbio.

Syntactically majige modifies gaimbio but semantically depends on sile.

137: ombi, emu moro sile bureo.

ombi is used as an answer to the question. Manchu grammar books list various question expressions, but do not mention how to say "yes" and "no."

bureo sounds like /buro/. In No. 115, I can recognize a trace of /e/ in bureo.

141: ainu tenteke kangkahabi.

ainu sounds like /aino/. Its Spoken Sibe form is an.

142: tulergi de hontoho inenggi feksihe.

I wonder if there are any expressions corresponding to "because ..."

144: majige pi jio nure omici antaka.

pi jio is clearly a loan word from Chinese. (Li et al., 1984:215) gives "pivo /piwo/" to 啤酒.

I wonder why there is a huge space between omici and antaka.

146: muke omici sain.

The syntactic pattern V-ci sain. (Gorelova, 2002:147) excerpts one example from SIDI KUR. A Sibe-Manchu Version of "the Bewitched Corpse":

ši encu emu bou ara-ci sain (It will be good if you build another house)

147: muke omime wajifi, muse jai arki omiki.

wajimbi as an auxiliary verb seems to have a long history. As for Spoken Sibe, (Kida, 1999:53) notes: [wazhem] (終わる、~してしまった) は失敗、残念な意を表す。Clearly, the utterance in question has no such nuance.

150: bi an i ucuri de majige omimbi.

Again, I suspect de is unnecessary.

152: pi jio nure omici sain, šanggiyan arki omici uju nimembi.

As a native speaker of Japanese, I naturally think of Japanese translation. Now I wonder why the following sentence is unnatural: 酒を飲んだら頭が痛い.

154: arki omime wajifi, tubihe i muke be majige gaiki.

I have not attested the phrase tubihe i muke in other sources.

159: ombi. kara omimbio, embici sun be labdukan i suwaliyambi.

Quote from (Gorelova, 2002:156):

Diminutives are commonly followed by the genitive case marker i (occasionally they appear in a stem form) and normally function as adverbial modifiers. Due to this, they reveal a tendency to shift from diminutives to adverbs

See also No. 38.

170: manju i suduri, šu wen jai gisun hergen be sibkimbi.

The phrase šu wen is not listed in (Hu, 1994). (Li et al., 1984:230) gives an unsegmented form:

shuven /shuwen/ 文化。

This section is interesting as it adapts the traditional lexicon to modern life.

171: tuttu oci, si emu sefu bihe.

Need to explain why bihe is used here. I guess this expression emphasises the fact that the listener had been a teacher even before the speaker found out that.

179: bithe tuwaki seci, mimbe baime jio.

Can baimbi take person(s) as an object (the be case)? Looks perfectly OK.

180: tuttu oci, sinde ambula baniha.

Saying a thank-you after a conditional expression gives a bad impression at least in Japanese. What about Manchu?

185: etuku adu jergi jaka be uncambi.

Quote from (Gorelova, 2002:138-9):

Plurality can be expressed with the help of the words ... jergi "category," "grade," "rank," "sort." Following the marker for the genitive case added to the noun, these words denote both plurality of objects and the belonging of the latter to a certain class, kind or sort. Following the noun directly, they denote plurality with the shade of meaning "of different/various kinds, every kind." The word jergi is normally used with animate objects ...

However, it is not difficult to find examples of jergi with inanimate objects. Quote from (Kida, 1999:37)

*1)bitke deri tuilhun, serkin, yurɣan, zherɣi i zhaqe gele bi. (本のほかに新聞、画報などもある。)

*2)ere zherɣi afesie. (これなど如何でしょう。)

*3)min deri tiulɣen sulfanga, mutenge, giltuqan zherɣi gurun gele zhim. (私以外にスフファンガ、ムテンゲ、ギルトカンなどの者も来る。)

186: ememu erin de efire jaka uncambi.

This is a declarative sentence. The final "?" in the transliteration must be a typo.

188: bi niyamangga gisun be tacibumbi.

The phrase niyamangga gisun seems a part of the modern vocabulary. It is not found in Manchu dictionaries but in (Li et al., 1984:205):

niamang gisun /niyamangga gisun/ (1) 母语。 (2) 语文。

192: fengšentai oci emu usisi.

Quote from (Gorelova, 2002:198):

the suffixes -si, -msi, -ci, -ji, -lji, -mji, -nju are used to form nouns both from verbs and nouns. The resulting nouns designate people according to their skills, occupations, ranks, trades, and business: ... usisi "farmer," ...

195: manju hergen atanggi fukjileme banjibuhabi.

fukjilembi (< fukjin + -le) is not found in (Hu, 1994). (Li et al., 1984:150) gives "fuhjilem /fukzhilembi/ 创造。"

196: emu minggan sunja tanggū uyunju uyuci aniya de, monggo hergen be ten obufi, manju hergen be fukjileme banjibuha.

obumbi fills monggo hergen in its accusative slot. Then what is the case of ten?

205: daicing gurun i werihe manju hergen i bithe cagan jai dangse elekei gemu ice manju hergen i arahabi.

Is ..bithe cagan jai dangse the object of arahabi? It is interesting that the accusative marker be is not attached to such a very long non-adjacent phrase.

210: i gisurere ararade gemu hafu.

An example of verbal coordination. Also interesting is that hafu takes the de case.

217: manju gisun be tacirede ja nio mangga nio.

I am unsure why tacire and ja/mangga are connected with de. tacire is the theme of the predicate ja. "tacirengge ja nio" looks more natural to me.

219: inenggidari emu erin baitalame tacimbi.

The first example of erin not being accompanied by de. erin modified by a cardinal number refers to a space of time.

221: onggolo aniya de, labdu manju niyalma manju gisun gisureme mutembi.

This example is interesting in that the imperfect -mbi is used for an event that contextually clearly occurred in the past.

237: jai mudan gisurecina.

The first example of -cina. Quote from (Gorelova, 2002:301):

The form in -cina/-kina is considered to be an imperative form by most specialists (Zakharov, 1879:180-81; Pashkov, 1963:37). The form in -cina/-kina is used by the speaker when he addresses someone who is lower in social position. The accomplishment of the action is considered by the speaker as desirable: alacina (alakina) "speak out (if you wish);" tuwacina (tuwakina) "have a look (if you wish)," etc.

According to Zakharov, this form is originated from the combination of the conditional converb in -ci and the interrogative particle na: -ci + na > -cina. In the author's opinion, this form expresses a polite request formulated as a question. The meaning rendered by the form in -cina can be translated as the following words and phrases: "please," "very likely," "let it be," "let it be in this way," "isn't it so?," "isn't it true?". The word form bicina (the form in -cina derived from the verb bi- "to be," "to exist") can be translated as "let it be in this way," "isn't it true?". The word form secina (the form in -cina derived from the verb se- "to say") means literally "let me say." It is very often used as a note of exclamation at the end of an utterance in the meaning "this way it is!," "so it goes!" (Zakharov, 1879:180-1).

239: bi jing manju gisun hergen be sibkimbi.

jing indicates that an action is in progress, and has some parallels with the Chinese aspect marker (正)在.

254: sinde šolo bici, mini emgi giya de gengšeme yabu.

I guess giya is a loan from Chinese (街). It has a variant giyai. (Hu, 1994:342) implies that giyai is more common. Quote from (Kim et al., 2008:73)

gja [kja] street 镇,街道,街上/街头 giyai

As for Sibe, (Li et al., 1984:156) gives "gia /giya/ 街道。"

I had a hard time finding gengšembi in a dictionary. It is not found in (Hu, 1994). As for Sibe, (Li et al., 1984:155) gives:

gengsim /gengshembi/ (1) 游玩, 闲逛, (2) 串门。

260: mini emgi sasa genembio.

The Chinese translation contains the modal verb 要, which has no Manchu counterpart.

261: minde majige icihiyara baita bi.

icihiyara sounds like /icihara/.

262: jai mudan de nashūn bahaci sasa geneki.

I do not understand why jai mudan is followed by -de.

267: ildun de emu gin šatan gaisu.

ildun de 'taking advantage of' without a modifier. (Li, 2000:200) cites one such example:

booi baita be ildun de icihiyame gamambi at the same time I'll take the opportunity to take care of some family matters.

271: majige bense fi jergi jaka be udame gaiki sembi.

bense is clearly a loan from Chinese, 本子.

272: tere hoton i julergi de bihe hūdai ba de geneci, ya emu jugūn sejen tembi.

The conditional converb -ci denotes a purpose here.

sejen in this context means a bus. jugūn corresponds to Chinese 路. "N路车" means "bus route N." The entire phrase is influenced by the Chinese convention.

I do not understand the phrase "ya emu."

273: ya ba deri yabumbi.

The first example of the controversial marker -deri. (Gorelova, 2002:193-4) offers some discussion on this matter. The context suggests that the meaning of -deri in this example is a starting point in space.

275: neneme emuci jugūn sejen tembi.

Dictionaries gloss neneme as "formerly, previously, beforehand" (Gorelova, 2002:354). However, it seems that neneme in this context means "first" as in "first ... then ..."

276: sunja tatan tehe manggi, jakūci jugūn sejen halame tefi, jai ilan tatan yabuci uthai isinambi.

sunja tatan and ilan tatan seemingly function as adverbial modifiers. Adverbial numerical phrases without case markers do need an explanation.

tatan in this context seems to refer to a bus stop. It would be part of the "modern" vocabulary. Qute from (Li et al., 1984:241):

taten /tatan/ 驿站, 住宿地。

jakūci jugūn sejen modifies tefi, and halame is used as an adverb.

277: sejen jime ilihabi.

The j in jime sounds unvoiced.

281: yaka sejen teci gemu ombi.

The context suggests that yaka means "which" (inhuman). (Hu, 1994:822) and (Kawachi et al., 2002:205) imply that yaka is primarily used for persons. As for Sibe, (Li et al., 1984:278) glosses it as "哪个."

In the 清文啓蒙・兼漢滿洲套話 (27-9), yaka bade acaha gese. corresponds to Chinese 在那裡會過是的 (i.e., inhuman).

282: aika turibure sejen teci, tofohon fuwen yabume uthai isinambi.

As suggested by the Chinese translation 出租车, turibure sejen (lit. hired car) means a taxi. Need to be attested in other literature.

fuwen was pronounced as /fun/.

I do not see why the imperfect converb yabume is used instead of yabuci or yabufi. The dependent action marked by the imperfect converb must occur simultaneously with the principal action. In my understanding, however, the action of isinambi occurs after the action yabumbi is completed. Also, yabume is immediately followed by uthai, which strengthens the view that yabumbi must be completed.

285: tuttu oci, muse sejen turime yabu.

The imperative form with inclusive we.

292: amba, tacikū de ilan tacibure leose jai duin indebure leose bi.

leose sounds like /louse/.

Modern terminology: tacibure leose, 教学楼; indebure leose 宿舎楼. It is interesting that causative verbs are used in both phrases.

293: an i ucuri de tacire juse tacikū de indebumbi.

The causative verb indebumbi takes tacire juse as an object, and the accusative marker be must be dropped here. The Chinese translation is expressed by a non-causative construction.

Modern terminology: tacire juse (students). (Lee et al., 1984:240) gives

taqixi /tachisi/. 学生。

tacire juse is attested in the 大清全書 (Kawachi, 2014:1030).

294: šolo sindaci teni boode beredebumbi.

šolo sindambi must be a literal translation of Chinese "放假" (go on vacation, have a holiday). I wonder if šolo co-occurs with sindambi in Classical Manchu.

296: erdeken i gene, ume sitabure.

I don't see why the causative verb sitabumbi is used. The agent of the action sitambi must be the listener of the utterance.

300: suweni banse de udu niyalma bi.

Quote from (Li et al., 1984:98):

bans /banse/ (1) 班。(2) 教室。

304: geren nofi gemu tacibure bithe be bahao.

Modern terminology: tacibure bithe (textbook?). (Li et al., 1984:240) gives

taqivchen /tachibchen/ 课本

314: yabure onggolo leolen šu be afabu.

Modern terminology: leolen šu (paper), a literal translation of 论文.

315: enenggi booi kicen oci cik arambi.

Modern terminology: booi kicen (home work, 家庭作业).

According to various sources I checked, cik only means a circle used as a punctuation marker, but the Chinese translation "句子" suggests that it refers to sentence(s) in this context.

325: niyengniyeri, juwari, bolori, tuweri.

The pronunciation of tuweri. For Sanjiazi Manchu, (Kim et al., 2008:100) gives:

tuli [ˈtʰujle] winter 冬天 tuweri

As for Sibe, (Li et al., 1984:253) gives:

türi /tuweri/ 冬天。

326: niyengneri de, birai juhe weniyehe.

It seems that in Written Manchu weniyehe is associated with iron. The Chinese gloss is "熔" (the "fire" radical) instead of "溶" (the "water" radical). As for Sibe, (Li et al., 1984:264) gives

venem /waniyembi/ 溶化

I don't see why the perfect marker -he is used. It is ignored in the Chinese translation.

327: ser sere edun julergi ci fulgiyeme jifi, tumen jaka arsunambi.

Dictionaries suggest that fulgiyembi (to blow) usually takes people as the agents. Not sure if wind fits. The 大清全書 gives 風其吹汝之吹 (Kawachi, 2014:403).

328: ba na de yasai jalu gemu niowanggiyan fiyan.

It is difficult to parse this poetic sentence. yasai jalu?

There is a huge gap between the spelling of niowanggiyan fiyan and its pronunciation.

According to (Gorelova, 2002:104), fiyan is realized as [fĭɛn] in Sibe.

329: juwari jihe. abka halhūn ohobi.

Again, I don't see why -he and -hobi are used in this context. Do they have a poetic effect?

330: hacingga ilha nemšeme ilhanambi.

nemšembi is glossed "飽くことなく求める, むさぼる" in (Kawachi et al., 2002:196), and "争, 争多, 求多, 贪婪" in (Hu, 1994:572). The second and third example are both "nendere be nemšembi," which is translated into Chinese as "争先." As for Sibe, (Li et al,. 1984:204) gives:

nemsim /nemshembi/ 争, 争先, 竟争

Semantic shift might have taken place.

331: bolori isiname, serguwen edun amargi ci dame jifi, juwari i halhūn sukdun be bašame tucibuhe.

juwari i sounds like /jwarigi/.

334: šahūrun tuweri de, nimanggi dame duribuhe.

duribumbi is used as an auxiliary verb. Quote from (Kida, 1999:53):

[diurevem] (始める) →~始める

337: nai mumuhu šun be emu barun torhome yabuci, uthai emu aniya.

Modern terminology: nai mumuhu seems a literal translation of "地球." I cannot find this term in dictionaries.

338: emu aniya de juwan juwe biya, uheri ilan tanggū ninju sunja inenggi bi.

juwan sounds like /jun/.

339: emu inenggi de orin duin erin bi. emu orinde ninju fuwen. emu fuwen de ninju miyoori bi.

I cannot find the spelling miyoori in dictionaries. (Hu, 1994:541) gives miyori. (Li et al., 1984:197) says:

miauri /miyaori/ 秒。

345: hangsi de niyalma sa tulergi de tucifi niowanggiyan be amcame genembi.

hangsi seems a loan from Chinese but I am not sure about the source. 寒食 (hanshi)?

Looks like niowanggiyan de amcame genembi corresponds to 踏青.

353: tulergi de halukan.

halukan sounds like /haluhan/.

365: sukdun usihiyeken.

(Hu, 1994) misses usihiyeken. He does gloss usihiyan as "同usihiyen" but it is not covered by the dictionary. usihin and usihiken are well attested.

Misc

A question that has puzzled me for many years is what is the name of "zero" in Manchu. According to (Li et al., 1984:152), the meaning of fuka is (1)零. (2)泡ㄦ,圈ㄦ. The original meaning of fuka is a circle, as opposed to a dot, and I have not attested fuka as a numeral in text.

References

  • Liliya M. Gorelova. Manchu Grammar, Leiden, 2002.
  • 关嘉禄, 佟永功. 简明满文文法, Shenyang, 2002.
  • 早田輝洋. 満洲語文語における或る単語の単数と複数について−『満文金瓶梅』のasihanとasihata−, 九州大学言語学研究室報告 第9号, 1988.
  • 胡增益 ed. 新满汉大词典, Ürümchi, 1994.
  • 河内良弘, 満洲語辞典, Kyoto, 2014.
  • 河内良弘, 清瀬義三郎則府. 満洲語文語入門, Kyoto, 2002.
  • 木田章義. シボ語を中心としたアルタイ系言語との比較による日本語の接辞・語尾の発生論的研究. 1999.
  • Kim Juwon, Ko Dongho, Chaoke D. O., Han Youfeng, Piao Lianyu, Boldyrev B.V. Materials of Spoken Manchu, Seoul, 2008.
  • 児倉徳和. シベ語, 文法を描く 2, pp. 131-157, Fuchu, 2007.
  • Gertraude Roth Li. Manchu: A Textbook for Reading Documents, Honolulu, 2000.
  • 李树兰, 仲谦, 王庆丰. 锡伯语口语研究, Beijing, 1984.
  • Jerry Norman. A Comprehensive Manchu-English Dictionary, 2013.