第8回:言語の変化と統計的手法

  • 言語年代学の基本公式を理解すること
  • 言語年代学の基本公式の問題点を認識すること
  • 生物の系統発生学における分子時計の手法が、言語系統の解析に応用できることを理解すること
  • 生物の系統発生の解析と言語系統の解析の違いを挙げられるようにすること

言語の変化や言語の親族関係を分析する際には、さまざまな統計的な手法が使われます。昔からある手法としては、言語年代学的な手法があります。近年では生物の系統発生学のモデルを応用して言語の歴史を調べるということも行われています。

言語年代学の基本公式

言語は時を経て分岐することがあります。例えば、ラテン語は、イタリア語やフランス語などに分岐しました。言語の分岐を考える際は、いつ分岐したのかということを調べる必要が出てくることもあります。

言語年代学 (glottochronology) の基本公式という公式を使うと、親族関係にある2つの言語が分岐してからどれぐらいの時間が経ったかを調べることができます。この公式によれば、2つの言語が分岐してからの時間 t は、以下のようにして求められます。

  • t = logc / 2 logr

ここで、c は同系語 (cognate words) の共有の割合です。同系語の比率を調べる際は、スワデシュリスト (Swadesh list) などの基礎語彙表に載っている語彙を対象にして考えます。また、r は言語年代学定数 (glottochronological constant) です。言語年代学定数とは、言語の変化のスピードを司る定数で、一般的には0.6から0.7であると言われています。

しかし、上述の言語年代学の基本公式には問題点もあります。この公式で計算すると、ある特定の時点で2つの言語に分岐したように見えてしまいますが、実際にはある日突然2つの言語に分岐するというわけではありません。また、言語年代学定数をいくつにすべきなのかは簡単には決められません。

系統発生学的手法による分析

生物学において、進化の流れや生物の系統を追うために、分子時計 (molecular clock) と呼ばれるテクニックが用いられることがあります。これは、端的に言えば、生物の持つ DNA の情報を比較することで、ある生物と別の生物の間の遺伝情報の類似度を測ることで、進化の流れや生物の系統を知るというものです。

この系統発生学的手法は、言語の分析にも応用できます。DNAの変化の代わりに、語彙の変化を追っていけばよいのです。

  • 言語年代学の基本公式で、c = 1 となるのはどういう状況でしょうか。また、c = 0 となるのはどういう状況でしょうか。
  • 系統的に全く無関係な言語、例えば日本語と英語の場合、同系語の比率 c はどのような値を取るでしょうか。
  • スワデシュリストなどの基礎語彙表に載っている語彙はどのような分野の語彙が多いか調べてみてください。また、それに問題がないか議論してみましょう。
  • 生物の進化と言語の変化の類似点、相違点について考えてみてください。