言語の変化や言語の親族関係を分析する際には、さまざまな統計的な手法が使われます。昔からある手法としては、言語年代学的な手法があります。近年では生物の系統発生学のモデルを応用して言語の歴史を調べるということも行われています。
言語は時を経て分岐することがあります。例えば、ラテン語は、イタリア語やフランス語などに分岐しました。言語の分岐を考える際は、いつ分岐したのかということを調べる必要が出てくることもあります。
言語年代学 (glottochronology) の基本公式という公式を使うと、親族関係にある2つの言語が分岐してからどれぐらいの時間が経ったかを調べることができます。この公式によれば、2つの言語が分岐してからの時間 t は、以下のようにして求められます。
ここで、c は同系語 (cognate words) の共有の割合です。同系語の比率を調べる際は、スワデシュリスト (Swadesh list) などの基礎語彙表に載っている語彙を対象にして考えます。また、r は言語年代学定数 (glottochronological constant) です。言語年代学定数とは、言語の変化のスピードを司る定数で、一般的には0.6から0.7であると言われています。
しかし、上述の言語年代学の基本公式には問題点もあります。この公式で計算すると、ある特定の時点で2つの言語に分岐したように見えてしまいますが、実際にはある日突然2つの言語に分岐するというわけではありません。また、言語年代学定数をいくつにすべきなのかは簡単には決められません。
生物学において、進化の流れや生物の系統を追うために、分子時計 (molecular clock) と呼ばれるテクニックが用いられることがあります。これは、端的に言えば、生物の持つ DNA の情報を比較することで、ある生物と別の生物の間の遺伝情報の類似度を測ることで、進化の流れや生物の系統を知るというものです。
この系統発生学的手法は、言語の分析にも応用できます。DNAの変化の代わりに、語彙の変化を追っていけばよいのです。