Zipf yasası

Zipf yasası , olasılık, onaylama işlemi frekansları o f belli olayların sıralamasını ile ters orantılıdır r . Yasa ilk olarak Amerikalı dilbilimci George Kingsley Zipf (1902–50) tarafından İngilizce dilinde farklı kelimelerin kullanım sıklığı için önerildi; bu frekans yaklaşık olarak f ( r ) ≅ 0.1 / r olarak verilir . Bu nedenle, bir İngilizce en yaygın kelime (seviye 1), tipik bir metinde zaman onda biri etrafında gerçekleşir; bir sonraki en yaygın kelime (sıra 2), bir zaman yirmide biri etrafında gerçekleşir; ve benzeri. Buna bakmanın başka bir yolu da bir rank r kelimesinin 1 /r , en sık kullanılan sözcükle aynı sıklıkta olduğundan, 2. sıra sözcüğü 1. sıradaki sözcüğün yarısı kadar sıklıkta, 3. sıra sözcüğü üçte bir sıklıkta, 4. sıra sözcüğü dörtte bir sıklıkta vb. Yaklaşık 1.000'in ötesinde, yasa tamamen yıkılır.

Zipf yasası, üstel bir dağılımı izleyen diğer birçok istatistik için de gözlendi. Örneğin, 1949'da Zipf, bir ülkedeki en büyük şehrin, bir sonraki en büyüğünün yaklaşık iki katı, üçüncü büyük şehrin üç katı büyüklüğünde olduğunu iddia etti. Uyum diller, popülasyonlar veya diğer veriler için mükemmel olmasa da, Zipf yasasının temel fikri, veri sıkıştırma şemalarında ve şehir planlamacıları tarafından kaynakların tahsisinde kullanışlıdır.

William L. Hosch