Le
linguiste américain George Kingsley Zipf (1902-1950) s’est penché sur la
fréquence des mots dans la littérature.
En
compilant de grands textes classiques, notamment Ulysse de Joyce, il a montré que la fréquence du nième mot le plus
fréquent (rang n) est n fois plus faible que celle du mot le plus fréquent
(rang 1).
Exemple :
si le mot le plus fréquent présente une occurrence de 1000, le dixième mot le
plus fréquent apparaît 100 fois.
Cette loi,
à laquelle a été donné le nom de Zipf, se révèle valable pour tous les textes
et dans toutes les langues.
A l’écrit
comme à l’oral.
Zipf a
également montré que la fréquence d’un mot est inversement proportionnelle à sa
longueur.
Les
conjonctions, prépositions, articles… sont plus fréquents que les verbes et les
noms.
Réciproquement,
quand un mot savant long devient populaire et fréquent, on a tendance – pour
qu’il tienne son rang – à l’abréger par apocope : auto, pour automobile, stylo pour
stylographe, dactylo pour
dactylographe, etc.