频率词典

来自中文百科,文化平台
跳转至: 导航搜索

频率词典( frequency dictionaries),根据词的出现频率高低而编排的词典。

世界上第一部频率词典是1898年德国语言学家F.W.凯丁编的《德语频率词典》,它统计了110万个词的语言素材。20世纪初,美国教育学家兼心理学家E.L.桑代克统计了大量英语词汇的频率,编写出《教师两万词词书》(1921)和《教师三万词词书》(1944)。中国第一部汉语频率字典是教育家陈鹤琴编写的《语体文应用字汇》(1928)。中华人民共和国建立前他在南京高等师范学校任教,与助理员用了两年时间,分析了554 478个字,得出4 261个单字。

频率词典按其内容可分为普通频率词典和专业性频率词典两大类。

普通频率词典 可分为单语言频率词典和多语言频率词典。单语言频率词典分为:①语义频率词典。有英国学者M.韦斯特编写的《通用英语词表》(1953),收集了2 000个最常用的英语词,对于每一个多义词,统计了它的每一个意义的频率。②成语频率词典。在桑代克的倡议下,美国外语教学委员会于20世纪20、30年代出版了一系列外语成语频率词典。③后缀频率词典。有桑代克的《英语后缀的教学》(1941)。在每一个后缀的后面,注明由该后缀构成的词的数量,从而表示该后缀在英语中出现的频率。后缀频率词典不是针对单词而是针对语言的形态进行编写的,又可称为倒序频率词典。④一般频率词典。在每一个词后,注明其绝对频率、相对频率及序号,有的还注明该词在各种文件中的分布情况。多语言频率词典有美国学者H.S.伊通的《英语、法语、德语、西班牙语比较频率词表》(1940),是一本多语言对照的频率词典,以各语言中最常用的1 000个词为依据进行对照。

专业性频率词典 有苏联学者S.D.别列斯涅夫等编的《德语畜牧学频率词典》(1968),P.M.阿列克谢耶夫和L.A.图里金娜合编的《英俄频率词典——最低限量的新闻词汇》等。其他还有电子学等专业编制的专业性频率词典。

过去编写频率词典主要靠手工查频,近年来人们开始借助于计算机。对于一些形态变化丰富的语言,首先由计算机将文章中的每个词还原成它的原形,并注明每个词详尽的形态变化,输入计算机储存,然后由计算机进行频率统计,打印出频率词典。北京语言大学语言教学研究所采用人工与计算机相结合的办法,对近200万字的汉语语料进行词频统计,于1986年出版了《现代汉语频率词典》,收词31 159条,这是中国正式出版的第一部汉语频率词典。