唐库分级阅读是按照英文文章中的单词词频设计的一套简单明了的分级阅读方法。
词频:就是单词出现的频率的排名,例如一个人一天阅读了10000个词汇组成的文章,这里面,单词”the”出现的频率最高,于是”the”的词频就是1;英语有几万个单词,所以每个单词的词频在1~几万之间。
唐库分级阅读的词频采用了英国国家语料库词频顺序和美国当代语料库词频顺序之和取平均。
唐库分级阅读难度系数 = (所有单词词频之和/所有单词数量)/30 +/- 人工调节值
从计算方法可看出,唐库分级阅读难度系数基本上就是文章中所有词汇的平均词频,再除以30,为什么除以30?只是把这个数字转为0-100左右的数,一般70就适合大学生阅读。
0:表示该专辑尚未计算
小于30:幼儿园
31~40:小学
41~50:初中
51~60:高中
61~80:大学
81~100:研究生
101以上:英语专业
词频仅仅反映了单词的难度,句式的难度不能反映,例如《伊索寓言》平均词频是68,说明有不少冷僻词汇,但句式简单,篇章极短,初中生甚至小学生也是可以阅读的。所以唐库难度系数增加了一个人工调节值。
在唐库专辑的编辑界面,【唐库学习】语法检查及统计功能中(点“统计”工具栏按钮),点击字词统计即可计算任意英文文章的唐库分级阅读难度系数(可以计算整个专辑,也可以计算单篇文章)。
(上图是《老人与海》的字词统计)