detective-冰格
发信人
: liuchangjie (so much to
learn,so little we know),
信区
: EnglishWorld
标
题
:
英语单词的长度和音节数
发信站
:
水木社区
(Sun Mar 24 09:37:43
2013),
站内
最近对自己的
vocabulary
进行了整理,
对于英语的
words
有一些有意思的发现。
< br>
首先是英语单词的长度,利用了
List Of All
English Words Database Software
的数据库,该数<
/p>
据库中共有
190510
个单词,包含单
词的复数,
-ed
,
-ing
,不加
more
、
mo
st
构成的比较级、最
高级形式,首字母缩略词等;不含紧缩形
式(
can't
之类的)以及包含空格、连词符号的词
(
school
bus
、
roll-up
之类的)
p>
。统计结果如下(第一列代表
n-letter
,第二列是
n-letter
的单词
数量)
:
1 2
2 36
3 988
4 5759
5 11251
6 18478
7 26121
8 30748
9 26489
10 21297
11 16004
12 11508
13 7933
14 5197
15 3223
16 1956
17 1136
18 599
19 329
20 160
21 64
22 30
23 17
24 9
25 2
26 0
27 2
28 3
29 0
30 2
>30 1167
可见
8
个字母的单词最多,有
30748
个。长度在
1~30
的共
189343
个,
也就是说在这数据库
中
还有
1167
个长度超过
30
个字母的单词。
其次是单词的音节。
我利用
LDCOE
5
建立一个含
26760
个单词的数据
库
(基本是手动建立的)
,
这基本上是
我词汇量的上限了,
其中所有词汇都在
LDCOE5
中有单独的
entry
,
不含有空格、
连
词符号的词,不含变形形式。关于这些单词的音
节数量,统计结果如下:
monosyllable
1 3918
disyllable 2 10959
trisyllable 3 7041
quadrisyllable 4 3443
pentasyllable 5 1158
hexasyllable 6 207
heptasyllable 7 29
octasyllable 8 5
可见两个
音节的单词是最多的。其中
5
个
8
p>
音节单词是
utilitarianism
(
u|til|i|tar|i|an|is|m
)
,
neocolonialism
,
interdenominational
,
ele
ctroencephalogram
,
electroenc
ephalograph
,另有
一些极品长词暂且不论。单音节
词数量也不少,最长的有八个字母(如
schmooze,
squashed
等词)
。
在这
26760
个单词中,一共有
68025
个音节,去掉重复的,一共有
7730
个音节!其中有
3316
个音节只出现
了一次,出现
100
次以上的音节如下:
1 1326 a
2
1273 i
3 1104 er
4 864 ing
5
863 o
6 851 in
7 831 tion
8
686 e
9 651 re
10 633 un
11
564 y
12 563 ter
13 560 ble
14
512 al
15 509 con
16 492 ly
17
425 de
18 405 ry
19 405 ty
20
375 ti
21 369 en
22 360 u
23
350 ed
24 336 di
25 308 per
26
307 ra