menu
What is the frequency of the letters of the alphabet in English?
    
print buttonPrinter Friendly Version

The inventor of Morse code, Samuel Morse (1791-1872), needed to know this so that he could give the simplest codes to the most frequently used letters. He did it simply by counting the number of letters in sets of printers' type. The figures he came up with were:
12,000     E                    2,500     F
9,000     T                     2,000     W, Y
8,000     A, I, N, O, S      1,700     G, P
6,400     H                     1,600     B
6,200     R                     1,200     V
4,400     D                     800     K
4,000     L                     500     Q
3,400     U                     400     J, X
3,000     C, M                200     Z

However, this gives the frequency of letters in English text, which is dominated by a relatively small number of common words (see What are the commonest English words?). For word games, it is often the frequency of letters in English vocabulary, regardless of word frequency, which is of more interest. We did an analysis of the letters occurring in the words listed in the main entries of the Concise Oxford Dictionary (11th edition revised, 2004) and came up with the following table:

E     11.1607%     56.88     M     3.0129%     15.36
A     8.4966%     43.31     H     3.0034%     15.31
R     7.5809%     38.64     G     2.4705%     12.59
I     7.5448%     38.45     B     2.0720%     10.56
O     7.1635%     36.51     F     1.8121%     9.24
T     6.9509%     35.43     Y     1.7779%     9.06
N     6.6544%     33.92     W     1.2899%     6.57
S     5.7351%     29.23     K     1.1016%     5.61
L     5.4893%     27.98     V     1.0074%     5.13
C     4.5388%     23.13     X     0.2902%     1.48
U     3.6308%     18.51     Z     0.2722%     1.39
D     3.3844%     17.25     J     0.1965%     1.00
P     3.1671%     16.14     Q     0.1962%     (1)

The third column represents proportions, taking the least common letter (q) as equal to 1. The letter E is over 56 times more common than Q in forming individual English words.

The frequency of letters at the beginnings of words is different again. There are more English words beginning with the letter 's' than with any other letter. (This is mainly because clusters such as 'sc', 'sh', 'sp', and 'st' act almost like independent letters.) The letter 'e' only comes about halfway down the order, and the letter 'x' unsurprisingly comes last.




- 번역

영어에서 알파벳의 사용 빈도는 어떠한가?

모스부호의 발명가인 사무엘 모스(Samuel Morse)(1791-1872)는 가장 자주 사용되는 글자의 부호를 가장 단순한 부호로 지정하기 위해 알파벳 사용 빈도를 알 필요가 있었다.  그는 인쇄기 활판의 활자를 세는 간단한 방법을 사용했다.  그가 알아낸 숫자는 다음과 같다.

12,000     E                    2,500     F
9,000     T                     2,000     W, Y
8,000     A, I, N, O, S      1,700     G, P
6,400     H                     1,600     B
6,200     R                     1,200     V
4,400     D                     800     K
4,000     L                     500     Q
3,400     U                     400     J, X
3,000     C, M                200     Z

이것으로 비교적 적은 수의 일반적 단어를 사용한 영어 문서에서의 빈도를 알려주었다.(가장 흔한 영어단어는 무엇인가? 보기)  그러나 낱말게임 등에선 가끔씩 실제 빈번함과는 관계 없는 빈도를 보인다.  우리는 컨사이스 옥스포드 사전(제11 개정판, 2004)(Concise Oxford Dictionary (11th edition revised, 2004))의 단어 목록의 글자를 분석했고 내용은 다음 표와 같다.

E     11.1607%     56.88     M     3.0129%     15.36
A     8.4966%     43.31     H     3.0034%     15.31
R     7.5809%     38.64     G     2.4705%     12.59
I     7.5448%     38.45     B     2.0720%     10.56
O     7.1635%     36.51     F     1.8121%     9.24
T     6.9509%     35.43     Y     1.7779%     9.06
N     6.6544%     33.92     W     1.2899%     6.57
S     5.7351%     29.23     K     1.1016%     5.61
L     5.4893%     27.98     V     1.0074%     5.13
C     4.5388%     23.13     X     0.2902%     1.48
U     3.6308%     18.51     Z     0.2722%     1.39
D     3.3844%     17.25     J     0.1965%     1.00
P     3.1671%     16.14     Q     0.1962%     (1)

세번째 열은 가장 적은 글자(q)를 1로 했을 때의 비율을 나타낸다.  글자 E는 각각의 영어단어에서 Q보다 56배 더 빈번하게 나타난다.

단어를 시작하는 글자의 빈도는 또 다르다.  영어단어를 시작하는 글자는 's'가 다른 어떠한 글자보다도 많다.  (이것은 대부분 'sc', 'sh', 'sp', 그리고 'st'와 같은 조각들이 마치 한 글자처럼 행동하기 때문이다.) 글자 'e'는 단지 순서의 중간에 있고, 글자 'x'가 가장 마지막이라는 것은 놀랍지도 않다.


출처: http://www.askoxford.com/

'자료 #02: 목록, 표' 카테고리의 다른 글

포토샵 CS5 바로 가기 키 기본값  (0) 2011.05.16
한글 2010 단축키  (1) 2011.04.14
자음입력 + 한자버튼으로 나오는 특수문자  (7) 2008.07.09
삼각함수표  (0) 2008.05.10
RPG에 등장하는 몬스터 정리  (0) 2007.11.29
가장 흔한 영어단어는 무엇인가?  (0) 2007.10.28
XML의 글자 엔티티  (0) 2007.10.26
그림파일 확장자별 특징 정리  (0) 2007.10.17
경찰 계급, 역할  (0) 2007.10.01
군인 계급  (7) 2007.09.30

퍼가지 말고, 링크로 공유하세요. 자세한 건 공지에.

퍼가지 마세요...
링크로 공유하세요 ㅠㅠ
부탁할게요 ^_<~*

test 3-1

test 3-2

test 3-3

test 4-1

test 4-2

test 4-3

모든 글 보기
공지
방명록
Share to...

페이스북 공유

트위터 공유

구글+ 공유

카카오스토리 공유

밴드 공유

Follow & Contact

Facebook

Twitter

Mail

RSS 구독

2007-2016 © JinH