MySQL のマニュアルでよく使われる英単語

 どこかでちらっと見た気がするのだけど(たぶん誰かのtwitter発言から辿ったのでしょう)わからなくなってしまいました。「○○によく出る英単語」みたいな話題だったと思います。
 なんだか気になったので、MySQLマニュアルで見てみました。MySQLのマニュアルにはどんな単語が使われているのでしょうか。


 なお、集計には、本日取得した、http://dev.mysql.com/doc/MySQL 5.5 Reference Manual の HTML Page/chapter のファイルを利用しました。


 ではまず、ベスト10の発表です!!


1位   77719 the
2位   31404 to
3位   25317 a
4位   23197 and
5位   19769 of
6位   18883 is
7位   17178 for
8位   17038 in
9位   16360 mysql
10位  12031 you


  ・・・・・あまり嬉しくありませんね(^^;


 ということで、
 1000回以上出現しているものの中から、基本的すぎるもの(と私が思ったもの)を除外して残ったbest約60を一覧にしてみました。そういや複数形処理がちゃんとできてないなー。分裂しちゃっています。。。これは今後の課題ということで。

   5214 using                                1695 each
   3656 statement  (2351 statements)         
   3306 variable   (1667 variables)          1467 same
   3197 information                          1460 directory
   2866 default                              1409 some
   2777 description                          1405 syntax
   2468 also                                 1398 enterprise
   2388 following                            1397 such
   2335 example                              1337 list
   2306 command                              1336 so
   2275 function   (1575 functions)          1326 status
   2250 should                               1280 because
   2205 type                                 1272 changes    (1092 change)
   2185 only                                 1237 support
   2169 show                                 1213 transaction
   2089 any                                  1205 event
   2085 global                               1162 both
   2051 thread                               1137 different
   2043 syntax                               1124 within
   2040 null                                 1110 access
   1988 more                                 1095 check
   1936 result                               
   1928 may                                  1064 cache
   1853 key                                  1050 after
   1847 format                               1046 given
   1822 other                                1038 read
   1782 must                                 1014 specified
   1757 storage                              1013 performance
   1720 stored                               1001 need
                                             1001 memory

 こうやって見ると基本的な単語ばかりですね。MySQLのマニュアルが、いかに易しい表現を目指しているかが見えるような気がします。個人的には、300〜1000回出現している単語の中に、ぱっと意味が出てこないものが多くあり、このあたりが次の段階のキモになりそうです。


 最後にオマケとして、上のリストから削ったもののうち、「専門用語」系と判断したもののリストを貼っておきます。それぞれ、だいたいこんな出現数でした(ここでも、複数形処理ができていないのが悔やまれます)

   4327 system    9875 server   2057 client
   3180 database  5129 data     8754 table    4217 tables
   2720 column    1712 columns  1908 row      1968 rows
   4871 value     4022 values   5435 option   2796 options
   3780 file      1664 files    2399 binary
   2383 log       2523 character
   3001 create    1556 version  1098 installation
   2814 replication  2513 connection  2320 index
   2357 string       2313 number      1078 text  1425 date   1054 numeric
  16360 mysql        1411 mysqld      2123 sql   2923 query
   1474 master       2243 slave
   1366 return       1341 returns
   3545 select       1230 update      1541 insert
   1051 lock