2009年11月18日

ウィキペディアで不思議に思うこと:言語別記事数

 ウィキペディアを見れば、その言語を扱う人たちの属する学問分野が並列に記載され、興味深い。

 百科事典のように全体を監修する者がおらず、そのため各学問分野の特徴なり、体質というものが如実に表れているように思う。

 人名関係では、その人が何を行ったかの具体的内容よりも勲章の受章が書かれている。結局なんだったのかに答えていない。

 自然科学分野、特に、IT分野の記述は、正確、かつ、内容性に富んでいる。

 歴史分野においては、知識の羅列が目につく。歴史を横断的あるいは縦断的に見る姿勢に欠けている。

 興味深いのは、教育分野である。記載しているのは教育分野に携わる人だろうが、読む人の理解を考えていない。知識の羅列が目につく。ウィキペディアで「教育」という項目を調べると、あまりの陳腐さに悲しくなってしまう。たとえば「教育の主体と客体」の項では、肝心の教育の主体と客体については説明せず、どうでもよいことが書かれている。

 さて、今日の本題。
 ウィキペディアで以前から気になっていたことの一つが、言語別の記事数。ウィキペディアは、現在271言語で執筆されている。

 下のリストはウィキペディアによる2009年11月1日 8:00の集計結果である。

Wiki1.jpg


 これをよく見てみると、不思議なことに気づく。

 純記事数の多い順に、英語>ドイツ語>フランス語>ポーランド語>日本語>イタリア語>オランダ語>スペイン語>ポルトガル語>ロシア語 となっている。言語人口と全く異なったデータとなっている。

 純記事数トップが英語というのは、誰でも容易に理解できる。英語の使用人口が世界一だから当然の結果と思う。次のドイツ語、フランス語、これも何となく理解できる。母語人口の多さから見れば11位、10位だが、これまでの歴史の積み重ねがあり、当然、項目数も多くなるし、知識人も多い。
スペイン語は中南米諸国の母国語になっているし、ポルトガル語は大国ブラジルの母国語になっている。

Wiki2.jpg


単位は百万人
出典:ケンブリッジ大学出版局「THE CAMBRIDGE FACTFINDER」1993年刊
引用:http://japan.wipgroup.com/useful-information/reference-material-data/gengosiyoujinkou.html

 私が不思議に思うのは、(ホーランド語もそうだが、)7位にランクされているオランダ語。この説明が思いつかない。オランダ語を話す国は、オランダとベルギー、スリナムなど限られており、2300万人程度とされている。確かにオランダは、17世紀(当時はネーデルラント連邦共和国)、オランダ東インド会社を設立してアジアに進出、蘭領インド、インドネシアを占拠、アフリカや南米(スリナム)にも植民地を拡大した。しかし、これらの旧植民地でオランダ語が公用語として使われているのはスリナム(人口52万人)だけである。現在も海外領土として、カリブ海にオランダ領アンティルとアルバ島を持っているが、人口は限られている。

仮説をいろいろ立てることができる。
 政府による支援
 学術機関による支援
 辞書の焼き直し
 論文発表等発表の場としての利用
 ネット環境
 文字文化 書籍販売数
 大学の数
等さまざまな変数が考えられる。

 ポーランド語とオランダ語の純記事数が多いという、言語人口と全く異なったデータとなっている理由に、共通点はあるのだろうか。

 いろいろ考えてみたが、どうも万人が納得する仮説が見つからない。
考えられるのは、政府あるいは特定の機関が組織的に記事をアップしているということ。英語の記事を翻訳してアップしているのかも。日本の記事にも、英語の翻訳が見られる。

 下のデータも何かの参考になるかも。

Wiki3.jpg



posted by ネコ師 at 10:46 | Comment(2) | ジェネレータ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
記事に関係ないコメント、宣伝的なコメントは削除させていただきます。
高学歴層の高い失業率(ポーランド)、ワークシェアリング制による短い労働時間(オランダ)が、ウィキペディアへの参加を高めている原因ではないかと想像しています。

オランダ人は、英語ができる人が大変に多いそうなので、英語からの翻訳記事が容易に作られるということもあるでしょうか。
Posted by ke at 2010年11月20日 16:34
>keさんへ
 コメントありがとうございます。こんな記事を書いたのをすっかり忘れていました(笑)。

 コメントいただいた内容も大きな要因かと思います。

 私はWIKIで調べるとき、大抵、日本語、スペイン語、英語の3カ国語で調べます。そこで気づくのが、スペイン語と英語はほとんど同じということ。違うのは、「独自の文化」の部分や、得意とする分野の部分。植物関係や人物関係では、スペイン語でしか書かれていない項目もかなりあります。
 ポーランドとオランダは、共通事項は英語からの翻訳、それに付加する形で、独自の文化と競争力を持つ産業部門の記事数が多いのかもしれませんね。
 
Posted by ネコ師 at 2010年11月25日 09:33
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。

▲ このページのTOPに戻る