 |
|
 語彙リストは、Bloomsbury版Harry PotterシリーズVol.1〜Vol.4をコンピュータ分析したものである。
| ※語彙リストはエクセル形式のファイルです。→語彙リスト(536KB) |
作成:長沼君主(清泉女子大学講師) ■表の見方
- Vol.1 Harry Potter and the Philosopher's Stone
- Vol.2 Harry Potter and the Chamber of Secrets
- Vol.3 Harry Potter and the Azkaban's Prisoner
- Vol.4 Harry Potter and the Goblet of Fire
- frq 頻度(それぞれの単語の出現回数)
- type 異なり語数 (何種類の単語が使われているかを示す。たとえばtheが3387回登場したとしても、同じ単語なので1語と数えて合計する)
- token 総語数 (それぞれの単語の頻度の合計を示す。たとえばtheが3387回登場したら、3387語と数えて合計する)
- 'sはhe is の短縮形he'sや、he hasの短縮形he'sなどの語尾を表し、'tはdon't やdoesn'tなどの否定を't を表す。'veや'reや'llも同様に短縮形の語尾を表す。
Vol.1からVol.4まで、総語数は約46万語。異なり語数は約9800語である。この表から主な登場人物を表す固有名詞の出現率が高いことがわかる。おもな登場人物の出現頻度は、だいたいどの巻でも総語数の5%くらいになっている。
また、Vol.1からVol.4まで、2回以下しか現れてこない単語は、9792語のうち5238語と半数以上ある。たとえば、語数の最も少ないVol.1では、2回しか現れてこない語が、3996語のうち2020語あり、逆に3回以上現れてくる語は1976語、10回以上は902語である。
[注] 分析途上にあるため、Version1とした(今後刊行予定のVol.7まで、詳細な分析データを作成予定)。 中学語彙約500(中学校学習指導要領平成3年版別表の必修語彙リスト)と高校1年生レベルで習う語彙約1000(平成12年度版の英語Iの教科書48社分のテキストをデータベース化して作成された既存の語彙リスト(杉浦リスト)をベースに、頻度上位の語彙から中学必修語彙や不規則変化形をのぞいたリスト)のカバー率を見てみよう。
中学校の語彙約500語の総語数のカバー率は、約62%から65%、高校1年生レベルまでの語彙のカバー率を合わせると約75%くらいになる。主要登場人物が約5%のカバー率になるので、主要登場人物がわかるという前提に立つと、「ハリー・ポッター」シリーズに出てくる語彙の80%は、高校1年生レベルの語彙で理解できるということになる。
実際には、2回以下しか出てこない語彙の比率も高いことや、主要登場人物以外の固有名詞のたぐいが多いこと、データのゴミもあることから、高校1年生レベルの語彙があれば、大ざっぱに見て、90%くらいの単語がわかる、見当がつくと思われる。
|
|
 |
|
 |