日本語の文章を頑張って読もうと思うと、いろいろな問題が出てきますよね。
難しい言葉がたくさん出てきたり、どれが大切な言葉なのか分からなかったり、大切な言葉のはずなのに漢字が読めなかったり・・・。
今回はそんな問題を少しでも解決するために、自分の好きな日本語の文章の中から大切な言葉を探して、語彙リストを作る方法を紹介します。
言選Web (http://gensen.dl.itc.u-tokyo.ac.jp/gensenweb.html)
このサイトは、「専門用語(キーワード)自動抽出サービス」と書かれているように日本語で書かれたWebページやテキスト、PDF(OCR処理済み)などから重要度の高い言葉を自動的に選んでくれます。
URLからうまく抽出できない場合は、テキストやPDFでやってみてください。
例えば、日本語の論文を入れて「専門用語(キーワード)抽出」を押すと・・・
このように文章の中で重要度が高い言葉が上から順に並びます。
そして、このページで「ファイル」→「名前を付けて保存」を選んで、ファイルの形式を「テキストファイル(.txt)」にして保存します。
今度はExcelで「データ」→「テキストファイル」を押して、保存したファイルを選びます。
「次へ」→「完了」→「OK」の順に押すと、大切な言葉のリストになります。
次はこのリストの漢字の読み方を表示させます。
まず、B1のセルに「=PHONETIC(A1)」と書きます。そして、B1のセルの右下を下まで引っ張ると、A1と同じ言葉がB1にも並びます。
残念ながら「=PHONETIC(**)」という関数が使えるのは
日本語版のExcelだけかもしれません。
ここで、「Alt+F11」を押すと下のような画面が出てきます。
一番下の「イミディエイト」の欄に「Range(“A1:A1000”).SetPhonetic」と入力しEnterを押してから、この画面を閉じると、B1の列がカタカナに変わっています。イミディエイトウィンドウが見えていない場合には、表示>イミディエイトウィンドウで出せます。
「A1:A1000」は行の範囲を示しているので、リストの長さに合わせて
変えてください。
Aの列を選択してからふりがなの設定を「ひらがな」に変えると、Bの列が全部ひらがなに変わります。
A列のキーワードをコピーしてGoogle翻訳に入れることで、母語を入れた語彙リストをすぐに作ることもできます。
いろいろな文章から日本語の言葉を集めて、知っている言葉やいらない言葉を整理して、自分自身が使いやすい言葉のリストを作ってみてください。
【使用した論文】
田中哲哉 他(2011)「インターネットを利用した日本語学習支援を広げるために-日本語学習ポータル「NIHONGO eな」の開発-」『日本語教育紀要』7号, pp.163-169, 国際交流基金
画像をクリックすると、画像がより鮮明になるよ