2013年06月16日

筑波ウェブコーパスと現代日本語書き言葉均衡コーパス


a0960_000194.jpg



筑波ウェブコーパスは日本語のウェブサイトから収集して構築された約11億語のコーパスであり、

現代日本語書き言葉均衡コーパスは国立国語研究所によって構築された1億語のコーパスです。

次の画面は「滑らかな」という語を入力して得られたある検索結果を示しています。(それぞれクリックすると拡大します。)


キャプチャ.JPG



キャプチャ2.JPG



ともに日本語版 COCA と言えるような仕様になっているのが見て取れます。

石崎は井上ひさし氏に影響を受け、執筆時、または翻訳の際、

これまでは、国立国語研究所『分類語彙表』(秀英出版、1993年)を愛用し、

最近では山口翼 編『日本語大シソーラス』(大修館書店、2003年)のCD-ROM版を折にふれ活用してきましたが、

これら2つの巨大コーパスも選択肢に入って久しい次第です。


posted by 石崎 陽一 at 14:28 | Comment(0) | 愛用の(学習用)サイト | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
ページトップへ戻る