MENU

日本酒の動詞クラスタリング

日本酒コーパスにおける上位100の動詞を示している。この表には、機能動詞(例:なる「be」、する「do」)の多くは含まれていない。


下図は、上位29語(出現頻度100以上)の階層型クラスタリング。


クラスタ01は、他のクラスタ(クラスタ02~05)とは独立しているように見える。
一般的な傾向として、クラスタ01とクラスタ02~05の動詞は、使用傾向が異なっているように見える。

クラスター01は、「作る」「醸す」「冷やす」「持つ」「楽しむ」などの動詞で構成されている。
これらの言葉は、体験の質を表現するという観点では、味や風味を表す表現ではないように思われる。

ここで動詞の役割を明確にするために、書籍における日本酒のレビューの典型的な例(文1)と、名詞との共起ネットワーク(図2)を見てみよう。


この図のクラスター01には、日本酒の一般的な味や風味を表す言葉が含まれている。
日本酒、味、香りなど、クラスター01の言葉は、日本酒のテイスティングコメントでよく使われる言葉です。
うま味、バランス、吟醸、純米(付録1参照)などの言葉は、味の質を表すものですが、これらの言葉は、日本酒の説明ではほぼあらゆる文脈で使用できる。

クラスタ02と03は、味と風味の領域を表すクラスタであると思われる。クラスタ04は、[空間]または[口の中の部位]タグの語句で構成されており、[時間]タグの語句(例:後味)も含まれている。

クラスタ01から04は、試飲コメントにおける感覚的な印象を説明する「味/風味」カテゴリーに大別できる。

一方、クラスター05と06は、テイスティングコメントの中で別の役割を果たしているようです(クラスター07は「その他の言葉」や「クラスター化されていない言葉」用です)。
クラスター05の言葉は主に日本酒の醸造に関するものです(山田錦は日本酒用の特別な米のブランド)。

また、クラスター06は、日本酒の分類(「大吟醸」)、飲用シーン(「冷やして」)、料理との組み合わせ(「食事」)に関する言葉が含まれています。

クラスター05と06は、「醸造」カテゴリーに分類することができます。

目次