ライティングラボ by Shodo

執筆・ライティングについてのノウハウを共有するブログです。 ブログや本の執筆、コンテンツマーケティングにお役立てください!

感覚を使わずルールで日本語の動詞の活用形(グループ)を判断する方法

活用を考える際、日本人は感覚に頼って判断できますが、コンピューターやプログラムにはできません。

皆さんも「動詞の活用を判断するときに、『〜ない』を付けて考えなさい」と中学生のときに習ったと思います。
たとえば「見る」であれば「見ない」となりますので、「見」が「見る」の未然形と分かります。「見」の母音は「イ」なので、上一段活用であると分かるわけです。

ですがこれは感覚に頼った判断方法です。

あなたは今、なぜ「見ない」と未然形への活用ができたのでしょう?

「知る」は「知らない」となるのに、「見る」は「見らない」とならないのでしょうか。
「着る」は「着ない」となるのに、なぜ「切る」は「切ない」と言わず「切らない」となるのでしょう。

日本人的には「切らない」と感覚で分かりますが、コンピューターには難しい問題です。

なぜこの判断が必要なのか

日本語のネイティブ話者は無意識にできますが、プログラムや外国語として勉強する人には判断できません。

とくに私たちが運営するShodo(https://shodo.ink/)では日本語を解析し、プログラムにより校正するため活用の判断も重要になります
たとえば「ら抜き言葉」を判断するときに、動詞の活用形を知る必要があります。

感覚を使わない活用形(グループ)の判断方法

動詞の活用が口語における「五段活用」、「上一段活用」、「下一段活用」、「カ行変格活用」、「サ行変格活用」のどれかを機械的に判断します。今回は漢字を使っていて、終止形の動詞を対象とします。

大抵の場合、ルール自体は簡単で「漢字+『る』は五段活用」のように判断できます。ですが「見る」のような例外が存在するので、先に処理する必要があります。

例外リストでまず処理する

まずは例外リストで、無思考に活用形を決定します。

一覧はこちら。

  • カ行変格活用:
    • 来る
  • 上一段活用:
    • 射る、鋳る、居る、癒る
    • 着る
    • 退治る
    • 煮る、相似る
    • 嚔る、乾る、干る、簸る
    • 黴る、下卑る
    • 廻る(みる)、惟る、見る、診る、鑑る
    • 沃る
    • 将る、率る
  • 下一段活用:
    • 得る
    • 惚気る、湿気る、道化る
    • 悄気る、魂消る、変化る
    • 出る
    • 寝る、真似る
    • 経る、綜る
    • 洒落る
  • 五段活用:
    • どじる、けちる、ちびる、せびる、とちる
    • びびる、いびる、しくじる、せせる
    • うねる、そべる、せる
    • つんのめる

五段活用以外はそれなりに網羅できていると思います。もし使用頻度の高いものでリストに入っていない動詞があれば教えてください。

ここで「垣間見る」のような複合した動詞は一覧にありません。後ろに付いた動詞の活用を取ります(この場合は「見る」と同じく上一段活用)。

ルールで活用を判断する

例外は以上です。
例外リストで処理した後は、ルールで対応できます

  • ひらがなのイ段+「る」の場合は上一段活用
  • ひながなのエ段+「る」の場合は下一段活用
  • それ以外は五段活用
    • 漢字1文字+「る」の動詞
    • イ段・エ段でない平仮名+る(「交わる」など)
    • それ以外の平仮名(「引く」など)

例外さえ先に処理してしまえば、あとのルールは漢字でない平仮名を見ると判断できます。

ややこしいのは上一段活用、下一段活用の漢字のみ+「る」のパターンです。
これらは漢字の中に活用の言葉が組み込まれてしまっているので、平仮名のように機械的な判断ができなくなります(「知る」、「見る」、「着る」、「切る」問題)。

また、平仮名の言葉で「とちる」のような五段活用もややこしいところです。「いさちる」のように平仮名だけで上一・下一段活用になる動詞もありますので、単純には判断できません(「じゃみる」、「いじける」などは上一・下一段活用です)。この平仮名+イ段・エ段+「る」の五段活用には比較的新しい言葉が多いようですので、あまり厳密に捉えなくても良いかもしれません。

まとめ

まとめると、基本的にはルールで処理できるけど例外が数十個あるというところです。上一段活用・下一段活用のほうが量は少ないので、例外リストで判断するには向いています(五段活用の動詞は非常に多い)。

日本語の自然言語処理、校正や形態素解析をしている人や、日本語学習者の方の参考になれば嬉しいです。

参考文献

執筆:Kiyohara Hiroki (@hirokiky)
Shodoで執筆されました