やること
どうも。平成35年まで有効の免許証を持っています。ネットで運転免許のいやらしい問題例を調べていたら「『~だろうから』は確定で×」というコメントが目に入りました。
たしかに、『~だろうから~した』なんて舐め腐った油断した文章が○になるとは思えません。
実際にそんな問題があるかは分かりませんが、登場する単語や表現によって確定で○、確定で×という試験対策ができるかもしれません。Exploratoryでテキスト解析してみましょう。
ちなみにネットで有名なクソ問として「雨の日は気をつけて運転しなければならない」→×「晴れていても気をつけて運転する必要があります」というのがあるのですが、満点を狙うテクニックを伝授します。教本を全部暗記して、問題に「~という記述が教本にある」を付けて判断すると良いです。分かっていても本番でこれに×を付ける勇気は出ないのですが。
データ解析ツール
ノーコードでサクサクとデータサイエンスができる「Exploratory」。ちょっとしたテキスト解析もできます。
使用した問題
実際の過去問は公開されていないようで、様々なサイトが独自の問題を出しているのみでした。今回はこちらのサイトがスクレイピングしやすそうだったので使用させていただきました(本免の問題のみ)。注意点として、今回の解析はあくまでこちらのサイトの問題の傾向をとらえたものですので、実際の試験問題とは傾向が異なる可能性があります。
もう一つ、単語分割の際の「一つの単語として扱う単語」のリストとして、こちらの専門用語集をスクレイピングして使用させていただきました。例えば「ハイドロプレーニング現象」なんかを登録しておかないと「ハイドロ」「プレー」「ニング」「現象」のように分割されてしまう可能性があります。
手順
問題文のスクレイピングの結果、危険予測問題を除く通常の○×問題が2480問取れました。
ここから重複を除いて、さらに「この標識は」といった図の問題を除くと614問まで減りました。
専門用語は482単語取れましたが、後に「急ハンドル」「高齢者」などを手動で10個ほど足しました。
解析の手順も省略しますが、単語分割の設定はこのような感じです。「一つの単語として扱う単語」に500個弱ぶっこんでいます。(細かい話ですがアナリティクスのテキスト分析の方ではcsvファイルを指定できるようです。通常のデータラングリングでは不可)
結果
まず、気になっていた『~だろうから』を含む問題はありませんでした。これは残念。
614問中20問以上に登場する頻出単語に限定して「答えが○である比率」を見てみました。頻出単語の多くは○の比率が0.3~0.7に収まっており、そう単純な試験対策はできない印象です。登場数がもっとも多い単語は「場合」でした。
○になりやすい単語と問題例です。登場数5以上に限定してあります。例えば「5m」が登場したら100%○という意味です。
×になりやすい単語と問題例です(登場数3以上に限定)。例えば「関係」が登場したら87.5%×というのは、「~とは関係がない」といった油断で使われるからと考えられます(もっと解析しろ)。
おわりに
ちょっと微妙でしたね。繰り返しになりますが、今回の解析はあくまで問題を引用したサイトの出題傾向をとらえたものです。「加入」が100%×だと言っても、「任意保険に加入の義務がある」「任意保険に加入の義務はない」といくらでもひっくり返りそうなので参考になりません。文節やもっと長い単位で解析する必要があると思います。
余談ですが私が教習所に通っていたとき、仮免前効果測定が満点なら1000円のクオカードがもらえるとかで気合を入れたのですが1問落としました。それが「二輪車で砂利道を走行するときはブレーキをかけたりせず一気に走り切る」といった感じの問題で、これは記憶にないぞと焦りつつも、「こんな慎重さを欠いた運転ぜったい×やろ」で不正解をこきました。1000円もらう気でいたのでNOOO!!!!!と声が出ましたね。世の中の厳しさを知りました。