ダジャレ全部言う(1) 500ダジャレ/秒

ダジャレをやめる

あらかじめすべてのダジャレを言ってしまえば言うものがなくなるので、ダジャレをやめられると思う。

人間の力では大変なので、機械的にやる。

辞書

いきなりダジャレ全部言うのはなかなか難しいので、とりあえずステップ(1)として、単語レベルでまったく同じ音の、同音異義語ダジャレを全部言う。

まずは、オープンに公開されている辞書をダウンロードしてくる。 国立国語研究所が作った語種辞書『かたりぐさ』という辞書データがあって、

語種辞書『かたりぐさ』 - 言語データベースとソフトウェア

91320個の単語が登録されているらしい。一般的な大人が知ってる語彙が50000とか聞いたことがある気がするので、たぶん十分だと思う。

たとえばこの辞書で「帰る」という単語を調べると

帰る カエル 動詞-自立 五段・ラ行 和

と教えてくれる。左から「単語」「読み」「品詞」「活用」「和語・漢語・外国語・混成語の区分」の順。

語の区分違いダジャレ

外国語と和語で「カラメル」と「絡める」のように、「和語・漢語・外国語・混成語のどれか」の区分が違えば違う語源だろうし、音が同じで区分が違えばだいたいダジャレになると思う。二文字かぶり程度でダジャレとか言ってたら生活できないので、三文字以上の単語に限定して調べる。

同区分別品詞ダジャレ

上の四つの区分では同じグループに属していてもダジャレになる事例はあるはずで、たとえばこの辞書で「和語」でありかつ読みが「カエル」の単語を検索してみると、

かえる カエル 動詞-自立 一段 和
かえる カエル 動詞-自立 五段・ラ行 和
カエる カエル 動詞-自立 五段・ラ行 和
カエル カエル 名詞-一般 NaN 和
換える カエル 動詞-自立 一段 和
還る カエル 動詞-自立 五段・ラ行 和
帰る カエル 動詞-自立 五段・ラ行 和
飼える カエル 動詞-自立 一段 和
替える カエル 動詞-自立 一段 和
代える カエル 動詞-自立 一段 和
買える カエル 動詞-自立 一段 和
変える カエル 動詞-自立 一段 和
返る カエル 動詞-自立 五段・ラ行 和
孵る カエル 動詞-自立 五段・ラ行 和

というように候補がいっぱい出てくる。
同じ品詞の言葉だと似た意味が多かったり組み合わせが難しかったりしてあんまりダジャレという感じがしない。
そこで、同じ区分の同じ品詞からは代表をひとつ選んでくることにする。
この例だと、たとえば

カエル カエル 名詞-一般 NaN 和
帰る カエル 動詞-自立 五段・ラ行 和

だけを引っ張ってきて、ダジャレと思うことにする。

ダジャレ発見フローチャート

① 同じ読みの単語を抽出
② 語の区分(和・漢・外・混)をチェック

  • 語の区分が違う→ダジャレ

  • 語の区分が同じ→③へ

③ 語の品詞をチェック

  • 品詞が違う→ダジャレ

  • 品詞が同じ→非ダジャレ

これでだいたいいいと思う。

実装

pythonのpandasのデータフレームで適当にやった。重複の検出はduplicateを使った。

出力結果の統計

まず区分が違う同音異義語の数。これらのペアはほとんど全部ダジャレにできそうなものだった。

語1の区分 語2の区分 区分の異なる単語ペア数
漢語 和語 158
漢語 外国語 75
漢語 混成語 107
和語 外国語 36
和語 混成語 36
外国語 混成語 9
421

次は同区分内で別品詞の同音異義語の数。

語の区分 品詞の異なる単語ペア数
漢語 149
和語 302
外国語 5
混成語 19
475

ところが、こちらでは

一番 イチバン 副詞-一般 NaN 漢
一番 イチバン 名詞-副詞可能 NaN 漢

のような「同じ意味で別品詞のペア」がほとんどで、上で出した「カエル」のような例はあまりないようだった。漢語・外国語・混成語ではダジャレっぽいものが皆無だったので、後につづく実例には載せていない。

二種類の合計でたぶん500ダジャレくらいはできたと思う。別の同音異義語とのペア入れたら2〜3000くらいかな? 出力には1秒かからなかった。

出力結果

外国語との組がわかりやすくていいと思う。

漢語・和語

フタツ, イカン, イコウ, イタイ, イタク, イトウ, ウツウツ, オンバ, カイイ, カクカク, カコウ, カタイ, カヨウ, カンカン, ガクガク, キソウ, キノウ, キュウキュウ, キョウ, キライ, コスイ, コブシ, サカン, サクイ, サソウ, サッキ, サバク, シカク, シゲイ, シゴク, ショウ, シント, シンボウ, ジマイ, セマイ, ソウコウ, ソウロウ, ソクバク, ソット, ソロウ, タカイ, ダクダク, チカイ, チカク, チョウト, チンチン, テイタイ, デント, トウサン, トクトク, トコウ, トドク, ドウカ, ドッカ, ドント, ナンカ, ナント, ニオウ, ネツイ, ハイル, バンバン, ヒッカク, ヒロウ, フウン, フカイ, フクム, ブンブン, ボウボウ, ボツボツ, マイコ, マドウ, ムサイ, ヤサイ, ヤトウ, ユエン, ヨウシ, ヨウヤク, ヨウヨウ, ヨクヨク, ヨソウ, ヨダツ, ワカイ, ワヤク, イチゴ, ウトウ, ウンカ, カイコ, カレイ, カンバ, ガリガリ, キュウリ, キンキン, ゴカイ, サクサク, シャケ, ズキン, セイゴ, ゾクゾク, ダイダイ, チシャ, ドカン, ドジョウ, ニシン, ヒガイ, フッコ, ホッケ, ミョウガ, ズイキ, カクシ, ウカイ, イエイ, カワラ, カッパ, ヒダイ, イアイ, イシキ, ショウト, ムカイ, ユウキ, シュウト, ムコウ, ミツギ, コウバイ, コウジ, コシキ, ミツゴ, コクソ, シマイ, コウシ, コガイ, イチマツ, カイバ, ナンジ, ハヤク, ホガイ, デキアイ, コウリ, コウタイ, ブカイ, マッコウ, イキガイ, オウギ, フクロ, シナイ, ソウズ, トウジ, ドウサ, ゴトク, アイロ, ケイロ, コマイ, メイロ, ヨウチ, ヤライ, ユウヒ, ハッパ, イオウ, ホウキ

漢語・外国語

アンド, トタン, フラン, アイゼン, アンカ, アンダ, アンチ, アンプ, インカ, インチ, インキ, エイト, エンジン, ボタン, カバン, カップ, カッパ, カンパ, ゴング, クロウ, コイン, コウチン, コック, サタン, ザイン, サイド, サッシ, サンチ, サンバ, シアン, シック, シャイ, ジャッキ, ショウ, シンパ, シンク, シンポ, センチ, センス, セント, ソウダ, タイト, タイヤ, ダイス, ダッシュ, タンゴ, タンニン, タンク, チンキ, テンポ, トライ, ハイク, バイバイ, ホック, バッケン, ヒップ, ベット, マシン, マンガン, バンプ, マント, ミンチ, メイド, メイク, メンバ, ヨウド, リネン, リッチ, リンチ, リンカ, レンチ, ロップ, ワゴン, テント, レンジ

漢語・混成語

エイゴ, イイキ, カイショウ, カクイ, キオウ, キサク, クドク, サヨウ, ショウガ, シヨウ, シンコ, センナイ, タンボ, トキン, イガイ, カンパン, キンコ, サヘン, ジュンコ, ハチク, ハラン, ミショウ, ランスウ, アンジ, エンタク, ヤゴウ, ナントウ, ナンヤク, エイリ, カイヘン, カンス, カンジ, キュウバ, キョウマイ, キョウギ, ゲイコ, オンコウ, オンシャ, オショク, オンタイ, オンチ, オンテン, アイイン, アイエン, アイショウ, コウヤ, サッシ, サンピン, サンギ, コブン, カヨウ, ハイシャ, シチヤ, テッコウ, コショウ, コテイ, コモン, ジョウアイ, シンギ, シンメ, シンミ, ニオウモン, ショウアイ, ショウミ, キッスイ, キップ, ゼンバ, アイセキ, ソッコウ, ソクイ, タイロ, ダイギ, ダイス, ハヤク, ダンチ, ジアイ, ジツボ, ムシケン, チョウバ, チョウアイ, ツウジ, トウガ, トウヤ, ドウユウ, ドウギ, カイキ, カイドク, ハイチョウ, ホチュウ, ホウソ, ホンバ, メンボウ, キブツ, キヘン, メイシャ, ユウカン, ユウケイ, ユウコク, ユウショク, ユウハン, ヨウス, ヨウビ, ヨウマ, オチド, ランマ, リョウサン, ロウヤ

和語・外国語

ピーピー, イクラ, オイル, カタル, カット, カラット, カラム, カラメル, キセル, キチン, キット, クラス, クワス, コレラ, シャベル, ショウ, ジャー, タオル, タスク, テラス, ドット, ニット, バラス, バレル, パット, ピント, フラット, ホット, ホテル, ポット, マイル, メイル, メモリ, ヨーク, カッパ, チャウ

和語・混成語

カスル, コスル, トックリ, マキエ, ユスル, シラス, オシエ, カクス, ヒガシ, マダイ, キドリ, キサキ, キグミ, キツケ, キオイ, ケガキ, カタギ, コグチ, コダテ, ツナグ, カヨウ, ミズエ, アトシキ, ハヤク, チノリ, ソエジ, ドモリ, ハタチ, ヒイロ, フタメ, フジミ, フイリ, ミセル, キチン, ユドオシ, ヨクスル

外国語・混成語

ダブル, ハッスル, リント, アイス, キッス, サッシ, ダイス, メンス, キチン

ここから先は品詞違いのやつ。漢語と混成語は副詞や連体詞と名詞との一致、外国語はたぶん名詞かつ接頭辞みたいなのしか拾っていなかった。割合は低いが「カエル」「カラス」「イカン」「カシラ」「ムシロ」など、ちゃんと意味が違う品詞をイメージできる言葉があるのが見える。

和語

アタフタ, アナガチ, アマタ, アマリ, アリノママ, アレレ, アンナニ, アンマリ, イカガ, イカサマ, イカン, イズレ, イマドキ, イライラ, イロイロ, ウカウカ, ウッカリ, ウロウロ, ウンザリ, ウント, オナジ, オナジク, オノオノ, オヨソ, オヨソ, オヨビ, オンナジ, オヨビ, オハヨウ, オツカレサマ, カカル, カサカサ, カシラ, カチカチ, カチン, カラカラ, カラッキシ, ガサガサ, ガタガタ, ガックリ, ガラガラ, キタル, キョロキョロ, ギクシャク, ギュウギュウ, ギリギリ, クヨクヨ, クライ, クリクリ, グジャグジャ, グチャグチャ, グニャグニャ, グリグリ, グルリ, ケレド, ケレドモ, ココラ, コザッパリ, コックリ, コノホド, コンナ, コンナニ, ゴタゴタ, サラニ, シカシナガラ, シタタカ, シックリ, シットリ, シバラク, ショボショボ, ションボリ, シンミリ, ジャア, ジャア, ジャァ, スカスカ, スッキリ, スナワチ, ソウデスネ, ソコソコ, ソコラ, ソックリ, ソノウエ, ソノウチ, ソノタメ, ソノママ, ソモソモ, ソモソモ, ソレダケニ, ソレナリ, ソンナ, ゾッコン, タカダカ, タカダカ, タシカ, タダイマ, タッテ, タップリ, ダッテ, ダブダブ, チョット, ツイデ, ツイデ, ツトメテ, ツマリ, ツマリ, テカテカ, テラテラ, テンヤワンヤ, トコトン, トコロドコロ, トモスレバ, トモドモ, トモニ, トリワケ, トントン, ドウゾ, ドウモ, ドコロカ, ドッカ, ドンナ, ナアニ, ナカナカ, ナカンズク, ナンカ, ナンテ, ナント, ナンノソノ, ナンボ, ノビノビ, ノンビリ, ハルカ, バラバラ, ヒトタビ, ヒトマズ, ヒトリ, ヒョット, ビショビショ, ピッタリ, フックラ, フニャフニャ, ブツクサ, ブツブツ, ブヨブヨ, プカプカ, ヘナヘナ, ペコペコ, ホット, ホレボレ, ボロボロ, ボンヤリ, ポツポツ, ポロポロ, マゴマゴ, マシテヤ, マッスグ, ママナラナイ, マルマル, マルマル, ミズカラ, ムシロ, モシカ, モジャモジャ, モットモ, モットモ, モノノ, モヤモヤ, ヤットコ, ユクユク, ヨッポド, ヨワイ, ワンワン, アオイ, イカル, イキイキ, イトド, イヤー, カエル, カラス, ガクガク, ガバガバ, ギシギシ, ギスギス, クシャクシャ, ゴロゴロ, シノブ, ジワジワ, スイスイ, スガル, スレスレ, ズタズタ, タラフク, ドカン, ドキドキ, ニコニコ, ノビル, フトイ, ヨロシク, クライ, ヒトシオ, ヒトツカミ, ヒトアジ, ヒトメ, トオク, クダリ, ナントカ, ナニモカモ, ナニヨリ, ナンラ, ナニサマ, イエイエ, オオムネ, ワリアイ, イワバ, イクバク, イクラ, イクタ, イソギ, サカイ, ワズカ, チカイ, チカク, チカゴロ, クリカエシ, イヤイヤ, モトモト, ムコウ, サイワイ, ヒロビロ, イマゴロ, イマサラ, イマヒトツ, ネコソギ, イササカ, コヤス, オモイ, オモイキリ, オモイナシ, サシテ, ニヨリ, モチキリ, トキドキ, トキオリ, ツギツギ, ツギニ, ニツケ, トリアエズ, テアライ, ノロイ, ムネト, ケダシ, オモニ, ウマイ, スコシ, ノボリ, ツネヅネ, イロコイ, フルイ, イキオイ, アイニク, アオアオ, オリオリ, サキホド, アライ, アライザライ, アラカタ, ハヤク, アイカワラズ, オオク, オオカタ, オオヨソ, ナカス, ナガイ, オッテ, オッテ, ホドホド, ドロドロ, ツレヅレ, ヒゴロ, イレカワリタチカワリ, ゴトシ, イカホド, トシゴロ, スナワチ, シラス, オオイ, トビキリ, ウキウキ, ナミナミ, カタヤ, ホトンド, オヨソ, ソゾロ, マダキ, ポックリ, マノアタリ, ヨドオシ, タチマチ, サスガ, ヒヤヒヤ, タトエ, ホシイ

ダジャレがだいぶ嫌いになれてよかった。