クロスワード豚辞書

概要

KGECさんの「クロスワードにおいでなさい」の掲示板を見ていて、「あ〜、豚辞書のデータ量でクロスワード辞典をつくったらどうなるんだろう」と思って作ってみたら、実用性を抜きにして非常に面白かったのです。一度見てみる価値はあると思うのでここに公開する次第。

原典など

単語ソースはぶたさんによる豚辞書(ver.014)をそのまままるごと利用させてもらっております。データ形式を変更した上での再配布です。データの利用に関する条件は豚辞書(ver.014)に従ってください。私としては、このデータの公開によってぶたさんのお手をわずらわせることのないよう祈っております。

表示/ダウンロード

クロスワード豚辞書(ver.014)(converted 02.07.31)

全てPDF形式です。表示にはACROBAT READERが必要です。

環境によってはクリックするとブラウザ内で表示を始めようとするので注意。とても重いです。

仕様

ACCESSでさくっと作ってしまったものなので、配列は完璧ではありません。以下の致命的な問題があります。正直なところ、眺めて楽しむ以外の用途にはむきません。

連続する母音と、母音+音引きを区別しません。「あー」と「ああ」は等価です。

「○文字目」に該当しない文字の濁音半濁音は区別しません。「は」「ば」「ぱ」は等価です。

念のためクロスワード辞典とは

編集ニコリ、発売波書房による紙売りの辞書。現在手に入れるのは難しいか。ひたすら名詞がカタカナでならんでいるだけという恐ろしい本。開くと笑いがこみあげてくる。この感覚の一部はここで公開しているPDFでも味わえると思います。

2文字単語から11文字単語まで文字数順にならんでいる。「○文字目が○である単語」という配列であるため、たとえば5文字の言葉は5回登場する。

クロスワードの文字組をするためであるから、当然「は」「ば」「ぱ」は別の扱い。この形式に慣れてしまうと、国語辞典が平然と同一視するほうが不自然に思える。「がっこう」を引くのに「かっこう」と頭で変換しなければいけない。

どうでもよい作成手順

豚辞書をACCESSに取り込んで、クエリで加工する。下記のように一つの単語は文字数と同じ回数登場します。


あとりえ,1,あ
あとりえ,2,と
あとりえ,3,り
あとりえ,4,え

各文字数別クエリを作成し、これをソースにレポートをつくります。これも公開しても良かったのだけれど、豚辞書データにインデックスをたくさん張った状態では50Mバイトを超えてしまうので。レポートだけ配布するのもどうかと思うし。


戻る
By けすてぃおん(wakaba@a1.mbn.or.jp)