ゆくゆくは有へと

おかゆ/彼ノ∅有生 の雑記

ZpDIC for ponjo jbopre

www.adventar.org

18日目です。

ZpDIC って知ってる?

ZpDIC は Ziphil さんが人工言語開発のための辞書ソフトということで作っている辞書ソフトです。

今まではローカルで使う人工言語の辞書としてはPDICが主流だったと思いますが、今年(だよね?)に ZpDIC が公開されて、今後の動向が気になるところです。

今までのロジバン辞書

ロジバンの単語は、 jbovlaste: A Lojban Dictionary Editing System を公式サイトとして登録・管理されていますが 見にくい

おそらく最近ウェブ上*1で一番まともにロジバン単語が検索できるのは la sutysisku です*2

la-lojban.github.io

ローカルでなら、おかゆの知ってる限りでは、guskantさんが作った stardict 形式の辞書データを使う方法がベストかな。

lo jbovlaste pe la stardikt

参考:lela.iúk.tánxe - オフラインでロジバン辞書を使う

stardict 形式に対応した辞書ソフトならロジバン辞書になるのが強みです
たとえば、iOS なら Dictionary Universal を使えます*3

ただこのstardict、Winしか使えない情弱なおかゆとしてはよく分からない対象で、guskantさんがstardict形式へのコンバータのスクリプトを公開してくれているものの、情弱*4的にはよく分からなくて与えられたものを使うだけのおかゆになっていました。

それから、(おそらく)基本的に stardict形式の辞書ソフトは read onlyで、たとえば「ロジ日辞書の悪いところをまとめてローカルで編集するぞ!」というようなときには使えません。

純粋なユーザーとしてロジバンを楽しむ分には辞書編集機能というのは必要ないと思いますが、ここで会ったが百年目、きっとあなたはロジバンを学ぶにつれモヤモヤし、アァ!と言い、.oisai と叫ぶことでしょう。

となると、編集機能のある PDIC でロジバン辞書データを作ればいいわけですが、なんか微妙に使いにくくてやる気がありませんでした*5

ZpDICでロジバン辞書をひこう!

そこで、知り合い(ということにしておいてください)でもある Ziphil さんが作った新しい辞書ソフト!*6が対応している形式でロジバン辞書データを作ろうと思いたちました。

ZpDIC は、これまた知り合いであるスライム氏などが考えた OTM-json 形式をメインにサポートしています:

OTM-JSON | 人工言語学 Wiki | Fandom powered by Wikia

とはいえ中身は json なので、これなら la .piton. しか使えないおかゆにも色々融通が効きます!というわけで、公式jbovlaste の吐き出してくれる xml ファイルを OTM-json 形式に変換したロジバン辞書データというのをおかゆは作りました。

github.com

"otm-json" フォルダに最近のxmlを変換した OTM-json 形式を入れてあります。これを使ってくだちい。

余談

余談ですが、"OTM-json" という名称は "OneToMany json" ということで、これ自体には「人工言語辞書用の形式だよ」ってことは意味されません。ので、おかゆ的にはもう少しそれを仄めかした名前のがいいんじゃないかなと思ったりします。

たまにおかゆは "dicson" とか読んでます。"dictionary" な "json" だから "dicson" です。「人工」感も盛りたいなら "condicson" とかになるかもしれませんが、この辞書形式それ自体は恐らく自然言語にも対応するはずなので、単に "dicson" でいいかなって思っています。

"OTM-json" より書きやすいし読みやすくないですか?

ZpDIC jbovlaste のここがすごいよ! i'ese'i

la sutysisku や stardict形式では、公式jbovlaste にはある "glossword" や "keyword" の欄は表示されません。些細ですが、その定義を登録した人の名前もこれらの辞書ツールでは省かれてしまっています。

おかゆは激怒した。必ず、かの邪智暴虐のjbovlasteの項目に忠実に対応しなければならぬと決意した。

というわけで、ZpDIC用にはこれらの項目を盛り込みました。Etymology も入れたかったんですが、残念ながら Etymology は xml ファイルにそもそもデータが載ってなくて諦めました…。ので、正確には、xml に載ってる情報はほぼすべて盛り込みました。

さらにさらに!ロジ日の辞書を引いたことがある人は分かると思いますが、たとえば {sirji} の Notes 欄:

「zu'a cmana .i ri'u xamsi .i fo le pa sirji pluta fa lo litru cu klama/左は山、右は海、その一筋道を旅人は行く」(山頭火『行乞記(二)』) ・大意: まっすぐ ・読み方: スィルジ ・関連語: korcu, linji, kruvi, kuspe

ロジ日の辞書の Notes はコンテンツが盛りだくさんです!具体的には

  • 大意
  • 読み方
  • 語呂合わせ
  • 関連語

の4つが Notes に入っています(関連語については他の辞書でもありますが、他の3つは日本語辞書独自だと思います)。

とはいえ、この4つ、本来は別に項目を持っておくべきもの。jbovlaste の形式は残念ながらこれらに対応していないため、Notes 欄にぶちこまれています*7

OTM-json版では、これら4項目は Notes から分離しています!

さらにいえば、「大意」は "glossword" に統合されています。

たとえば{klama}はこんな感じになります*8

f:id:waraby0ginger:20161216022221p:plain

というわけで、少なくとも jbo日辞書に関しては、la sutysisku よりも使いやすいものになってるんじゃないかと思っています。

まとめ

ZpDIC for lojban はいいぞ。

追記 2016/12/18 1:20

という声をいただき、そして確かにそうだと思ったので、"otm-json/test" に、glossword を translation のほうに移したデータを置いています。

*1:ネットに繋がなくても動くみたい

*2:数年前ならvlasiskuというのがありました(懐かしい…)

*3:有料(しかも割とする)ですけどね!Androidの方は分かりません。fau'u

*4:情弱と言ってればなんでも許されると思ってる節がありませんか?

*5:個人差があります

*6:おかゆは割とミーハーです

*7:「大意」については"glossword" があるのでそちらに移植すべきですが、ロジ日辞書翻訳の経緯上、Notes欄で今もなお息を潜めております。

*8:どうしてさっきは{sirji}を例に挙げたのに、ここでは{klama}を例に出したのか。聞かないでください。