両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン |
freewnn [2023/10/20 10:17] – skk | freewnn [2023/11/01 01:59] (現在) – skk |
---|
= [[FreeWnn]] LM: [2023-10-20 10:17:18] | = [[FreeWnn]] LM: [2023-11-01 01:58:45] |
| ~~NOCACHE~~ |
| |
====== - 概要 [2023-10-05] ====== | ====== - 概要 [2023-10-05] ====== |
論文など,長い文章を書く際,egg/FreeWnn のペアで書いていたため,ゆっくりと文章を考えたい場合,どうしてもこのセットを使いたくなる.今はもうほとんど使ってる人いないだろうな… | 論文など,長い文章を書く際,egg/FreeWnn のペアで書いていたため,ゆっくりと文章を考えたい場合,どうしてもこのセットを使いたくなる.今はもうほとんど使ってる人いないだろうな… |
| |
現在,インターネット上の FreeWnn に関する情報はかなり消え去りつつあり,よしだともこさんが残してくれている,http://www.tomo.gr.jp/FreeWnn/ こちらにかなりの情報が残っている状態. | 現在,インターネット上の FreeWnn に関する情報はかなり消え去りつつあり,よしだともこさんが残してくれている,http://www.tomo.gr.jp/FreeWnn/ こちらかなりの情報が残っている状態.むしろ,ソースコード内の mannual ディレクトリ内の情報がとても充実しているので,参考にするべきと思われる. |
| |
====== - 構造メモ [2023-10-16] ====== | ====== - 構造メモ [2023-10-16] ====== |
</code> | </code> |
| |
これは,GNU grep の仕様が昔と比べて変わったという話なので,'/usr/local/bin/ggrep -E' などに書き換えればいいのかもしれない.FreeBSD でも同じエラーが出たが,僕が GNU grep を ports で入れていたからなので,'pubdicplus/Makefile' の該当部分を '/usr/bin/grep' に書き換えたら,すんなりコンパイルが通った.多分,Linux でも ggrep に書き換えれば通るのではないだろうか(試してない).([2023-10-18]) | これは,GNU grep の仕様が昔と比べて変わったという話なので,'/usr/local/bin/ggrep -E' などに書き換えればいいのかもしれない.FreeBSD でも同じエラーが出たが,僕が GNU grep を ports で入れていたからなので,'pubdicplus/Makefile' の該当部分を '/usr/bin/egrep' に書き換えたら,すんなりコンパイルが通った.多分,Linux でも ggrep に書き換えれば通るのではないだろうか(試してない).([2023-10-18]) |
| |
その際,atod/dtoa は hinsi.data ファイルを利用するようなので,ソース内の ''Wnn/jd/hinsi.data'' を利用すればよい.atod/dtoa を良く利用するならば,''LIBDIR'' で指定されている ''/usr/local/lib/wnn/ja_JP/'' 以下に hinsi.data をコピーまたはシンボリックリンクなどで読み込めるようにしておくと,コマンドを使うたびに hinsi.data を指定しなくて良くなる. | その際,atod/dtoa は hinsi.data ファイルを利用するようなので,ソース内の ''Wnn/jd/hinsi.data'' を利用すればよい.atod/dtoa を良く利用するならば,''LIBDIR'' で指定されている ''/usr/local/lib/wnn/ja_JP/'' 以下に hinsi.data をコピーまたはシンボリックリンクなどで読み込めるようにしておくと,コマンドを使うたびに hinsi.data を指定しなくて良くなる. |
-r/-R を less につけることで,色だったり強調表示が ESC のような化けた感じになるのを抑制できる.[[https://yanor.net/wiki/?UNIX/less%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89%E3%81%A7ls%E3%82%84man%E3%82%92%E8%89%B2%E4%BB%98%E3%81%8D%E8%A1%A8%E7%A4%BA%E3%81%99%E3%82%8B|参考]]. | -r/-R を less につけることで,色だったり強調表示が ESC のような化けた感じになるのを抑制できる.[[https://yanor.net/wiki/?UNIX/less%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89%E3%81%A7ls%E3%82%84man%E3%82%92%E8%89%B2%E4%BB%98%E3%81%8D%E8%A1%A8%E7%A4%BA%E3%81%99%E3%82%8B|参考]]. |
| |
====== - 辞書 [2021-05-29] ====== | ====== - 辞書 [2023-11-01] [2021-05-29] ====== |
| |
FreeWnn のデフォルトの辞書は,いまどきの Google IME/Mozc や MS-IME のような豊富な辞書は入っていない.数万語程度. | ソースコード内の Wnn/manual/intro の辞書の部分を見ると,FreeWnn の辞書は,登録可能形式と,固定形式,の二つに大きく分かれてるようである.登録可能形式は,最初に Wnn を利用する際に作成される ud のように,M-x egg-toroku-region などで単語を追加していける辞書のこと.固定形式は,辞書自体は変更できず,頻度情報を各ユーザ毎に保存しておく形式のこと. |
| |
| FreeWnn をインストールすると,pubdic(場所は以下の節参照)などに kihon.dic,computer.dic などの辞書が一緒にインストールされる.(デフォルトで有効になってない辞書も含まれているが)以下がインストールされる辞書群で,全部足して 47724 語程度(数十文字程度誤差あり)である. |
| |
| <code bash> |
| % for HOGE in bio.dic chimei.dic computer.dic g-jinmei.dic jinmei.dic kihon.dic koyuu.dic setsuji.dic special.dic supplement.dic tankan.dic tankan2.dic tankan3.dic |
| for> do |
| for> wc -l $HOGE |
| for> done |
| 514 bio.dic |
| 895 chimei.dic |
| 698 computer.dic |
| 1561 g-jinmei.dic |
| 619 jinmei.dic |
| 17892 kihon.dic |
| 21 koyuu.dic |
| 208 setsuji.dic |
| 19 special.dic |
| 19321 supplement.dic |
| 1250 tankan.dic |
| 1388 tankan2.dic |
| 3338 tankan3.dic |
| </code> |
| |
===== - FreeWnn のユーザ辞書 ===== | ===== - FreeWnn のユーザ辞書 ===== |
| |
インストール先: | インストール先: |
* 辞書データ | * 標準辞書データ |
* FreeBSD: /usr/local/lib/wnn/ja_JP/dic/pubdic | * FreeBSD: /usr/local/lib/wnn/ja_JP/dic/pubdic |
* Ubuntu Linux: /usr/share/wnn/ja_JP/dic -> 実態は /var/lib/wnn 以下. | * Ubuntu Linux: /usr/share/wnn/ja_JP/dic -> 実態は /var/lib/wnn 以下. |
* FreeBSD: /usr/local/bin/Wnn4/ | * FreeBSD: /usr/local/bin/Wnn4/ |
* Ubuntu: atod/dtoa などはパッケージではインストールされない.ソースからコンパイルすれば良い. | * Ubuntu: atod/dtoa などはパッケージではインストールされない.ソースからコンパイルすれば良い. |
| * ユーザ辞書 |
| * FreeBSD: /usr/local/lib/wnn/ja_JP/dic/usr/<user>/ud |
| * Ubuntu Linux: /usr/share/wnn/ja_JP/dic/usr/<user>/ud |
| |
| |
辞書変換ツール: | 辞書変換ツール: |
</code> | </code> |
| |
| [2023-11-01] ''\comment'' は,''M-x egg-toroku-region'' の際に選択する辞書に表示される情報として利用されている. |
| |
参考: | 参考: |
* [2023-10-06] [[https://docs.oracle.com/cd/E19455-01/806-2800/6jc09qd0b/index.html|Wnn6の辞書の説明]] | * [2023-10-06] [[https://docs.oracle.com/cd/E19455-01/806-2800/6jc09qd0b/index.html|Wnn6の辞書の説明]] |
| |
| ===== - 固定辞書 の扱い [2023-11-01] ===== |
| |
| ユーザ辞書は,dtoa/atod などのツールを用いて,バイナリ辞書形式とテキスト形式を相互変換できるので,別のホストにそこまで苦労せずに移行できるが,固定辞書の頻度情報をテキストに変換する方法は,[2023-11-01] 現在,見つかっていない.唯一可能なのが,固定辞書とユーザ毎の頻度情報を dtoa に両方指定し,ユーザの頻度情報を付与されたテキスト辞書データの出力である.Wnn が開発された時代は,かな漢字変換サーバを複数人で共有し,頻度情報を分離するのは効率的なリソース管理方法だったと思われるが,今でも FreeWnn を利用している人は,自分のマシンに FreeWnn をインストールし,一人だけで利用していると思われる.その場合,固定辞書を利用する必要はなく,すべての辞書をユーザ辞書として管理する方が,別の環境に移行する際に,頻度情報を含めた辞書データの移行が容易になると考えられる. |
| |
| 固定辞書からユーザ辞書に変更したくなり,すでに FreeWnn で日本語入力を行なっている場合,それぞれのユーザディレクトリに各辞書の頻度情報が書かれた .h ファイルがされている.これを辞書データにマージした上でユーザ辞書にするには,以下のようにすれば良い. |
| |
| <code bash> |
| % cd /usr/local/lib/wnn/ja_JP/dic/usr/<user> |
| % /usr/local/bin/Wnn4/dtoa ../../pubdic/kihon.dic kihon.h | sudo /usr/local/bin/Wnn4/atod kihon.dic |
| </code> |
| |
===== - FreeWnn の付属語辞書 [2023-10-18] ===== | ===== - FreeWnn の付属語辞書 [2023-10-18] ===== |
* fzk.shuutan | * fzk.shuutan |
* ;;; 終端ベクタ | * ;;; 終端ベクタ |
* 愁嘆ベクタ,というものがまだ理解できてないけど,ここにも「です」がいる. | * 終端ベクタ,というものがまだ理解できてないけど,ここにも「です」がいる. |
| |
| |
追ってないのだが,何故か Wnn 側の設定ファイルで辞書の登録はする必要がない.emacs から使うことだけを考えるなら,egg の ''eggrc'' という設定ファイルだけ変更すれば良い.50 行目程度のところに,以下のように追記すれば良い. | 追ってないのだが,何故か Wnn 側の設定ファイルで辞書の登録はする必要がない.emacs から使うことだけを考えるなら,egg の ''eggrc'' という設定ファイルだけ変更すれば良い.50 行目程度のところに,以下のように追記すれば良い. |
| |
<code> | <code lisp> |
(wnn-add-dict "mozcdic/mozc_ippan_meishi.dic" '("mozc_ippan_meishi.h") 1 nil t) | (wnn-add-dict "mozcdic/mozc_ippan_meishi.dic" '("mozc_ippan_meishi.h") 1 nil t) |
(wnn-add-dict "mozcdic/mozc_koyu_meishi.dic" '("mozc_koyu_meishi.h") 1 nil t) | (wnn-add-dict "mozcdic/mozc_koyu_meishi.dic" '("mozc_koyu_meishi.h") 1 nil t) |
| </code> |
| |
| [2023-11-01] [[https://www.sakaki.works/doku/doku.php?id=freewnn#%E5%9B%BA%E5%AE%9A%E8%BE%9E%E6%9B%B8_%E3%81%AE%E6%89%B1%E3%81%84_2023-11-01|辞書の節]]で書いたように,固定辞書をユーザ辞書に変換した場合,eggrc の記述を以下のように変更すると,例えば,kihon.dic の頻度情報が kihon.dic の中に追記されていくので,別のホストに辞書を持っていっても,頻度情報が引き継がれることになる.この時,ud を一番前に持ってきておくと,''M-x egg-toroku-region'' した時に,''ud'' が一番最初に候補に出てくるようになる. |
| |
| |
| <code lisp> |
| (wnn-add-dict '("ud") nil 5 t t) |
| (wnn-add-dict '("kihon.dic") nil 5 t t) |
| (wnn-add-dict '("setsuji.dic") nil 5 t t) |
| (wnn-add-dict '("koyuu.dic") nil 1 t t) |
| (wnn-add-dict '("chimei.dic") nil 1 t t) |
| (wnn-add-dict '("jinmei.dic") nil 1 t t) |
| (wnn-add-dict '("special.dic") nil 5 t t) |
| (wnn-add-dict '("computer.dic") nil 5 t t) |
| (wnn-add-dict '("symbol.dic") nil 1 t t) |
| (wnn-add-dict '("tankan.dic") nil 1 t t) |
| (wnn-add-dict '("bio.dic") nil 1 t t) |
| (wnn-add-dict '("tankan2.dic") nil 1 t t) |
| (wnn-add-dict '("tankan3.dic") nil 1 t t) |
| (wnn-add-dict '("g-jinmei.dic") nil 1 t t) |
| (wnn-add-dict '("supplement.dic") nil 1 t t) |
</code> | </code> |
| |
* intro には詳細に,Wnn V4 の挙動や辞書について記述されている. | * intro には詳細に,Wnn V4 の挙動や辞書について記述されている. |
| |
| ---- |
| このページへのアクセス |
| 今日: {{counter|today}} / 昨日: {{counter|yesterday}} |
| 総計: {{counter|total}} |
| |