差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
freewnn [2023/10/20 10:51] skkfreewnn [2023/11/01 01:59] (現在) skk
行 1: 行 1:
-= [[FreeWnn]] LM: [2023-10-20 10:51:17]+= [[FreeWnn]] LM: [2023-11-01 01:58:45] 
 +~~NOCACHE~~
  
 ====== - 概要 [2023-10-05] ====== ====== - 概要 [2023-10-05] ======
行 7: 行 8:
 論文など,長い文章を書く際,egg/FreeWnn のペアで書いていたため,ゆっくりと文章を考えたい場合,どうしてもこのセットを使いたくなる.今はもうほとんど使ってる人いないだろうな… 論文など,長い文章を書く際,egg/FreeWnn のペアで書いていたため,ゆっくりと文章を考えたい場合,どうしてもこのセットを使いたくなる.今はもうほとんど使ってる人いないだろうな…
  
-現在,インターネット上の FreeWnn に関する情報はかなり消え去りつつあり,よしだともこさんが残してくれている,http://www.tomo.gr.jp/FreeWnn/ こちらかなりの情報が残っている状態.+現在,インターネット上の FreeWnn に関する情報はかなり消え去りつつあり,よしだともこさんが残してくれている,http://www.tomo.gr.jp/FreeWnn/ こちらかなりの情報が残っている状態.むしろ,ソースコード内の mannual ディレクトリ内の情報がとても充実しているので,参考にするべきと思われる
  
 ====== - 構造メモ [2023-10-16] ====== ====== - 構造メモ [2023-10-16] ======
行 46: 行 47:
 </code> </code>
  
-これは,GNU grep の仕様が昔と比べて変わったという話なので,'/usr/local/bin/ggrep -E' などに書き換えればいいのかもしれない.FreeBSD でも同じエラーが出たが,僕が GNU grep を ports で入れていたからなので,'pubdicplus/Makefile' の該当部分を '/usr/bin/grep' に書き換えたら,すんなりコンパイルが通った.多分,Linux でも ggrep に書き換えれば通るのではないだろうか(試してない).([2023-10-18])+これは,GNU grep の仕様が昔と比べて変わったという話なので,'/usr/local/bin/ggrep -E' などに書き換えればいいのかもしれない.FreeBSD でも同じエラーが出たが,僕が GNU grep を ports で入れていたからなので,'pubdicplus/Makefile' の該当部分を '/usr/bin/egrep' に書き換えたら,すんなりコンパイルが通った.多分,Linux でも ggrep に書き換えれば通るのではないだろうか(試してない).([2023-10-18])
  
 その際,atod/dtoa は hinsi.data ファイルを利用するようなので,ソース内の ''Wnn/jd/hinsi.data'' を利用すればよい.atod/dtoa を良く利用するならば,''LIBDIR'' で指定されている ''/usr/local/lib/wnn/ja_JP/'' 以下に hinsi.data をコピーまたはシンボリックリンクなどで読み込めるようにしておくと,コマンドを使うたびに hinsi.data を指定しなくて良くなる. その際,atod/dtoa は hinsi.data ファイルを利用するようなので,ソース内の ''Wnn/jd/hinsi.data'' を利用すればよい.atod/dtoa を良く利用するならば,''LIBDIR'' で指定されている ''/usr/local/lib/wnn/ja_JP/'' 以下に hinsi.data をコピーまたはシンボリックリンクなどで読み込めるようにしておくと,コマンドを使うたびに hinsi.data を指定しなくて良くなる.
行 58: 行 59:
 -r/-R を less につけることで,色だったり強調表示が ESC のような化けた感じになるのを抑制できる.[[https://yanor.net/wiki/?UNIX/less%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89%E3%81%A7ls%E3%82%84man%E3%82%92%E8%89%B2%E4%BB%98%E3%81%8D%E8%A1%A8%E7%A4%BA%E3%81%99%E3%82%8B|参考]]. -r/-R を less につけることで,色だったり強調表示が ESC のような化けた感じになるのを抑制できる.[[https://yanor.net/wiki/?UNIX/less%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89%E3%81%A7ls%E3%82%84man%E3%82%92%E8%89%B2%E4%BB%98%E3%81%8D%E8%A1%A8%E7%A4%BA%E3%81%99%E3%82%8B|参考]].
  
-====== - 辞書 [2021-05-29] ======+====== - 辞書 [2023-11-01] [2021-05-29] ======
  
-FreeWnn デフォルトの辞書は,いまどの Google IME/Mozc や MS-IME のような豊富な辞書はってない.数万語程度.+ソースコード内の Wnn/manual/intro の辞書の部分を見ると,FreeWnn の辞書は,登録可能形式と,固定形式,の二つに大く分かれてるようである.登録可能形式は,最初に Wnn を利用する際に作成される ud のように,M-x egg-toroku-region どで単語を追加していける辞書のこと.固定形式,辞書自体は変更できず,頻度情報を各ユーザ毎に保存しておく形式のこと. 
 + 
 +FreeWnn をインストールすると,pubdic(場所は以下の節参照)などに kihon.dic,computer.dic などの辞書が一緒にインストールされる.(デフォルトで有効になってない辞書も含まれているが)以下がインストールされる辞書群で,全部足して 47724 語程度(数十文字程度誤差あり)である 
 + 
 +<code bash> 
 +% for HOGE in bio.dic chimei.dic computer.dic g-jinmei.dic jinmei.dic kihon.dic koyuu.dic setsuji.dic special.dic supplement.dic tankan.dic tankan2.dic tankan3.dic 
 +for> do 
 +for> wc -l $HOGE 
 +for> done 
 +     514 bio.dic 
 +     895 chimei.dic 
 +     698 computer.dic 
 +    1561 g-jinmei.dic 
 +     619 jinmei.dic 
 +   17892 kihon.dic 
 +      21 koyuu.dic 
 +     208 setsuji.dic 
 +      19 special.dic 
 +   19321 supplement.dic 
 +    1250 tankan.dic 
 +    1388 tankan2.dic 
 +    3338 tankan3.dic 
 +</code>
  
 ===== - FreeWnn のユーザ辞書 ===== ===== - FreeWnn のユーザ辞書 =====
行 67: 行 90:
  
 インストール先: インストール先:
-  * 辞書データ+  * 標準辞書データ
     * FreeBSD: /usr/local/lib/wnn/ja_JP/dic/pubdic     * FreeBSD: /usr/local/lib/wnn/ja_JP/dic/pubdic
     * Ubuntu Linux: /usr/share/wnn/ja_JP/dic -> 実態は /var/lib/wnn 以下.     * Ubuntu Linux: /usr/share/wnn/ja_JP/dic -> 実態は /var/lib/wnn 以下.
行 73: 行 96:
     * FreeBSD: /usr/local/bin/Wnn4/      * FreeBSD: /usr/local/bin/Wnn4/ 
     * Ubuntu: atod/dtoa などはパッケージではインストールされない.ソースからコンパイルすれば良い.     * Ubuntu: atod/dtoa などはパッケージではインストールされない.ソースからコンパイルすれば良い.
 +  * ユーザ辞書
 +    * FreeBSD: /usr/local/lib/wnn/ja_JP/dic/usr/<user>/ud
 +    * Ubuntu Linux: /usr/share/wnn/ja_JP/dic/usr/<user>/ud 
 +
  
 辞書変換ツール: 辞書変換ツール:
行 171: 行 198:
 </code> </code>
  
 +[2023-11-01] ''\comment'' は,''M-x egg-toroku-region'' の際に選択する辞書に表示される情報として利用されている.
  
 参考: 参考:
   * [2023-10-06] [[https://docs.oracle.com/cd/E19455-01/806-2800/6jc09qd0b/index.html|Wnn6の辞書の説明]]   * [2023-10-06] [[https://docs.oracle.com/cd/E19455-01/806-2800/6jc09qd0b/index.html|Wnn6の辞書の説明]]
 +
 +===== - 固定辞書 の扱い [2023-11-01] =====
 +
 +ユーザ辞書は,dtoa/atod などのツールを用いて,バイナリ辞書形式とテキスト形式を相互変換できるので,別のホストにそこまで苦労せずに移行できるが,固定辞書の頻度情報をテキストに変換する方法は,[2023-11-01] 現在,見つかっていない.唯一可能なのが,固定辞書とユーザ毎の頻度情報を dtoa に両方指定し,ユーザの頻度情報を付与されたテキスト辞書データの出力である.Wnn が開発された時代は,かな漢字変換サーバを複数人で共有し,頻度情報を分離するのは効率的なリソース管理方法だったと思われるが,今でも FreeWnn を利用している人は,自分のマシンに FreeWnn をインストールし,一人だけで利用していると思われる.その場合,固定辞書を利用する必要はなく,すべての辞書をユーザ辞書として管理する方が,別の環境に移行する際に,頻度情報を含めた辞書データの移行が容易になると考えられる.
 +
 +固定辞書からユーザ辞書に変更したくなり,すでに FreeWnn で日本語入力を行なっている場合,それぞれのユーザディレクトリに各辞書の頻度情報が書かれた .h ファイルがされている.これを辞書データにマージした上でユーザ辞書にするには,以下のようにすれば良い.
 +
 +<code bash>
 +% cd /usr/local/lib/wnn/ja_JP/dic/usr/<user>
 +% /usr/local/bin/Wnn4/dtoa ../../pubdic/kihon.dic kihon.h | sudo /usr/local/bin/Wnn4/atod kihon.dic
 +</code>
  
 ===== - FreeWnn の付属語辞書 [2023-10-18] ===== ===== - FreeWnn の付属語辞書 [2023-10-18] =====
行 385: 行 424:
 追ってないのだが,何故か Wnn 側の設定ファイルで辞書の登録はする必要がない.emacs から使うことだけを考えるなら,egg の ''eggrc'' という設定ファイルだけ変更すれば良い.50 行目程度のところに,以下のように追記すれば良い. 追ってないのだが,何故か Wnn 側の設定ファイルで辞書の登録はする必要がない.emacs から使うことだけを考えるなら,egg の ''eggrc'' という設定ファイルだけ変更すれば良い.50 行目程度のところに,以下のように追記すれば良い.
  
-<code>+<code lisp>
  (wnn-add-dict "mozcdic/mozc_ippan_meishi.dic" '("mozc_ippan_meishi.h") 1 nil t)  (wnn-add-dict "mozcdic/mozc_ippan_meishi.dic" '("mozc_ippan_meishi.h") 1 nil t)
  (wnn-add-dict "mozcdic/mozc_koyu_meishi.dic" '("mozc_koyu_meishi.h") 1 nil t)  (wnn-add-dict "mozcdic/mozc_koyu_meishi.dic" '("mozc_koyu_meishi.h") 1 nil t)
 +</code>
 +
 +[2023-11-01] [[https://www.sakaki.works/doku/doku.php?id=freewnn#%E5%9B%BA%E5%AE%9A%E8%BE%9E%E6%9B%B8_%E3%81%AE%E6%89%B1%E3%81%84_2023-11-01|辞書の節]]で書いたように,固定辞書をユーザ辞書に変換した場合,eggrc の記述を以下のように変更すると,例えば,kihon.dic の頻度情報が kihon.dic の中に追記されていくので,別のホストに辞書を持っていっても,頻度情報が引き継がれることになる.この時,ud を一番前に持ってきておくと,''M-x egg-toroku-region'' した時に,''ud'' が一番最初に候補に出てくるようになる.
 +
 +
 +<code lisp>
 +  (wnn-add-dict '("ud"           nil             5 t t)
 +  (wnn-add-dict '("kihon.dic"    nil             5 t t)
 +  (wnn-add-dict '("setsuji.dic"  nil             5 t t)
 +  (wnn-add-dict '("koyuu.dic"    nil             1 t t)
 +  (wnn-add-dict '("chimei.dic"   nil             1 t t)
 +  (wnn-add-dict '("jinmei.dic"   nil             1 t t)
 +  (wnn-add-dict '("special.dic"  nil             5 t t)
 +  (wnn-add-dict '("computer.dic" nil             5 t t)
 +  (wnn-add-dict '("symbol.dic"   nil             1 t t)
 +  (wnn-add-dict '("tankan.dic"   nil             1 t t)
 +  (wnn-add-dict '("bio.dic"      nil             1 t t)
 +  (wnn-add-dict '("tankan2.dic"  nil             1 t t)
 +  (wnn-add-dict '("tankan3.dic"  nil             1 t t)
 +  (wnn-add-dict '("g-jinmei.dic" nil             1 t t)
 +  (wnn-add-dict '("supplement.dic" nil             1 t t)
 </code> </code>
  
行 408: 行 468:
     * intro には詳細に,Wnn V4 の挙動や辞書について記述されている.     * intro には詳細に,Wnn V4 の挙動や辞書について記述されている.
  
 +----
 +このページへのアクセス
 +今日: {{counter|today}} / 昨日: {{counter|yesterday}}
 +総計: {{counter|total}}
  
freewnn.1697766690.txt.gz · 最終更新: 2023/10/20 10:51 by skk
文書の先頭へ
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0