Linuxの日本語入力に関する世界観です。
オープンソースなかな漢字変換の変遷については、以下のPDFの資料が詳しい。
kinput2+cannaの場合、.xinitrc(コマンドラインからstartxする場合)や.xsession(GUIのディスプレイマネージャからログインする場合)などにインプットエンジンの設定を記述する。
export XMODIFIERS=@im=kinput2 kinput2 -canna &
昔のLinuxは、kinput2+cannaやWnnを使うことが多かったが、その後、uim/IIIMF/SCIMなどの新しい次世代と呼ばれるフレームワークが生まれた。
かな漢字変換エンジンも、cannaやWnnから新しいAnthyなどを採用するディストリビューションが増えた。
最近のインプットメソッド(多言語入力エンジン)。Fedora/UbuntuなどのGNOMEなどで日本語入力を行う時は、iBusかFcitxのどちらかと、以下のかな漢字変換エンジンのどれかを組み合わせて使うのが一般的。
現在のiBus/Fcitxの場合、パッケージマネージャからインストールすることで、簡単にインプットメソッドを導入出来る。iBusはGNOME 3と統合されているため、GNOMEなら簡単にインストールと設定を行うだけで日本語を入力できる。
昔あったかな漢字変換エンジンとしては、ワークステーションでも連文節変換をということで開発されたWnnとFreeWnn(1987年)、おバカな変換をするCanna(1990年)、商用のATOK-Xなどがあった。
SKKを参照のこと。
かな漢字変換エンジン。コミュニティにより活発な開発がされていたが、現在では主要開発者による開発は終了している。
京都発! オープンソースなかな漢字変換の変遷によれば、「機械学習を用いた識別モデル」「統計的方法の先駆者」とのこと。
かな漢字変換エンジン。グーグルによる日本語入力システム「Google 日本語入力」のオープンソース版として登場。
後日注記:Googleによる日本語エンジンだが、今では多くのディストリビューションで標準。
京都発! オープンソースなかな漢字変換の変遷によれば、「形態素解析とコスト最小法を採用」とのこと。
今どきのかな漢字変換エンジン。Fedoraで標準。
京都発! オープンソースなかな漢字変換の変遷によれば、「N-gramを採用」「ビッグデータを大いに活かせる」とのこと。
昔からある予測入力システム。最近ではMozcを使うことでも予測入力が可能です。
AZIKは一部で人気の拡張ローマ字入力方式。SKKと同様「普通のIMEを使って入力なんかしたくない」という曲がりものに向いている。
2023.08.14
日本語入力・表示(コンソール・コマンドライン)を参照のこと。
GNOMEの日本語入力は特殊で、分かっていないと難しく感じるかもしれない。以下はGNOME3 & ibus-mozcの場合。(GNOMEはiBusが統合されているので、コントロールパネルから簡単に設定が可能。)
注意すべきなのは、日本語入力と英字入力の切り替えキー。環境によって異なるが、「Super+space」になっていることが多い。このSuperはWindowsキーのこと。環境によっては、「半角/全角」がきく場合もあればきかない場合もある。Ctrl+spaceやShift+spaceになることもあるので注意してほしい。
後日注記:最近はGNOME3における日本語入力も簡単になって、Ubuntuなどでは何も設定しなくても最初から使えるはず。そんなに気にすべきことはない。
fcitxの場合は、fcitx-configtoolで設定する。以下の記事を参考にすると良いだろう。
uimは使えないので、Debianでuimなどが入っている場合は、ibusかfcitxに変えよう。uimでも使えると思うなら使っても良い。(僕の場合、入力の候補が思った場所に表示されないのが使えなかった。)
後日注記:uimは必ずしも厄介者ではなく、さまざまな方式で開発されているLinuxのGUIアプリケーションでは汎用的に使える方である。Debianでuimが採用されているのはそのためで、KDE3派生のTrinityなどでも日本語入力ができる(昔のQtを使っているため。どこかで聞いた話であり、嘘かも)。
KDEで日本語が入力できない場合は、im-chooserをインストールしよう。
# dnf install im-chooser
自分は最近の情勢を良く知らないので、im-chooserから別のパッケージにもしかしたら変わっているかもしれない。(GNOMEではiBusを統合したため、im-chooserのインストールは必要ない。)
僕がLinuxデスクトップを使っていて思うのは、「Linuxは日本語入力に大きな課題」があるということ。
標準のGNOMEやGTKアプリケーションで入力できても、Atomなどでは入力できないこともあるし、そもそもきちんと動かなかったり、画面が点滅したり、入力候補が綺麗に表示されないこともある。
「標準のgeditでは日本語が綺麗に表示されないからAtomを入れたら、そもそも日本語入力自体ができなかった」といった問題がある。
欧米のLinuxユーザーにはどうでもいいことかもしれないが、日本人ユーザーにとってはLinuxデスクトップの日本語入力問題は大きな課題である。
ATOKは、一太郎や花子で知られるジャストシステムの開発する日本語変換のための商用のIMEです。
このATOK、意外にも使用者は多いです。
僕はATOKをあまり使ったことがないため、何がよいのかは分かりませんが、WindowsにおいてもLinuxにおいても、ATOKやATOK-Xはたまに使っている人をよく見かけます。
ただし、これは昔の話かもしれません。なぜなら、昔のUNIXではCannaが標準的であり、Cannaはあまりにおバカな変換をすることで有名だったからです。
Cannaを使うぐらいならATOKを買って使う、という人が多かったのだと思います。
今のLinuxでは、AnthyやMozcがあるため、必ずしも変換はおバカではありません。特に、Googleの開発したMozcは、コミュニティ開発ではないかもしれませんが、WindowsのMS-IMEと遜色のない変換をします。多くの人はLinuxではMozcを使っていると思います。
また、通はSKKやAZIKといった、普通の人には分からない、標準のIMEではない変換ソフトを使う人もいます。Linuxは日本語入力環境としては優しくないかもしれませんが、SKKなどの標準的でないIMEを使うのであれば、環境はいくらか整っているかもしれません。
一太郎・Lotus 1-2-3も参照のこと。
2023.08.16