Skip to content

Commit

Permalink
Issue #44
Browse files Browse the repository at this point in the history
Do not translate ASCII and Unicode.
  • Loading branch information
k-takata committed May 12, 2012
1 parent 934da82 commit 29311f8
Show file tree
Hide file tree
Showing 11 changed files with 65 additions and 69 deletions.
19 changes: 9 additions & 10 deletions doc/digraph.jax
Original file line number Diff line number Diff line change
Expand Up @@ -27,8 +27,8 @@
*E104* *E39*
:dig[raphs] {char1}{char2} {number} ...
ダイグラフ{char1}{char2}をリストに追加する。{number}
そのキャラクタを表す10進表記。通常、文字はユニコードで
ある|digraph-encoding| を参照。
そのキャラクタを表す10進表記。通常、文字はUnicodeであ
|digraph-encoding| を参照。
例: >
:digr e: 235 a: 228
< ダイグラフの定義をを無効にするには最初の文字に
Expand All @@ -51,12 +51,11 @@ Vimは普通|+digraphs|特性を持ってコンパイルされる。この特性
{訳注: 10進数はそのキャラクタのASCIIコードである。}

*digraph-encoding*
10進数の数字は通常、その文字のユニコード番号である。Note その数字の意味は
'encoding' が変わっても変わらない。必要ならば、その文字がユニコードから
'encoding' へと変換される。そのためには変換が有効になっていなければならない。
そうでないと処理が失敗する。NUL 文字は "10" と表示される。これは、内部的に NUL
文字は NL で表現されているからである。ファイルに書き込むときに NUL 文字に変換
される。
10進数の数字は通常、その文字のUnicode番号である。Note その数字の意味は
'encoding' が変わっても変わらない。必要ならば、その文字がUnicodeから'encoding'
へと変換される。そのためには変換が有効になっていなければならない。そうでないと
処理が失敗する。NUL 文字は "10" と表示される。これは、内部的に NUL文字は NL で
表現されているからである。ファイルに書き込むときに NUL 文字に変換される。

Vim が |+multi_byte| 機能なしでコンパイルされている場合は、その文字を
'encoding' と同じエンコーディングで指定しなければならない。次のようにするとよ
Expand All @@ -68,8 +67,8 @@ Vim が |+multi_byte| 機能なしでコンパイルされている場合は、
digraph oe 189
endif
これは、ユニコードで番号339、latin9 (iso-8859-15) で番号189の文字に対して
ダイグラフ "oe" を定義している。
これは、Unicodeで番号339、latin9 (iso-8859-15) で番号189の文字に対してダイグラ
"oe" を定義している。

==============================================================================
2. ダイグラフを使う *digraphs-use*
Expand Down
4 changes: 2 additions & 2 deletions doc/eval.jax
Original file line number Diff line number Diff line change
Expand Up @@ -4451,8 +4451,8 @@ readfile({fname} [, {binary} [, {max}]])
バイナリモードでない場合:
- NLの前に現れるCR文字を除去する。
- 最後の行がNLで終わるかどうかは関係ない。
- 'encoding' がユニコードのときは UTF-8 のバイトオーダーマーク
は取り除かれる
- 'encoding' がUnicodeのときは UTF-8 のバイトオーダーマークは
取り除かれる
{max}を指定すると、読み込む行数の最大値となる。ファイルの最初
の10行をチェックするときに役に立つ: >
:for line in readfile(fname, '', 10)
Expand Down
3 changes: 1 addition & 2 deletions doc/indent.jax
Original file line number Diff line number Diff line change
Expand Up @@ -82,8 +82,7 @@ Cのファイルに対して自動的に'cindent'をオンにしてそれ以外
! '!' をキーの前に置くと、Vimはそのキーを挿入するのではなく替わりに現在
の行のインデントを再調整する。これにより現在の行の再調整するためのコマ
ンドキーを定義することができる。CTRL-Fはそのデフォルトキーである。
CTRL-I<Tab>のアスキーコードだから、CTRL-Iを定義する際に気をつけるこ
と。
CTRL-I<Tab>のASCIIコードだから、CTRL-Iを定義する際に気をつけること。
* '*' をキーの前に置くと、Vimはインデント再調整を行なってからそのキーを
挿入する。'cinkeys' に "*<Return>"が含まれている時には、Vimは新しい行
を作成する前に現在行のインデントを再調整する。
Expand Down
4 changes: 2 additions & 2 deletions doc/index.jax
Original file line number Diff line number Diff line change
Expand Up @@ -6,7 +6,7 @@

*index*
このファイルには各モードのすべてのコマンドが列挙されており、タグと短い説明が示
されている。一覧はアスキーコード順に並んでいる
されている。一覧はASCIIコード順に並んでいる

ヒント: 機能で検索するときは、検索コマンドを使用する。例えば、何かを削除するコ
マンドを検索したいなら、"/削除"を使用する。
Expand Down Expand Up @@ -1100,7 +1100,7 @@ You found it, Arthur! *holy-grail*
|:argglobal| :argg[lobal] グローバル引数リストを使用する
|:arglocal| :argl[ocal] ローカル引数リストを使用する
|:argument| :argu[ment] 引数リストの指定したファイルを開く
|:ascii| :as[cii] カーソル位置の文字のアスキーコードを表示
|:ascii| :as[cii] カーソル位置の文字のASCIIコードを表示
|:autocmd| :au[tocmd] オートコマンドの入力と表示
|:augroup| :aug[roup] 使用するオートコマンドグループの選択と表示
|:aunmenu| :aun[menu] すべてのモードに対してメニュー項目を削除
Expand Down
43 changes: 21 additions & 22 deletions doc/mbyte.jax
Original file line number Diff line number Diff line change
Expand Up @@ -27,8 +27,8 @@
10. UTF-8を使う |mbyte-utf8|
11. 主なオプション |mbyte-options|

NOTE: このファイルにはユニコードの文字が含まれている。他のエンコーディングを使
用している場合は、変な文字、あるいは四角形として表示されるかもしれない。
NOTE: このファイルにはUnicodeの文字が含まれている。他のエンコーディングを使用
している場合は、変な文字、あるいは四角形として表示されるかもしれない。

==============================================================================
1. はじめに (Getting started) *mbyte-first*
Expand Down Expand Up @@ -317,12 +317,12 @@ Note: すべてのエンコーディングは0から128までの文字がASCII
2 euc-tw 繁体中国語 (Unix only)
2 2byte-{name} Unix: ダブルバイトエンコーディングのどれか (Vim特有の名前)
2 cp{number} MS-Windows: インストールされているダブルバイトのコードページ
u utf-8 UTF-8にエンコードされた32ビットのユニコード (ISO/IEC 10646-1)
u ucs-2 UCS-2にエンコードされた16ビットのユニコード (ISO/IEC 10646-1)
u utf-8 UTF-8にエンコードされた32ビットのUnicode (ISO/IEC 10646-1)
u ucs-2 UCS-2にエンコードされた16ビットのUnicode (ISO/IEC 10646-1)
u ucs-2le リトルエンディアンのucs-2
u utf-16 ucs-2を拡張してさらに多くの文字を表現できるようにしたもの
u utf-16le リトルエンディアンのutf-16
u ucs-4 UCS-4にエンコードされた32ビットのユニコード (ISO/IEC 10646-1)
u ucs-4 UCS-4にエンコードされた32ビットのUnicode (ISO/IEC 10646-1)
u ucs-4le リトルエンディアンのucs-4

{name}にはシステムがサポートしているエンコーディングの名前を入れることができ
Expand Down Expand Up @@ -418,8 +418,8 @@ MS-WindowsはリトルエンディアンのUCS-2を使用するので、MS-Windo

Unicode 8bit 機能する。(普通はこうしない)
Unicode 2byte 機能しない。
Unicode Unicode 問題なく機能する。(Vim内部ではユニコードはすべてUTF-8
で扱われるため'termencoding'が空でも同じく機能する)
Unicode Unicode 問題なく機能する。(Vim内部ではUnicodeはすべてUTF-8で扱
われるため'termencoding'が空でも同じく機能する)

エンコーディングの変換 *charset-conversion*

Expand Down Expand Up @@ -475,7 +475,7 @@ Vimはいろいろな場面で自動的にエンコーディングを変換す
'encoding'の設定と違うエンコーディングのファイルを読み書きするときは、エンコー
ディングを変換する必要がある。次の変換がサポートされている:
- Latin-1(ISO-8859-1)、UTF-8、UCS-2、UCS-4の間の変換はVimが自前で行なう。
- MS-Windowsでは、'encoding'がユニコードなら各コードページとの変換は機能する
- MS-Windowsでは、'encoding'がUnicodeなら各コードページとの変換は機能する
- 'charconvert'による変換。
- 可能であれば、iconvライブラリを使用して変換することができる。
古いバージョンのGNU iconv()では変換が失敗することがある(Vimが用意する
Expand All @@ -502,9 +502,8 @@ GUIではマルチバイト文字を完全にサポートしている。端末
を設定する。Vimは入力された文字を'termencoding'から'encoding'へと変換する。そ
して表示するときに'encoding'から'termencoding'へと変換する。端末のエンコーディ
ングに、Vimが取り扱う文字がすべて含まれていない場合、文字の情報が失なわれてし
まう。下記で説明しているxtermのように、ユニコードをサポートしている端末なら問
題はない。ほぼすべての文字セットは情報を失なわずにユニコードに変換できるからで
ある。
まう。下記で説明しているxtermのように、Unicodeをサポートしている端末なら問題は
ない。ほぼすべての文字セットは情報を失なわずにUnicodeに変換できるからである。


UTF-8をXFree86 xtermで使う *UTF8-xterm*
Expand Down Expand Up @@ -1213,13 +1212,13 @@ Combining forms:
==============================================================================
10. UTF-8を使う (Using UTF-8) *mbyte-utf8* *UTF-8* *utf-8* *utf8*
*Unicode* *unicode*
ユニコードは、他の文字セットをすべて含むように設計された。そのため、どんな言語
のテキストでもユニコードを使って書くことができる(希少な言語を除く)。そして、
のエンコーディングでは混在させることが不可能な言語でも、一つのファイルに混在さ
せることが可能である
Unicodeは、他の文字セットをすべて含むように設計された。そのため、どんな言語の
テキストでもUnicodeを使って書くことができる(希少な言語を除く)。そして、他のエ
ンコーディングでは混在させることが不可能な言語でも、一つのファイルに混在させる
ことが可能である

ユニコードにはいくつかのエンコード法がある。もっとも一般的なのは、1文字を 1
たは複数バイトで表わすUTF-8であり、ASCII と後方互換性がある。MS-Windowsでは
Unicodeにはいくつかのエンコード法がある。もっとも一般的なのは、1文字を 1 また
は複数バイトで表わすUTF-8であり、ASCII と後方互換性がある。MS-Windowsでは
UTF-16 も使われる(以前は UCS-2 と呼ばれていた)。こちらは 16 ビットを基本単位と
する。Vimはこれらのエンコーディングすべてをサポートしているが、Vim でユニコー
ドを使う場合、内部では常に UTF-8 が使われている。
Expand All @@ -1235,8 +1234,8 @@ Vimは幅広くUTF-8をサポートしており、それは以下の環境で機
空白で埋められる。Note:オプション'guifontset'はGTK+ 2 GUIでは使用しない。

*bom-bytes*
ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのユニコードエンコー
ディングを判別するのに使われる:
ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのUnicodeエンコーディ
ングを判別するのに使われる:
EF BB BF utf-8
FE FF utf-16 big endian
FF FE utf-16 little endian
Expand Down Expand Up @@ -1275,9 +1274,9 @@ Overlong sequenceに対して特別な処理はされない。通常の文字と
{訳注: たぶん、"<00>"と表示されてるOverlong sequenceだけはたとえ|/\_.|でもマッ
チしないということ。}

ファイルやバッファには、ユニコードで表現できる範囲(31ビット)の文字をすべて書く
ことができる。ただし、それを表示できるのは使用フォントがその文字を提供している
場合のみ
ファイルやバッファには、Unicodeで表現できる範囲(31ビット)の文字をすべて書くこ
とができる。ただし、それを表示できるのは使用フォントがその文字を提供している場
合のみ

便利なコマンド:
- "ga"はカーソル位置の文字のコードを10進数、16進数、8進数で表示する。合成文字
Expand Down
32 changes: 16 additions & 16 deletions doc/options.jax
Original file line number Diff line number Diff line change
Expand Up @@ -714,7 +714,7 @@ Note 1番目の形式では、行全体がオプション指定に使われる
{Vi にはない}
{Vimが|+multi_byte|機能付きでコンパイルされたときのみ
有効}
'encoding'が"utf-8"などユニコードエンコーディングのときのみ効果がある
'encoding'が"utf-8"などUnicodeエンコーディングのときのみ効果がある
East Asian Width Class Ambiguous な文字(ユーロ、登録商標記号、著作権記
号、ギリシャ文字、キリル文字など)をどう扱うかを定める。

Expand Down Expand Up @@ -1357,12 +1357,12 @@ Note 1番目の形式では、行全体がオプション指定に使われる
大文字・小文字の変更について詳細を指定する。このオプションはコンマ区切
りで以下の単語を含む:
internal 内部の大文字・小文字対応関数を使う。現在のロケールに
よって対応が変更されない。これは'encoding'がユニコード
よって対応が変更されない。これは'encoding'がUnicode
エンコーディング, "latin1", "iso-8859-15"のときのみ問
題になる。"internal"が除かれるとシステムライブラリ関数
towupper()とtowlower()が利用可能ならば使われる。
keepascii アスキー文字(0x00から0x7f)についてはUS大文字小文字対応
を使う。現在のロケールは効果を持たない。
keepascii ASCII文字(0x00から0x7f)についてはUS大文字小文字対応を
使う。現在のロケールは効果を持たない。
これはおそらくトルコ語でだけ問題になる。

*'cdpath'* *'cd'* *E344* *E346*
Expand Down Expand Up @@ -2601,9 +2601,9 @@ Note 1番目の形式では、行全体がオプション指定に使われる
照。

NOTE: このオプションの値を変更しても、Vim内部の既存のテキストのエンコー
ディングは変化しないので注意。非アスキー文字がおかしくなる恐れもある。
既定の値から変更しないか、Vimの起動時に限って設定すること。|multibyte|
を参照。メニューを再読み込みするには|:menutrans|を参照。
ディングは変化しないので注意。非ASCII文字がおかしくなる恐れもある。既
定の値から変更しないか、Vimの起動時に限って設定すること。|multibyte|
参照。メニューを再読み込みするには|:menutrans|を参照。

このオプションはモードライン (|modeline|) では設定できません。テキスト
が壊れてしまうため。
Expand Down Expand Up @@ -2856,13 +2856,13 @@ Note 1番目の形式では、行全体がオプション指定に使われる
警告: 文字エンコーディングを変換すると、情報が失われるおそれが
ある!'encoding' が "utf-8" だと、変換は大抵成功するし、逆変換
をしても同じテキストになる。'encoding' が "utf-8" でないときは、
非アスキー文字が失われるかもしれない!変換できない文字をどう扱
うかは引数|++bad|で指定することができる。
空ファイルやアスキー文字のみのファイルではほとんどのエンコーディングで
うまくので'fileencodings'の最初の値が使われる("ucs-bom"を除く。これ
はBOMがなければいけない)。他のエンコーディングがよければ自動コマンドイ
ベントBufReadPostを使って、そのエンコーディングが使われるかどうかを判
定すること。例: >
非ASCII文字が失われるかもしれない!変換できない文字をどう扱う
かは引数|++bad|で指定することができる。
空ファイルやASCII文字のみのファイルではほとんどのエンコーディングでう
まくので'fileencodings'の最初の値が使われる("ucs-bom"を除く。これは
BOMがなければいけない)。他のエンコーディングがよければ自動コマンドイベ
ントBufReadPostを使って、そのエンコーディングが使われるかどうかを判定
すること。例: >
au BufReadPost * if search('\S', 'w') == 0 |
\ set fenc=iso-2022-jp | endif
< これは、ファイルが空白文字しか含まないとき'fileencoding'
Expand All @@ -2873,7 +2873,7 @@ Note 1番目の形式では、行全体がオプション指定に使われる
:setglobal fenc=iso-8859-2
< とする。これは存在しないファイルが空のファイルとは異なるエンコーディン
グになることを意味する。
ファイル先頭にユニコードの BOM (Byte Order Mark: バイト順マーク) があ
ファイル先頭にUnicodeの BOM (Byte Order Mark: バイト順マーク) があ
るかどうか調べるには、"ucs-bom" という特別な値が使える。この値を
"utf-8" 等のUnicode系の値よりも後に指定すると正しく機能しない。
8ビットエンコーディング("latin1"など)の項目はリストの最後に書かなけれ
Expand Down Expand Up @@ -7205,7 +7205,7 @@ Note 1番目の形式では、行全体がオプション指定に使われる
的に'termencoding'が"utf-8"に設定される。
これを他の値に設定しようとしても失敗し、エラーメッセージが表示される。
Win32 GUIでは'termencoding'は入力された文字に対しては適用されない。
Win32では常にユニコード文字が渡されるからである
Win32では常にUnicode文字が渡されるからである
空のときは、'encoding' で指定されたエンコーディングが使われる。これが
通常の値である。
'termencoding''encoding' の組み合わせが全て正しいわけではない。
Expand Down
2 changes: 1 addition & 1 deletion doc/pattern.jax
Original file line number Diff line number Diff line change
Expand Up @@ -511,7 +511,7 @@ after: \v \m \M \V マッチするもの ~
|/\M| \M \M 以降のパターン文字を 'magic' がオフの状態で処理します
|/\v| \v \v 以降のパターン文字を "very magic" で処理します
|/\V| \V \V 以降のパターン文字を "very nomagic" で処理します
|/\Z| \Z \Z ユニコードの合成文字かどうかを無視します
|/\Z| \Z \Z Unicodeの合成文字かどうかを無視します
ヘブライ語やアラビア語で母音を検索するときに便利です。

|/\%d| \%d \%d 10進数指定の特定の文字 (例 \%d123)
Expand Down
6 changes: 3 additions & 3 deletions doc/quickref.jax
Original file line number Diff line number Diff line change
Expand Up @@ -610,9 +610,9 @@
説明とヘルプへのリンクをつけてある。

各オプションの簡易説明: *option-list*
'aleph' 'al' Aleph文字(ヘブライ語)用のアスキーとする
'aleph' 'al' Aleph文字(ヘブライ語)用のASCIIコードとする
'allowrevins' 'ari' 挿入モードとコマンドラインモードで、 CTRL-_
使うことを認める。
使うことを認める。
'altkeymap' 'akm' デフォルトの第2言語(Farsi/ヘブライ)
'ambiwidth' 'ambw' Unicode文字の不明瞭な文字幅を決定する
'antialias' 'anti' Mac OS X: フォントを滑らかに表示する。
Expand All @@ -630,7 +630,7 @@
'backupdir' 'bdir' バックアップファイル用のディレクトリを指定
'backupext' 'bex' バックアップファイル用の拡張子
'backupskip' 'bsk' 指定のパターンに合致するファイルはバックアップ
しない。
しない。
'balloondelay' 'bdlay' バルーンウィンドウが出るまでの遅延時間(ms)
'ballooneval' 'beval' バルーン評価のON/OFF
'balloonexpr' 'bexpr' バルーンウィンドウに表示する式
Expand Down
Loading

0 comments on commit 29311f8

Please sign in to comment.