From: Shigeya Suzuki <shigeya@foretune.co.jp>
Real-Date: Sun, 15 May 1994 18:17:39 +0900
Subject: [infotalk,01089] Re: RE: RE: RE: language preference feature (was: CERN httpd)
Message-Id: <199405150917.SAA21329@dink.foretune.co.jp>
>>>>> On Sun, 15 May 1994 17:58:27 JST, Hiro Yoshioka 15-May-1994 1750 <yoshioka@jrdv04.enet.dec-j.co.jp> said:
Hiro> encoding と言語情報は直交する概念だと思いますので,同様に出来る
Hiro> と思います. 現状では, encoding を表わす GS,KS,JIS に implicit
Hiro> に言語を binding しているような気がしています. それをはっきりわ
Hiro> けちゃう.
encoding問題を抜きにして、そういう情報を入れるというのは、もしかすると
よいのかも知れませんね。情報としてついてれば、かりに失ったとしても、回
復出来る。
shigeya
From: Hiro Yoshioka 15-May-1994 1750 <yoshioka@jrdv04.enet.dec-j.co.jp>
Real-Date: Sun, 15 May 94 17:58:12 +0900
Subject: [infotalk,01088] RE: RE: RE: language preference feature (was: CERN httpd)
Message-Id: <9405150858.AA23532@jrdmax.jrd.dec.com>
よしおかです.
意外と日曜日でも読者がいるのですね (^_^;
>FXISの神戸です。
>> 実はフォント情報が落ちるのじゃなくて,GS は中国語,KSは韓国語,JISは日本語
>> を表現していたのだけどその情報が落ちるのです. でそれらを別途保存しておけば
>> unicode でもなんら問題がないのではないかとわたしは考えています.
>
>o 「別途保存」というのは可能なのでしょうか。plain textではできないとか
> なると、かなり悲しいですね。
言語タグを定義してそれを作成者が陽に指定する.
例えば
<lang=jp> ここから日本語 <lang=en> this is english ...
みたいなイメージです.
>o GS, KS, JISが混ざった(ISO-2022-JP2, or ISO-2022-INT*)場合でも
> 「別途保存」できるのでしょうか。
encoding と言語情報は直交する概念だと思いますので,同様に出来ると思います.
現状では, encoding を表わす GS,KS,JIS に implicit に言語を binding している
ような気がしています. それをはっきりわけちゃう.
よ
From: Takahiro Kanbe <taka@nwt.fxis.fujixerox.co.jp>
Real-Date: Sun, 15 May 1994 17:45:19 +0900
Subject: [infotalk,01087] Re: RE: RE: language preference feature (was: CERN httpd)
Message-Id: <199405150845.RAA15247@litra.nwt.fxis.fujixerox.co.jp>
FXISの神戸です。
某X.500でも1992年版ではDisplayStringという名前で、ISO10646が入っている
関係で興味があります。
> 実はフォント情報が落ちるのじゃなくて,GS は中国語,KSは韓国語,JISは日本語
> を表現していたのだけどその情報が落ちるのです. でそれらを別途保存しておけば
> unicode でもなんら問題がないのではないかとわたしは考えています.
o 「別途保存」というのは可能なのでしょうか。plain textではできないとか
なると、かなり悲しいですね。
o GS, KS, JISが混ざった(ISO-2022-JP2, or ISO-2022-INT*)場合でも
「別途保存」できるのでしょうか。
--
神戸 隆博(かんべ たかひろ) FXIS/SDBU/APD/EG
From: Shigeya Suzuki <shigeya@foretune.co.jp>
Real-Date: Sun, 15 May 1994 14:06:58 +0900
Subject: [infotalk,01086] Re: RE: RE: language preference feature (was: CERN httpd)
Message-Id: <199405150507.OAA20284@dink.foretune.co.jp>
>>>>> On Sun, 15 May 1994 13:59:17 JST, Hiro Yoshioka 15-May-1994 1352 <yoshioka@jrdv04.enet.dec-j.co.jp> said:
Hiro> もちろんいろいろへんな点は持っています.
複数の文字がunifyされてしまうということも、この変な点の一つでしょうか。
Hiro> 大論争がはじまりそうな予感がしていますが (^_^;
最近勉強中なので、いろいろおしえてください。
感情的なのはやめましょね :-p
shigeya
From: Hiro Yoshioka 15-May-1994 1352 <yoshioka@jrdv04.enet.dec-j.co.jp>
Real-Date: Sun, 15 May 94 13:58:18 +0900
Subject: [infotalk,01085] RE: RE: language preference feature (was: CERN httpd)
Message-Id: <9405150458.AA21981@jrdmax.jrd.dec.com>
% From: Shigeya Suzuki <shigeya@foretune.co.jp>
% Real-Date: Sun, 15 May 1994 13:45:29 +0900
Hiro> 自前の encoding をもってもいいけど最低限 2022/10646(/Unicode) との変換は
Hiro> 出来なくちゃいけないとか.
>Unicode って、その点、障壁があるように思えるのですが、実際のところどう
>なんでしょう。うまい解法ないのでしょうか。
Unicode 自体は文字のユニオンだと思えばそれほど問題が多いとはわたしは考えて
いません. もちろんいろいろへんな点は持っています.
よくいわれる例ですけど,GB/KS/JIS で表現した文章を Unicode で表現すると
フォント情報が抜け落ちるから非可逆変換になってしまうから云々.
実はフォント情報が落ちるのじゃなくて,GS は中国語,KSは韓国語,JISは日本語
を表現していたのだけどその情報が落ちるのです. でそれらを別途保存しておけば
unicode でもなんら問題がないのではないかとわたしは考えています.
大論争がはじまりそうな予感がしていますが (^_^;
よ
From: Shigeya Suzuki <shigeya@foretune.co.jp>
Real-Date: Sun, 15 May 1994 13:45:29 +0900
Subject: [infotalk,01084] Re: RE: language preference feature (was: CERN httpd)
Message-Id: <199405150445.NAA20135@dink.foretune.co.jp>
q>>>>> On Sun, 15 May 1994 13:37:15 JST, Hiro Yoshioka 15-May-1994 1331 <yoshioka@jrdv04.enet.dec-j.co.jp> said:
Hiro> 自前の encoding をもってもいいけど最低限 2022/10646(/Unicode) との変換は
Hiro> 出来なくちゃいけないとか.
Unicode って、その点、障壁があるように思えるのですが、実際のところどう
なんでしょう。うまい解法ないのでしょうか。
shigeya
JIS/ShiftJIS -> unicode って方向しか使ってない現状では問題おきないんで
すけどねぇ…
From: Hiro Yoshioka 15-May-1994 1331 <yoshioka@jrdv04.enet.dec-j.co.jp>
Real-Date: Sun, 15 May 94 13:36:34 +0900
Subject: [infotalk,01083] RE: language preference feature (was: CERN httpd)
Message-Id: <9405150436.AA21834@jrdmax.jrd.dec.com>
よしおかです.
>例えば、ja_JP.jis, ja_JP.euc なんていうのも、やれば出来るんですが、
>個人的見地からは、
>
> 「Language と Encoding-Method は異なるものであり、混ぜるべきではない」
>
>というのが私の主張です。
まったくそのとおりだと思います.
[-略-]
>上の例では希望する言語を指定していますが、例えば、「希望するエンコーディ
>ングを指定する」なんてことも当然考えられます。
[-略-]
>で、このエンコーディング情報をどうやって表すべきか、などは、WWWの世界で
>は、まだ何も決まっていません。考えられてもいないかもしれない。
>だから、JIS/UJIS(/SJIS)というエンコーディング情報を、どうやってやりとり
>するかは、2022/10646(/Unicode)をどうやってやりとりするか、ということも
>含めて、これから考えなきゃいけないかなぁ、と思っています。
encoding は複数あるのはもはやしょうがないですよね.
であるなら,各 encoding の conversion rules を定義できるようにして,
自分の encoding を陽に指定出来るようにしないとまづいですね.
自前の encoding をもってもいいけど最低限 2022/10646(/Unicode) との変換は
出来なくちゃいけないとか.
よ