アカウント名:
パスワード:
https://forest.watch.impress.co.jp/docs/serial/yajiuma/1597030.html [impress.co.jp]
>魔法少女の「魔」を「广」(まだれ)のなかに「マ」と書いたり、機械の「機」を「木」偏に「キ」と略したりするじゃないですか。ああいった文字もUnicodeにあれば何かと便利じゃないですか?
自分の身の回りでは全然見ない略字で、違和感が……。マイナーメジャーの類い?
手書きだとそれなりに使われてたけど電子化で使う機会が減った略字ですね。他に思い浮かぶのは「門」(門構え)の略で⊓の横線中央に交差するように短い縦線を入れるやつ國→国のように略字から正式な漢字になったものもたくさんある。
その門の字形は略字というか行書体ですね(行書体自体が略字の一種ではありますが)。簡体字では正式な字形となっています。
元レスの「广マ」は、今は電撃マオウという誌名の雑誌が、創刊当時の誌名に使ってた記憶。(マはさらに丸囲み文字にしていたんだったっけ)
第、曜、職、前なんかも略字ありますよね全部正式な文字ではないのかな
そう言う意味では「弁」は略字で、元の字は、「辨」…正しいか否かを分ける→「弁明」「瓣」…花びら→「花弁」「辯」…述べる→「弁護」とか。いまや、元の字を弁別できない人の方が多い。「弁別」は「辨別」な。
内田百閒,1939,「腰辨の辯」,新潮社,(文庫版「御馳走帖」,1979,中公文庫).
文字としては同じ意味なんだから、同じコードでフォントフェイスで対応しろ、というのが昔のユニコードだったと思うのですが、今では違うのでしょうか。だったら全角半角が曖昧幅の文字も全部別々のコードに振りなおしてほしいな。
今はIVRで対応かな。ただ略字ブロックの提案となると、「同じ意味」の厳格化や意味の追加に近い。丸囲み文字とか白抜き文字とか。「~のコード文字を簡略化したものですよ」という意味づけになるんじゃないかな。
Unicodeは世界中の文字を扱えることを目指したものなので文字幅は文字によって違うのが当たり前なので、全角半角はJISなどとの相互運用のための例外的対応でしかないんだよな。まあ当初のポリシーに無理があることがわかって一貫性がなくなってしまった箇所は他にもたくさんあるけど。
文字としては同じ意味なんだから、同じコードでフォントフェイスで対応しろ、というのが昔のユニコードだったと思うのですが、今では違うのでしょうか。
その前提は最初から嘘だったからなあ。アルファベットの大文字小文字、キリルやギリシャ文字は統一しなかったよね。
キリルやギリシャ文字は何もしらないんですがアルファべットの大文字小文字統一はASCIIコード互換を持たない分効率的な面もでるって感じになるのかなあ
検索だけ考えればそうだろうけど、大文字のみまたは小文字のみでしか記録できないコードでは文書データの保存方法としては使い物にならないからまったく普及しなかったよ。断言できる。
Han unificationはまさにそういうレベルの失敗だったのですよ。「同じコードでフォントフェイス」云々は16bitに収める為の筋の悪い方便。
大昔の文字コードはコントロール文字を含めて6bitで1byteだった時代もあったと聞く。1byteの小文字の前にシフト文字を置くと大文字扱いらしい。CPUの命令長は6bitの倍数が都合がよく、18bit固定長か12bit固定長が選ばれた。3bitずつに区切って数値は8進数で表現し、8本のレジスタを選択した。御大臣のIBMが8bitを1byteとした後も、小規模な回路が求められた分野では3bit区切りの古い設計が生き残り、その時代のi8008の末裔は今も3bit区切りに縛られている。
重箱の隅だけど気になってしまった。
> 御大臣のIBM
「御大」(おんたい)のことかな…「御大尽」(おだいじん)と混ざった?
> i8008
IntelのCPU名が「i+数字」となったのは「80386」を「i386」と表記するようになって以降のことで、8008にiをつけるのは一般的ではないと思う。
それに8008が「3bit区切りに縛られてる」って何のことやら?命令長は8bitの倍数しかないですよね?80系CPUでは1命令で2つのレジスタを指定する命令も多いので、命令長を8bitに収めようとすればそのうちレジスタ選択フィールドに回せるのは3bitとなるし、それにレジスタ数は回路規模にも関わる要素なので当時は8個くらいが手ごろなところでしょう。
80系CPUは命令コードに3bitのフィールドを持っている程度で、実際の演算処理などに3bit区切りなんて出てきません。むしろZ80などでBCD演算のために4bit区切りの演算命令が追加された。
>IntelのCPU名が「i+数字」となったのは「80386」を「i386」と表記するようになって以降のことで
486の時に商標問題でそうなったんじゃなかったっけ?
>御大尽おおう orzodaizinと打ったのにMSIMEの変換候補になく素で勘違い。
>i8008自分、i8080当時からIMTEL4004やINTEL8008をPackageの刻印からいiと省略していました。一般的じゃなかったのか。 https://en.wikipedia.org/wiki/Intel_8008#/media/File:KL_Intel_C8008-1.jpg [wikipedia.org]
>80系CPUでは1命令で2つのレジスタを指定する命令も多いまさしく、3bitの命令フィールドとレジスタ選択フィールドのことを言ったつもりでした。80系CPUでは2レジスタ指定はMOV命令しかありません。それだけで8bitの1/4を使ったため、他の命令は暗黙にAレジスタを対象とする1レ
> 命令フィールドに4bit区切りなんてなかったと思います?> 演算処理が3bit単位なんて主張はしていません。
命令フィールドの話と区別するために「4bit区切りの演算命令」と書いたんですが…命令フィールドの区切りなんてCPU設計の中ではそう大きなウェイトを占めるものではなく設計を左右する要因は他にたくさんあるのに、なんで命令フィールドのビット数のような些細なことにこだわってるんですか?
うろおぼえだけどタイミング的には486登場時で、その時点では当然386も現役バリバリ。数字5桁は多いと感じたのか新CPUの名前は「486」、それに合わせて「80386」は「386」に改名して商標を取ろうとしたけど「ただの数字3桁を商標とは認めん」と却下された。なので「i386」への改名と「i486」デビューは同時といっていいはず。
元が6bitの文字コードの残滓が3bit区切りの命令フィールドだという話題だったので、命令フィールドの区切り以外の話をするつもりがなかっただけです。 4bit区切りの演算命令なんて命令フィールドと無関係の話が突然出てきたようなので、そんな話はしていなくて命令フィールドの話だけしていたんだよ、と話の主題を確認しました。
ユーザーが品名のINTELをiと省略するようになったのは、システム名のiAPX86とかとごっちゃになったからかも。iAPXは、Intel Advanced Performance Extensionsの略で、CPUと周辺チップを合わせた呼称。商標云々はデマで、元々のiAPX432がポシャって悪いイメージがついたので、傷ついたブランドを改めるためだったとも聞く。詳しくないけど本当に商標を申請したり却下されたりしたなら、公的な記録が見れるはずだけどどこを探せばいいんだろう。
なるほどです。こちらも動機は似たようなもので、文字コードの話をしていたのに突然「3bit」という数字が一致しているだけで関連があるとは思えない命令フィールドの話を持ち出されたことにつっこみたくなったわけで。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人はmoriwaka -- Anonymous Coward
見慣れぬ略字にノックアウトされた (スコア:0)
https://forest.watch.impress.co.jp/docs/serial/yajiuma/1597030.html [impress.co.jp]
>魔法少女の「魔」を「广」(まだれ)のなかに「マ」と書いたり、機械の「機」を「木」偏に「キ」と略したりするじゃないですか。ああいった文字もUnicodeにあれば何かと便利じゃないですか?
自分の身の回りでは全然見ない略字で、違和感が……。
マイナーメジャーの類い?
Re:見慣れぬ略字にノックアウトされた (スコア:1)
手書きだとそれなりに使われてたけど電子化で使う機会が減った略字ですね。
他に思い浮かぶのは「門」(門構え)の略で⊓の横線中央に交差するように短い縦線を入れるやつ
國→国のように略字から正式な漢字になったものもたくさんある。
Re:見慣れぬ略字にノックアウトされた (スコア:1)
その門の字形は略字というか行書体ですね(行書体自体が略字の一種ではありますが)。
簡体字では正式な字形となっています。
元レスの「广マ」は、今は電撃マオウという誌名の雑誌が、創刊当時の誌名に使ってた記憶。(マはさらに丸囲み文字にしていたんだったっけ)
Re: (スコア:0)
第、曜、職、前なんかも略字ありますよね
全部正式な文字ではないのかな
Re:見慣れぬ略字にノックアウトされた (スコア:1)
そう言う意味では「弁」は略字で、元の字は、
「辨」…正しいか否かを分ける→「弁明」
「瓣」…花びら→「花弁」
「辯」…述べる→「弁護」
とか。
いまや、元の字を弁別できない人の方が多い。
「弁別」は「辨別」な。
Re:見慣れぬ略字にノックアウトされた (スコア:1)
内田百閒,1939,「腰辨の辯」,新潮社,(文庫版「御馳走帖」,1979,中公文庫).
Re: (スコア:0)
文字としては同じ意味なんだから、同じコードでフォントフェイスで対応しろ、というのが昔のユニコードだったと思うのですが、今では違うのでしょうか。
だったら全角半角が曖昧幅の文字も全部別々のコードに振りなおしてほしいな。
Re: (スコア:0)
今はIVRで対応かな。
ただ略字ブロックの提案となると、「同じ意味」の厳格化や意味の追加に近い。
丸囲み文字とか白抜き文字とか。「~のコード文字を簡略化したものですよ」という意味づけになるんじゃないかな。
Re: (スコア:0)
Unicodeは世界中の文字を扱えることを目指したものなので文字幅は文字によって違うのが当たり前なので、全角半角はJISなどとの相互運用のための例外的対応でしかないんだよな。
まあ当初のポリシーに無理があることがわかって一貫性がなくなってしまった箇所は他にもたくさんあるけど。
Re: (スコア:0)
文字としては同じ意味なんだから、同じコードでフォントフェイスで対応しろ、というのが昔のユニコードだったと思うのですが、今では違うのでしょうか。
その前提は最初から嘘だったからなあ。アルファベットの大文字小文字、キリルやギリシャ文字は統一しなかったよね。
Re: (スコア:0)
キリルやギリシャ文字は何もしらないんですが
アルファべットの大文字小文字統一はASCIIコード互換を持たない分効率的な面もでるって感じになるのかなあ
Re: (スコア:0)
検索だけ考えればそうだろうけど、大文字のみまたは小文字のみでしか記録できないコードでは文書データの保存方法としては使い物にならないからまったく普及しなかったよ。
断言できる。
Re: (スコア:0)
Han unificationはまさにそういうレベルの失敗だったのですよ。
「同じコードでフォントフェイス」云々は16bitに収める為の筋の悪い方便。
Re: (スコア:0)
大昔の文字コードはコントロール文字を含めて6bitで1byteだった時代もあったと聞く。1byteの小文字の前にシフト文字を置くと大文字扱いらしい。
CPUの命令長は6bitの倍数が都合がよく、18bit固定長か12bit固定長が選ばれた。3bitずつに区切って数値は8進数で表現し、8本のレジスタを選択した。
御大臣のIBMが8bitを1byteとした後も、小規模な回路が求められた分野では3bit区切りの古い設計が生き残り、その時代のi8008の末裔は今も3bit区切りに縛られている。
Re: (スコア:0)
重箱の隅だけど気になってしまった。
> 御大臣のIBM
「御大」(おんたい)のことかな…「御大尽」(おだいじん)と混ざった?
> i8008
IntelのCPU名が「i+数字」となったのは「80386」を「i386」と表記するようになって以降のことで、8008にiをつけるのは一般的ではないと思う。
それに8008が「3bit区切りに縛られてる」って何のことやら?命令長は8bitの倍数しかないですよね?
80系CPUでは1命令で2つのレジスタを指定する命令も多いので、命令長を8bitに収めようとすればそのうちレジスタ選択フィールドに回せるのは3bitとなるし、それにレジスタ数は回路規模にも関わる要素なので当時は8個くらいが手ごろなところでしょう。
80系CPUは命令コードに3bitのフィールドを持っている程度で、実際の演算処理などに3bit区切りなんて出てきません。
むしろZ80などでBCD演算のために4bit区切りの演算命令が追加された。
Re: (スコア:0)
>IntelのCPU名が「i+数字」となったのは「80386」を「i386」と表記するようになって以降のことで
486の時に商標問題でそうなったんじゃなかったっけ?
Re: (スコア:0)
>御大尽
おおう orz
odaizinと打ったのにMSIMEの変換候補になく素で勘違い。
>i8008
自分、i8080当時からIMTEL4004やINTEL8008をPackageの刻印からいiと省略していました。一般的じゃなかったのか。
https://en.wikipedia.org/wiki/Intel_8008#/media/File:KL_Intel_C8008-1.jpg [wikipedia.org]
>80系CPUでは1命令で2つのレジスタを指定する命令も多い
まさしく、3bitの命令フィールドとレジスタ選択フィールドのことを言ったつもりでした。
80系CPUでは2レジスタ指定はMOV命令しかありません。それだけで8bitの1/4を使ったため、他の命令は暗黙にAレジスタを対象とする1レ
Re: (スコア:0)
> 命令フィールドに4bit区切りなんてなかったと思います?
> 演算処理が3bit単位なんて主張はしていません。
命令フィールドの話と区別するために「4bit区切りの演算命令」と書いたんですが…
命令フィールドの区切りなんてCPU設計の中ではそう大きなウェイトを占めるものではなく設計を左右する要因は他にたくさんあるのに、なんで命令フィールドのビット数のような些細なことにこだわってるんですか?
Re:見慣れぬ略字にノックアウトされた (スコア:1)
うろおぼえだけどタイミング的には486登場時で、その時点では当然386も現役バリバリ。
数字5桁は多いと感じたのか新CPUの名前は「486」、それに合わせて「80386」は「386」に改名して商標を取ろうとしたけど「ただの数字3桁を商標とは認めん」と却下された。
なので「i386」への改名と「i486」デビューは同時といっていいはず。
うじゃうじゃ
Re: (スコア:0)
元が6bitの文字コードの残滓が3bit区切りの命令フィールドだという話題だったので、命令フィールドの区切り以外の話をするつもりがなかっただけです。
4bit区切りの演算命令なんて命令フィールドと無関係の話が突然出てきたようなので、そんな話はしていなくて命令フィールドの話だけしていたんだよ、と話の主題を確認しました。
Re: (スコア:0)
ユーザーが品名のINTELをiと省略するようになったのは、システム名のiAPX86とかとごっちゃになったからかも。
iAPXは、Intel Advanced Performance Extensionsの略で、CPUと周辺チップを合わせた呼称。
商標云々はデマで、元々のiAPX432がポシャって悪いイメージがついたので、傷ついたブランドを改めるためだったとも聞く。
詳しくないけど本当に商標を申請したり却下されたりしたなら、公的な記録が見れるはずだけどどこを探せばいいんだろう。
Re: (スコア:0)
なるほどです。
こちらも動機は似たようなもので、文字コードの話をしていたのに突然「3bit」という数字が一致しているだけで関連があるとは思えない命令フィールドの話を持ち出されたことにつっこみたくなったわけで。