文字コードについていろいろ調べている。
文字をコンピューターのために数字に置き換えたもので、いわば人間の都合で恣意的に決まっているものだ。
それで「規格」を読まなければならない。
文字をコンピューターのために数字に置き換えたもので、いわば人間の都合で恣意的に決まっているものだ。
それで「規格」を読まなければならない。
日本人的に気になるのはJIS規格とUnicodeだ。
JIS規格の中でもJIS X 0208とJIS X 0213というのを見たいことが多い。
規格というのは決まりであって、規格書という本にまとまっているのだが、これがクソ高い。
前者が1万5千円、後者が1万2千円ほどもする。
JSA Web Store - JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化漢字集合
JSA Web Store - JIS X 0213:2000 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合
まあ、iPhoneを買ったりイタリアンを食べたり、6枚組のCDを買ったりしているのだから、規格書ぐらい買えばいいのだが、こんなもの、たまにちょっとしか見ない。
Webで見たい。
で、いちおう全部、無料で、Webで見ることが出来る。
たとえばJIS X 0208であれば下のページから行ける。
日本工業標準調査会:データベース-JIS詳細表示
これが見づらいのだ。
まず、ファイルが16個のPDFファイルに分割されている。
別に1章から16章まであって各章がおのおのPDFになっているわけではない。
ファイル1がまえがきと目次と10ページ目まで。
ファイル2が9ページ目から22ページまでという風に、不規則にぶった切られている。
印刷したものをそのままスキャンしてPDF化したものであって、超見づらい。
原発事故のときに東京電力のサイトに行くと、状況を知らせるペーパーが公開されていたのを見た人も多いだろう。
あんな感じである。
日本規格協会から出版されている『JIS漢字字典』という本の巻末付録に規格が載っていて、これを見ればいいと思っていたのだが、微妙に抜粋版なのである。
42ページの次が49ページだったりする。
この間に重要な「附属書4」があったりするのだ。
やっぱり仕事のことだから、お金を惜しまずに買ったほうがいいんだろうか。
でも俺なんか無職のプータローだから、そうとう手元不如意なのである。
ところが最近、アルファさんという方のブログに、このファイル名とページ数の対応表が載っているのを発見した。
JIS漢字規格票PDFの目次 ( ソフトウェア | PDF 分割 漢字 検索 翻訳 JIS 規格 部首 ) - アルファのブログ - Yahoo!ブログ
超助かる!
これこそが人の役に立つブログというものであろう。
ありがとうございます。
しかし見づらいのは変わらない。
PDFのリンクを押すと、まず、ダウンロードも印刷も出来ませんがいいですか、と言われる。
ハイと押しても、素直に表示されないことが多い。
ブラウザー組み込みのAdobe Readerが正しくインストールされていないとダメだというが、せいぜいやっているつもりである。
ぼくはとりあえずMacのSafari、Firefox、Chromeでダメだった。
WindowsのFirefoxでもChromeでもダメだった。
結局WindowsでInternet Explorerを使うとなんとなく見ることが出来たので、今はそれをJIS閲覧専用にしている。
JISのページを見ると「規格をうまく見ることが出来ない人へ」とお為ごかしのページがあって、いろんなことをツラツラ書いているが、ぼくのリテラシーがなくて、ついに見ることができなかった。
まあWindowsのIEで見ることができるからよしとする。
それはいいんだけど、たまに「システムエラーです、しばらく経ってから開けてみてください」と言われる。
そうかー、と思ってしばらく経ってから開けてみるものの、状況が変わらない。
結局OSを再起動するしかない。
困ったものだ。
ぼくの環境が悪いのかもしれないが、改善してください。
どうしようもなく比べてしまうのはUnicode Standardの見やすさである。
Unicode 7.0.0
自由自在にテキスト検索でき、コピー&ペーストできる。
コード表も、番号(Unicodeスカラー値)と文字名の両方から検索出来る。
Code Charts
漢字に関してはUnihan Databaseというものを使って部首検索することもできる。
Unihan Database Lookup
各文字の固有リンクを得られる。
「フカザワのサワは戸籍上はこの字です」などというとき、スッとリンクを送れるのである。
Unihan data for U+6FA4
便利で、使いやすく、使っていて楽しい。
ときどき夜中にいろいろな字を渉猟して過ごすことがある。
中学時代に買ってもらった辞書を用もなくめくって楽しんだのを思い出す。
JISもUnicodeを見習って、規格を見やすくしてもらいたい。
どうせ規格書を売ってそのあがりで食べているわけではないだろう。
私企業がお金のためにやっているUnicodeの方が、いやしくもわが日本国の国家標準であるJISよりも見やすいというのはどういうことか。
無料で、ネット上でいろんなJISがすらすら見られれば、世界中の若者がそれを見て、JISって面白いなあ、日本語って楽しいなあと思うのではないか。
先の戦争中、日本の戦闘機工場はネジ一つ取っても規格化されていず、前線では整備兵が名人芸でそれを補ったと言う。
日本はいくら技術があっても、こういうところでがんばらないと、グローバルに生き残っていけないのではないか。
フワフワした議論でゴメンナサイ。
JIS規格の中でもJIS X 0208とJIS X 0213というのを見たいことが多い。
規格というのは決まりであって、規格書という本にまとまっているのだが、これがクソ高い。
前者が1万5千円、後者が1万2千円ほどもする。
JSA Web Store - JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化漢字集合
JSA Web Store - JIS X 0213:2000 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合
まあ、iPhoneを買ったりイタリアンを食べたり、6枚組のCDを買ったりしているのだから、規格書ぐらい買えばいいのだが、こんなもの、たまにちょっとしか見ない。
Webで見たい。
で、いちおう全部、無料で、Webで見ることが出来る。
たとえばJIS X 0208であれば下のページから行ける。
日本工業標準調査会:データベース-JIS詳細表示
これが見づらいのだ。
まず、ファイルが16個のPDFファイルに分割されている。
別に1章から16章まであって各章がおのおのPDFになっているわけではない。
ファイル1がまえがきと目次と10ページ目まで。
ファイル2が9ページ目から22ページまでという風に、不規則にぶった切られている。
印刷したものをそのままスキャンしてPDF化したものであって、超見づらい。
原発事故のときに東京電力のサイトに行くと、状況を知らせるペーパーが公開されていたのを見た人も多いだろう。
あんな感じである。
日本規格協会から出版されている『JIS漢字字典』という本の巻末付録に規格が載っていて、これを見ればいいと思っていたのだが、微妙に抜粋版なのである。
42ページの次が49ページだったりする。
この間に重要な「附属書4」があったりするのだ。
やっぱり仕事のことだから、お金を惜しまずに買ったほうがいいんだろうか。
でも俺なんか無職のプータローだから、そうとう手元不如意なのである。
ところが最近、アルファさんという方のブログに、このファイル名とページ数の対応表が載っているのを発見した。
JIS漢字規格票PDFの目次 ( ソフトウェア | PDF 分割 漢字 検索 翻訳 JIS 規格 部首 ) - アルファのブログ - Yahoo!ブログ
超助かる!
これこそが人の役に立つブログというものであろう。
ありがとうございます。
しかし見づらいのは変わらない。
PDFのリンクを押すと、まず、ダウンロードも印刷も出来ませんがいいですか、と言われる。
ハイと押しても、素直に表示されないことが多い。
ブラウザー組み込みのAdobe Readerが正しくインストールされていないとダメだというが、せいぜいやっているつもりである。
ぼくはとりあえずMacのSafari、Firefox、Chromeでダメだった。
WindowsのFirefoxでもChromeでもダメだった。
結局WindowsでInternet Explorerを使うとなんとなく見ることが出来たので、今はそれをJIS閲覧専用にしている。
JISのページを見ると「規格をうまく見ることが出来ない人へ」とお為ごかしのページがあって、いろんなことをツラツラ書いているが、ぼくのリテラシーがなくて、ついに見ることができなかった。
まあWindowsのIEで見ることができるからよしとする。
それはいいんだけど、たまに「システムエラーです、しばらく経ってから開けてみてください」と言われる。
そうかー、と思ってしばらく経ってから開けてみるものの、状況が変わらない。
結局OSを再起動するしかない。
困ったものだ。
ぼくの環境が悪いのかもしれないが、改善してください。
どうしようもなく比べてしまうのはUnicode Standardの見やすさである。
Unicode 7.0.0
自由自在にテキスト検索でき、コピー&ペーストできる。
コード表も、番号(Unicodeスカラー値)と文字名の両方から検索出来る。
Code Charts
漢字に関してはUnihan Databaseというものを使って部首検索することもできる。
Unihan Database Lookup
各文字の固有リンクを得られる。
「フカザワのサワは戸籍上はこの字です」などというとき、スッとリンクを送れるのである。
Unihan data for U+6FA4
便利で、使いやすく、使っていて楽しい。
ときどき夜中にいろいろな字を渉猟して過ごすことがある。
中学時代に買ってもらった辞書を用もなくめくって楽しんだのを思い出す。
JISもUnicodeを見習って、規格を見やすくしてもらいたい。
どうせ規格書を売ってそのあがりで食べているわけではないだろう。
私企業がお金のためにやっているUnicodeの方が、いやしくもわが日本国の国家標準であるJISよりも見やすいというのはどういうことか。
無料で、ネット上でいろんなJISがすらすら見られれば、世界中の若者がそれを見て、JISって面白いなあ、日本語って楽しいなあと思うのではないか。
先の戦争中、日本の戦闘機工場はネジ一つ取っても規格化されていず、前線では整備兵が名人芸でそれを補ったと言う。
日本はいくら技術があっても、こういうところでがんばらないと、グローバルに生き残っていけないのではないか。
フワフワした議論でゴメンナサイ。