初級者でも解る「とりあえずUTF-8にしとけ」っていう歴史的背景。

6年弱前、HTMLタグ打ちを覚えたての頃の文字コードは「Sfhit_JIS」一択でした。

しかしCMSやフィーチャーフォンサイト、PHPなどのサーバサイド言語やデータベースを触りだした
4年前頃から今日に至るまで 、「とりあえず文字コードはUTF-8にしとけば問題ない。」 に、
いつのまにやら なっていました。

どこかでそう教わったのか、他のサイトや本がそうだったからそうしてきたのか、、、
最近まで別段意識することもなくおりましたが、改めて学ぶ機会があり、
理解が深まったため、備忘録として「とりあえずUTF-8にしとけ」のハラオチ内容をまとめておきます。


1982年、マイクロソフトと日本企業数社がShift_JISを策定した



パソコンの世界では文字には符号(番号)がふられており、プログラムの奥底では番号でこの文字を管理しています。

1982年、マイクロソフトと日本企業数社でこの番号を策定し、JIS規格に登録したのが
コード規格「Shift_JIS」です。


一方その頃、ワークステーションでは...


一方、UNIXというOSを乗せたワークステーションと呼ばれるコンピュータは
パソコンとは別世界のコンピュータ。

こちらの世界でも1980年代前半に文字に番号が振られました。
それは「EUC-JP」という文字コード規格。
Shift_JISとはまったく違う番号でした。しかし、問題ありません。

だってオラは、ワークステーションだから、、、、(パソコンとは別の世界だから)。

shift_jis-euc_jp.jpg


...しかぁーし!


199X年...世界はWindowsの炎に包まれた!


1995年、Windows95が発売され、パーソナルコンピュータでインターネットをする時代...そう、
WindowsのパソコンでUNIXサーバのWebサイトを閲覧する時代が到来しました!

そこではパソコンのShift_JISとサーバのEUC-JPの衝突が起こり、
プログラムによる文字コードの変換に失敗した結果、文字化けが起こってしまった!

mozibake.jpg

多くのサーバはUNIXやLinuxなので、
PHP等はサーバサイドの文字である「EUC-JP」で記載することが正しくなりました。

...だが!


世紀初覇者文字コード「UTF-8」が登場!


UTF-8はUnicodeという文字コードの一種で、Unicodeは世界中すべての文字に番号を振って
使えるようにしようという考え方から生まれた規格。

そう、世界基準のデジュアスタンダード(公的標準)でデファクトスタンダード(業界標準)?なコード規格なのです!日本のフィーチャーフォンの絵文字にまで番号が降られているほどの徹底ぶりだそう。


...ということでこの先よほどの変化やらイノベーションやらが無い限り、UTF-8にしておけばアンパイということで、、、、巡り巡り、冒頭の私の「とりあえずUTF-8使っとけ」のところにも至ったようです。


※さらにUTF-8だけでなくUTF-16とあったりします、、、、
その辺り、詳しくは下記サイトがわかりやすいのでご参考下さい。

また、UTF-8とUTF-8nというのもあります。
そのあたりについては下記のサイト等をご参考下さい。

Dreamweaverだと
bpm.jpg
このチェックを外しておかないと、サーバサイドで動かす
テンプレートファイルなんかはちょっとした問題を起こしたりしますね。



理解を深めることで知識になり、経験と結びついて知恵となる

少なくとも私自信HTMLを学びだしたのが2006年、サーバサイドを知りだしたのが2008年なので
全く詳しくありませんでした。が、端的にでも、歴史的背景を学んだことで理解を深めることができました。

Web技術やPCには特に、
「そういうもんだから」と、深く考えることなく、使用しつづけている技術や概念が
多いかもしれません。(実際、なぜなぜ?と深く理解しなくても使えるし、困らない)

しかし背景や歴史を知り理解を深めることは、単なる知識習得というだけでなく、
普段の実務、他の業務にも活きる「知恵」となるのではないでしょうか。

個人的ではありますが小さな実例として、

「WebサイトからCSV(comma separated value)でダウンロードしたデータベースファイルは、
Shift_JISになおさずにエクセルで開くと、文字化けする」

ことの理由をキッチリと理解できる事に繋がったのです。

commaseparatedvalue.jpg

この知識があるから、、、ミスの予防や他のサイトのデータでも同様になる場合・ならない場合の原因を、
すぐに紐づけて把握することができるようになったと思います。

ということで、時には技術の歴史的背景を学んでみる事も、新たな知恵を身に着ける切っ掛けになるかもしれません。
(Wikipediaは読んでも説明が難しくて、辞書ループになり、結局解らないことも多いですが;)

まあ今回のことは下記の書籍に書いてあったことを引用させていただき
なんだか北●の拳風な見出しでアレンジして書き直したようなもので、、、


PHPの本は7、8冊持ってますが、この本はプログラム初級者な自分にはかなり有益な一冊でした!

内容はページ数も少なく、プログラマで中級やベテランの方からすれば、超のつく初心者向けですが、
上記のような説明手法や、本の進め方、教え方にはベテランの方でも学ぶことは多いはず!

最後は本の紹介になってしまいました ;)

Share SocialMedia

Related

Commentコメント頂けると喜びます。

名前(ニックネーム)
コメントを書く

TrackBackこの記事を論及・引用、関連記事にして頂けたらありがたき幸せ。

PageTop

Search

Categoryを絞り込んで検索

Category

Calendar

show

Archive

AFFINGER4

Popularities

賢威
×