Changes between Version 2 and Version 3 of PythonJISX0213


Ignore:
Timestamp:
04/03/09 17:00:23 (10 years ago)
Author:
sgk
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • PythonJISX0213

    v2 v3  
    2424でも、電子メールでもウェブでも「㍑」などのJIS2004の文字をやりとりできるのが普通。 
    2525つまり、 
    26  * `charset`は、`iso-2022-jp` 
     26 * `charset`には`iso-2022-jp`が指定されている 
    2727 * 「㍑」などJIS2004の文字をエンコードできてしまう。 
    2828 * エスケープシーケンスは、`iso-2022-jp`のやり方。「㍑」は「`\033$B-H\033(B`」。 
     
    3131「㍑」は今や「機種依存文字」ではないのにね。 
    3232 
    33 Pythonで電子メールやウェブのデータを処理しようとして、`charset`に`iso-2022-jp`と書いてあったからと言って、素直に`iso-2022-jp`でデコードしようとすると、「㍑」を含んでいるとエラーになる。しかし、`iso-2022-jp-2004`でデコードしてもエラーになる。なぜならば、JIS2004に厳密に従うならば、上記の例の「`\033$B-H\033(B`」というデータは存在し得ないから。 
     33Pythonで電子メールやウェブのデータを処理しようとして、`charset` に `iso-2022-jp` と書いてあったからと言って、素直に`iso-2022-jp`でデコードしようとすると、「㍑」を含んでいるとエラーになる。しかし、`iso-2022-jp-2004`でデコードしてもエラーになる。なぜならば、JIS2004に厳密に従うならば、上記の例の「`\033$B-H\033(B`」というデータは存在し得ないから。 
    3434 
    3535苦肉の策、別名「ハック」。