Вы можете поблагодарить программистов от Linux до Big Blue и Microsoft за это. Хорошо известен тот факт, что TextPad в качестве примера в мире сценариев не обрабатывает многобайтовые символы, которые используются для различных восточных диалектов, таких как кандзи и другие. Несмотря на то, что вам трудно сохранять код легким и аккуратным, программисты на Востоке не могут использовать такие программы, как ваша командная строка или более низкие программы, которые не могут обрабатывать многобайтовые символы.
Это сводится к этому - кодирование из UTF-8 в Big Endian и так далее ..
http://en.wikipedia.org/wiki/Variable-width_encoding
Надеюсь это поможет.