Я хочу найти специальные символы в текстовом файле. Известно, что файл в кодировке UTF-8 содержит

Chinese characters , 
"-", 
"^A"(control-A, which is one of special characters), 
numbers, 
alphabets, and 
some other characters. <- This is what I want to find out.

Я использую Vim в Linux, чтобы найти другие специальные символы.

я использовал

/[^^A0-9a-zA-Z-] 

чтобы найти это, но это также покажет китайские иероглифы. Как отфильтровать китайские символы и показать только другие специальные символы в файле?

1 ответ1

0

Диапазон кодовой точки Unicode для CJK UNIFIED IDEOGRAPHS составляет 0x4E00-0x9FFF ; вам придется исключить этот диапазон символов из вашей [...] коллекции (возможно, используя атом регулярного выражения \%uNNNN ).

К сожалению, в настоящее время Vim не может искать диапазоны длиннее 256 символов, поэтому вам придется объединить несколько коллекций ([...]\|[...]\|[...]\|...) или выберите другой подход.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .