Есть ли простой способ найти все файлы в определенном каталоге, которые имеют какие-либо не-ASCII (т.е. Юникод) символы в имени файла? Я использую Windows XP x64 SP2, файловую систему NTFS.
2 ответа
11
Вот метод, использующий Powershell:
gci -recurse . | where {$_.Name -match "[^\u0000-\u007F]"}
5
Я закончил писать сценарий Python для этого. Размещение на случай, если это кому-нибудь поможет. Не стесняйтесь, чтобы перейти к StackOverflow.
import sys, os
def main(argv):
if len(argv) != 2:
raise Exception('Syntax: FindUnicodeFiles.py <directory>')
startdir = argv[1]
if not os.path.isdir(startdir):
raise Exception('"%s" is not a directory' % startdir)
for r in recurse_breadth_first(startdir, is_unicode_filename):
print(r)
def recurse_breadth_first(dirpath, test_func):
namesandpaths = [(f, os.path.join(dirpath, f)) for f in os.listdir(dirpath)]
for (name, path) in namesandpaths:
if test_func(name):
yield path
for (_, path) in namesandpaths:
if os.path.isdir(path):
for r in recurse_breadth_first(path, test_func):
yield r
def is_unicode_filename(filename):
return any(ord(c) >= 0x7F for c in filename)
if __name__ == '__main__':
main(sys.argv)