Если перейти по ссылке на YouTube, например, http://www.youtube.com/watch?v=1Jfm-92JXVE, и я хочу скопировать некоторые комментарии в блокнот, я обнаружу, что текст по-прежнему меньше, чем другой текст.

Если я выберу все это и нажму горячую клавишу PureText, он все равно не удалит форматирование. Если я выберу все и "поменяю" все на один шрифт и размер шрифта (он уже был), это не сделает все это одним размером.

4 ответа4

1

Хотя в тексте нет никакого форматирования, кажется, что текст содержит символы Юникода (в отношении которых я не уверен), я предполагаю, что это является причиной проблемы. Быстрый способ их удаления - сохранить текстовый файл в формате ASCII и снова открыть его.

0

Основываясь на ответе R4D4, я предлагаю следующее (у меня / обоих сработало):

1) Используйте Блокнот Windows:

  • (а) вставьте текст в новый файл в блокноте Windows
  • (б) удалить любые непреднамеренные / скрытые символы, которые появляются, например, мягкие дефисы (см. ответ barlop в этой теме: Копирование текста из YouTube в буфер обмена приводит к появлению черточек? )
  • (c) сохраните его как файл ANSI (примечание: здесь появится предупреждающее сообщение, если текст содержит символы Юникода; нажмите «ОК»)
  • (d) открыть файл ANSI, созданный на предыдущем шаге
  • (e) скопируйте и вставьте текст в нужное место

2) Используйте Блокнот ++

  • (а) вставьте текст в новый файл в Notepad++
  • (б) удалить любые странные символы, которые могут появиться **
  • (c) изменить кодировку с UTF-8 на ANSI
  • (d) снова удалите любые странные символы, которые могут появиться
  • (e) скопируйте и вставьте текст в нужное место

** Это предполагает, что ваши настройки Notepad++ следуют настройкам по умолчанию для создания новых файлов с кодировкой UTF-8. Проверка на непреднамеренные символы в обеих кодировках может быть необходимой, поскольку некоторые проблемные символы не выглядят странно в ANSI и их легче обнаружить в UTF-8 (например, мягкие дефисы: см. Ответ barlop в этой теме: Копирование текста из YouTube в буфер обмена вводит черточки? ).

0

Вы можете найти этих вне диапазона символов и решить, что с ними делать .. Некоторые из них могут быть вьющимися цитатами. Вы могли бы просто хотеть заменить те с прямыми кавычками. Но другие будут вашими неприятными персонажами, которые блокнот может не обработать, и вы захотите их удалить.

Так что для блокнота ++ находка [\x{0080}-\x{FFFF}]

Обратите внимание, что вы нажали на вкладку замены, чтобы найти / заменить.

Выше должно быть достаточно, но некоторые дальнейшие объяснения

Диапазон ascii составляет 0000h-007Fh, то есть base10, 0-127. Так что, если вы ищете любой юникод вне этого, то есть 128+, то есть 80h-FFFFh, то вы можете найти эти символы. Синтаксис регулярного выражения имеет концепцию диапазона символов, поэтому [AZ] будет любым символом между A и Z в Unicode. А в notepad++ вы указываете символ с кодом utf-16 с обозначением \x {...}, где ... - шестнадцатеричный код, поэтому для 'A', шестнадцатеричный код которого равен 41, вы должны указать \x {0041 }. Editpad будет использовать \u .... например, \u0041 . Так что в editpad pro вы бы сделали [\u0080-\uFFFF] . В блокноте ++ вы бы сделали, как на картинке выше. [\x{0080}-\x{FFFF}] Обратите внимание, что его синтаксический аспект в регулярном выражении тот же, но способ задания символа различается в разных текстовых редакторах.

0

по какой-то причине я могу выбросить что-нибудь в блокнот, и все форматирование удаляется без сохранения. кроме простого текста остаются только некоторые вкладки. Использование Win 7 Home Premium версии 6.1 SP1 и другие советы на http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm и http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove -text-форматирование, когда-копирования-и-pasting.html

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .