Я попытался воссоздать описанный сценарий, и мне кажется, что мне подходит следующее.
Шаги для воссоздания:
1. Open Word 2007
2. Лента.Вставить.Стол -> 2x2 Стол
3. Таблица 1.Ячейка (0,0) = 'a', Таблица1.C (0,1) = 'b', Таблица1.Ячейка (1,0) = 'c', Таблица1.Cell (1,1) = 'd'
4. Лента.Вставить.Стол -> 2x2 Стол
5. Таблица 2.Ячейка (0,0) = 'e', Таблица2.C (0,1) = 'f', Таблица2.Ячейка (1,0) = 'g', Таблица2.Cell (1,1) = 'h'
6. Офисная кнопка.Сохранить как.Другие форумы -> Word XML Document (* .xml)
7. Откройте файл в Notepad++ (моя версия 6.6.9)
Замечания:
1. Каждая таблица находится в теге <w:tbl> независимо от того, сколько таблиц мы создали в документе Word
2. Если значение не начинается с пробела, оно имеет следующую структуру <w:t> myValue </w:t>
3. Если значение начинается с пробела, оно имеет следующую структуру:<w:t xml:space = "preserve"> myValue </w:t>
Выводы:
1. Похоже, что нужно удалить это 'xml:space = "preserve"' И пробелы перед myValue
2. Требуется замена Regex
Решение:
1. В N++ введите Ctrl+ H (или Меню -> Поиск -> Заменить -> Заменить вкладку -> Режим поиска = "Регулярное выражение")
2. В «Заменить на:» оставьте пустое значение, а в «Найти что:» используйте это выражение »(?<= xml:space = "preserve">) (\s+) '(// исключая кавычки) и нажмите "Заменить все"
3. В «Заменить на:» оставьте пустое значение, а в «Найти что:» используйте это выражение «xml:space =" preserve "» и нажмите "Заменить все"
4. Сохранить документ
5. Открыть документ в Word
6. Сохранить как документ (х)