Я ищу быстрое и грязное, а также легко повторяемое решение для удаления нечисловых данных из столбца в электронной таблице для импорта в базу данных MySQL. Пример:
(123)456-7890 fred
Это все в одной ячейке в Microsoft Excel; один столбец. Записи не в стандартизированном формате.
- Большинство строк не имеют дополнительного имени, но некоторые имеют. Название лишнее, мне нужны только цифры.
- Для международного набора номера - я полагаю, но я не уверен - существует проблема с ведущими нулями, если номер телефона рассматривается как целое число. Но я не обеспокоен. Числовой результат в виде целого числа - это то, что мне нужно.
- Номер телефона может быть в различных общих форматах, не обязательно соответствующих этому примеру из 13 символов, с кодом города в скобках и разделением дефиса для последних 4 цифр. Например, он может иметь начальную цифру, например 0 или 1, код города может быть разделен дефисом, а не заключен в скобки и т.д.
Я не хочу исключать какой-либо конкретный подход, но проблема, похоже, поддается решению, которое удаляет нечисловые символы, а не пытается расшифровать и проанализировать все возможное содержимое.
Я импортировал его в Google Spreadsheet, чтобы создать резервную копию. Я пользователь Linux, поэтому не имею доступа к нативному Microsoft Excel, как это было получено. Однако у меня есть доступ к Libre Office.
Я знаю, что я могу использовать регулярные выражения MySQL для этой цели, как описано в этой теме.
Что дает несколько вариантов. Я просто думал, что в LibreOffice или Google Spreadsheet может быть инструмент для этого. Я немного опасаюсь запускать его через веб-приложение, в зависимости от того, чье это веб-приложение.
Желаемый формат: