Я работаю над личным проектом, довольно простым веб-шабером. Мои результаты хранятся в формате CSV с заголовком, URL и идентификатором. ID содержит строки результатов, найденных при сопоставлении с регулярным выражением (например, ячейка ID может быть "1234567", "1111111 2222222" и т.д.) Разделение ячеек на столбцы тривиально, но как я могу легко разделить эти идентификаторы, сохраняя ссылки на соответствующие заголовок и URL? Я работаю с парой тысяч страниц, так что работать вручную - не самый лучший вариант.
Пример:
Начальное:
"Домашняя страница", foo.bar/home, 1111111 2222222
После:
"Домашняя страница", foo.bar/home, 1111111
"Домашняя страница", foo.bar/home, 2222222