Есть ли способ получить количество слов слов естественного языка в Markdown (или, лучше, Pandoc Markdown), через командную строку? Можно просто использовать wc
чтобы получить очень приблизительную оценку, но wc
наивен и считает все, что окружено пробелом, словом. Это включает в себя такие вещи, как форматирование заголовка, маркеры и URL-адреса в ссылках.
Что было бы идеально, так это удалить все форматирование уценки (включая цитаты Pandoc, если это возможно), а затем пропустить это через wc
, но я не могу найти способ сделать это, так как выходной формат открытого текста pandoc
прежнему включает в себя много стиля уценки.