Шрифты старых документов (<2000), как правило, выглядят растрепанными на моей коробке с Linux. Это почему?
Есть статья: http://acl.ldc.upenn.edu/H/H94/H94-1048.pdf
Шрифты старых документов (<2000), как правило, выглядят растрепанными на моей коробке с Linux. Это почему?
Есть статья: http://acl.ldc.upenn.edu/H/H94/H94-1048.pdf
Это почти наверняка связано с процессом сканирования (использовалось ли оптическое распознавание текста или нет). Журналы начали использовать электронные публикации сравнительно поздно. Большинство старых документов были отсканированы в PDF-файлы из оригинальной печатной бумажной версии. Вот почему шрифты выглядят странно для вас.
То, на что вы смотрите, - это изображения, сделанные со шрифтами и затем (возможно) пропущенные через программное обеспечение OCR, чтобы превратить их в текст. Новые документы выглядят лучше, потому что они были созданы как PDF-файлы напрямую.