3

Я пытаюсь написать программу с функцией проверки орфографии / автозаполнения. Для этого мне нужен приличный размерный список наиболее распространенных английских слов. Проблема, с которой я столкнулся, заключается в том, что в размерах списков, которые я нашел, есть большое несоответствие. Они или <1000 слов или> 50000. Список из <1000 слов слишком короткий, и многие полезные слова опущены. Тем не менее, список из> 50 000 слов начинает становиться немного больше для моего алгоритма (по скорости).

Кто-нибудь знает список ~ 3000-12000 английских слов. Желательно в .txt файле. Кроме того, он должен иметь относительно неограниченную лицензию (то есть распространяемую).

3 ответа3

4

Попробуйте список наиболее часто употребляемых английских слов в Викисловарь. Бери столько, сколько хочешь!

2

http://wordlist.sourceforge.net/ имеет список слов. Я бы вообще предположил, что добавление большего количества слов вообще не будет требовать значительных вычислительных ресурсов (поскольку в худшем случае это длина сравнения списка слов и, вероятно, быстрее, если вы используете словарь или другое оптимизированное будущее данных).

0

http://www.gnu.org/software/miscfiles/ Содержит список слов в файле слов.

$ wc -w words extra.words 
  234937 words
  121847 extra.words
  356784 total

Числа никогда не врут ....

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .