Я пытаюсь использовать пакет biocreative-ppi от NLTK в Google Colab Laboratory и на моем персональном ноутбуке. Однако, несмотря на то, что я могу загрузить пакет biocreative-ppi из NLTK, я не могу получить доступ к пакету biocreative_ppi. Я сделал следующее:

  • Удалил и переустановил пакет nltk на моем ноутбуке и в Google Colab Laboratory
  • Пробовал скачивать другие пакеты с НЛТК. Я успешно загрузил коричневый
  • Записано biocreative_ppi как biocreative, bcppi, bc_ppi и т.д.

Вот сайт для biocreative_ppi. Как видите, пакет не устарел. Это все еще должно быть доступно.

Вот код из моей записной книжки:

import subprocess
import nbformat
import json, os
import random
import spacy
import nltk
import nltk.corpus
nltk.download('brown')
nltk.corpus.brown
nltk.download('biocreative_ppi')
nltk.corpus.biocreative_ppi
[nltk_data] Downloading package brown to /root/nltk_data...
[nltk_data]   Unzipping corpora/brown.zip.
[nltk_data] Error loading biocreative_ppi: Package 'biocreative_ppi'
[nltk_data]     not found in index
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-4-4f6d73ab2d12> in <module>()
      2 nltk.corpus.brown
      3 nltk.download('biocreative_ppi')
----> 4 nltk.corpus.biocreative_ppi

/usr/local/lib/python3.6/dist-packages/nltk/lazyimport.py in __getattr__(self, name)
    120                   'Module load triggered by attribute %r read access' % name)
    121         module = self.__lazymodule_import()
--> 122         return getattr(module, name)
    123 
    124     def __setattr__(self, name, value):

AttributeError: module 'nltk.corpus' has no attribute 'biocreative'

В приведенном выше примере показано, что я могу получить доступ к коричневому цвету. Следующий код покажет, что я могу успешно загрузить biocreative_ppi, но не могу получить к нему доступ.

import subprocess
import nbformat
import json, os
import random
import spacy
import nltk
import nltk.corpus
nltk.download('biocreative_ppi')
nltk.corpus.biocreative_ppi
[nltk_data] Downloading package biocreative_ppi to /root/nltk_data...
[nltk_data]   Package biocreative_ppi is already up-to-date!
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-2-bcfe9c01d5cf> in <module>()
      1 nltk.download('biocreative_ppi')
----> 2 nltk.corpus.biocreative_ppi

/usr/local/lib/python3.6/dist-packages/nltk/lazyimport.py in __getattr__(self, name)
    120                   'Module load triggered by attribute %r read access' % name)
    121         module = self.__lazymodule_import()
--> 122         return getattr(module, name)
    123 
    124     def __setattr__(self, name, value):

AttributeError: module 'nltk.corpus' has no attribute 'biocreative_ppi'

Мне известно, что набор данных biocreative_ppi также доступен через GitHub от Kaggle и Biocreative. Однако я не понимаю, почему я могу загрузить biocreative_ppi через nltk, но не могу получить доступ ни к одному из подкаталогов или файлов, связанных с biocreative_ppi. Пожалуйста, дайте мне знать, если вы можете мне помочь. Спасибо за ваше внимание, и я открыт для любых предложений.

0