одна запись в базе данных:
LPE-1*story#1/1 of pearl#1/2*historia de la perla*storia della perla* histoire de la perle* história da pérola*istoria perlei*TOPIC
Поля разделены звездочками *. Они есть:
sentence ID|English NP|Spanish translation|Italian translation|French translation|Portuguese translation|Romanian translation|Semantic relation
Английское поле NP имеет следующий формат:
noun1#sense/i [preposition] noun2#sense/j
где i и j могут быть равны 1 или 2, указывая положение семантического аргумента в экземпляре NP (обратите внимание, что предлог может отсутствовать). Например, в стуле экземпляра NP # 1/2 рука # 1/1, которая кодирует отношение части-целого (PW), стул существительного указывает целое (и, таким образом, помечается как 2), а рука существительного кодирует часть (и помечено как 1).
Проблема:
Напишите сценарий оболочки, содержащий комбинацию команд UNIX и AWK, которая даст ответ на следующие вопросы. Сценарий оболочки должен выполняться только один раз и выводиться (на стандартный вывод, если не указано иное):
- количество английских экземпляров NP в файле;
- количество уникальных английских NPs (рассмотрим для этого все поле $ 2);
- список уникальных семантических отношений, рассматриваемых в этой базе данных (сохраните в «sr.uniq.txt»);
- частота каждого семантического отношения в базе данных в следующем формате: частота Semantic_relation (сохраните в "sr-freq.txt");
Как сделать вопрос 2,3,4