1

У меня есть Windows 2012
Оперативная память: 32 ГБ ОЗУ, процессор I7, 1 ТБ, SSHD

у меня есть .txt файлы списков слов в строках txt файлы начинаются с 2GB до 50GB

какие инструменты или программы могут работать в таком большом размере / строках, чтобы объединить все файлы в 1 файл .txt, а затем работать в этом 1 файле .txt, который может быть 100 ГБ после того, как все объединено / объединено

удалить дубликаты строк с помощью CauseSinstive и не вылетать, не зависать и не зависать? я знаю, что задал вопрос, похожий на этот, но я не получил ничего простого

помогите мне, я не очень разбираюсь в кодах cmd, которые используют люди, поэтому, если это возможно, кто-нибудь расскажет мне о программе, действительно может сделать это без проблем или с помощью cmd с легким объяснением для начинающих

как то, что мне нужно сделать по шагам и как это сделать в конце мне нужно что-то не разбить мой компьютер или быть очень медленным

я попытался emeditor до сих пор не может работать в 10 ГБ файла и он начал очень медленно, пожалуйста, помогите мне

2 ответа2

1

Лучший инструмент для управления огромным TXT-списком слов для Windows: Unified List Manager (ULM)

УСМ

Вы можете сортировать, объединять, разбивать, удалять дубликаты и многое другое.

0

Вы уже спрашивали здесь: как объединить большие текстовые файлы размером 10 ГБ + в 1 текстовый файл и удалить дубликаты строк из этого 1 текстового файла самым быстрым способом? ,

Я все еще рекомендовал бы загрузить Linux (Ubuntu или Mint или что-то еще) и записать его на CD или создать загрузочный USB-накопитель, а затем начать без установки. Тогда вы можете сделать то, что я рекомендовал здесь https://superuser.com/a/1250792/715210

Или вы устанавливаете Windows 10 Linux Bash Shell: https://www.howtogeek.com/249966/how-to-install-and-use-the-linux-bash-shell-on-windows-10/
Я думаю, что команды здесь https://superuser.com/a/1250792/715210 должны работать, они действительно являются основными командами Linux.

Изменить: я проверил его с Win10 Pro (вы не упомянули вашу ОС). Шаг за шагом установите Windows Linux Bash и объедините файлы aa.txt и bb.txt в newfile.txt с удалением дубликатов (при условии, что ваши файлы находятся в C:\temp):

  1. Win+I, чтобы открыть настройки
  2. Обновление и безопасность -> для разработчиков: выберите режим разработчика
    • режим разработчика будет установлен
  3. Win+R -> "панель управления" -> ввод
  4. Программы и функции слева "Программы" или "Активация Windows"
    • Выберите "Подсистема Windows для Linux Beta"
  5. перезагружать
  6. Нажмите Win, затем найдите "bash" и откройте
  7. Есть несколько подсказок, на которые вы должны ответить "Y", и вас попросят указать имя пользователя с паролем.
    • Баш установлен сейчас.
    • ваш диск C: теперь доступен в /mnt /c.
  8. напишите cd /mnt/c/temp/ (или ваш путь), затем нажмите Enter
  9. написать cat aa.txt bb.txt | sort -u > newfile.txt
    • если это не работает, вы можете сначала попытаться объединить файлы в один файл с помощью cat aa.txt bb.txt > tempfile.txt затем выполнить команду сортировки, например sort -u tempfile.txt > newfile.txt

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .