Я видел пару вопросов здесь, которые похожи на то, что я думаю, но не совсем. Итак, я решил спросить и посмотреть, что выпадет.
В основном, у меня есть 2 или 3 старых, более медленных ноутбука. То, что я хотел бы сделать, - это кластеризовать эти компьютеры, чтобы выполнить на них некоторые "смущающие параллельные" процедуры анализа данных (например, обучить алгоритм машинного обучения множеству разных ядер). Чтобы быть более конкретным, я хочу запустить код Python (scikit-learn, который может работать на разных ядрах) в этом кластере.
В идеале я хотел бы иметь кластер с 3 ноутбуками, соединенными вместе, и устройство хранения данных (1-2 ТБ), подключенное к сети. Затем я хотел бы написать сценарии для анализа данных на моем текущем ноутбуке, каким-то образом получить доступ к кластеру (ssh?) И запустить сценарии для данных, хранящихся на подключенном устройстве, в то же время разделив анализ между различными ноутбуками. Мысли?
Я читал о кластерах Beowulf, кластеризации с Ubuntu и других вещах. Однако у меня нет опыта работы с сетями, кластеризацией, командами Unix и т.д., И я не совсем понимаю их. Я готов учиться, но на самом деле понятия не имею, с чего начать, поэтому советы, ресурсы, предложения будут с благодарностью.