Это может быть слишком много энергии для того, что вы пытаетесь сделать, но я бы взглянул на Intel Xeon Phi.
Вот немного фона на устройстве
Микроархитектура Larrabee (разрабатываемая с 2006 года) представила очень широкие (512-битные) SIMD-блоки в архитектуре процессора на базе архитектуры x86, расширенной до когерентной многопроцессорной системы, подключенной через кольцевую шину к памяти; каждое ядро было способно к многопоточности. Из-за дизайна, предназначенного для GPU, а также для вычислений общего назначения, чипы Larrabee также включали специализированное оборудование для выборки текстур. Проект по производству розничного продукта с графическим процессором непосредственно из исследовательского проекта Larrabee был прекращен в мае 2010 года.
Другим современным исследовательским проектом Intel, в котором реализована архитектура x86 на многоядерном процессоре, был «Single Chip Cloud Computer» (прототип, представленный в 2009 г.), конструкция, имитирующая центр обработки данных облачных вычислений на одном кристалле с несколькими независимыми ядрами - конструкция прототипа. включает в себя 48 ядер на чип с аппаратной поддержкой селективного управления частотой и напряжением ядер для максимизации энергоэффективности, а также включает в себя ячеистую сеть для обмена сообщениями между чипами. В дизайне отсутствовали согласованные с кэшем ядра, и основное внимание уделялось принципам, которые позволили бы масштабировать проект до гораздо большего числа ядер.
Исследовательский чип Teraflops (прототип, представленный в 2007 году) представлял собой экспериментальный 80-ядерный чип с двумя блоками с плавающей запятой на ядро, реализующий не x86, а 96-битную архитектуру VLIW. В рамках проекта были исследованы методы межкорпусной связи, управления питанием на кристалл и достигнут 1,01 TFLOPS при 3,16 ГГц, потребляющих 62 Вт энергии.
Intel Xeon Phi @ Intel ARK
Статья Intel Xeon Phi @ Википедия
Он соответствует следующим требованиям, которые вы указали выше
- Запускает Linux
- Использует PCI-E в качестве своего межсоединения
- Все в одной системе
Я не уверен на 100%, что он может читать шину памяти другой развернутой системы, но я хотел бы предположить, что она может, учитывая, что она используется в основном для вычислительных кластеров, и это похоже на функцию, которая будет ключевой в маркетинговой стратегии Xeon Phi.
Я должен упомянуть, что я бывший сотрудник Intel, но у меня нет никакой связи с Intel или третьими лицами, которые используют продукты Intel. Я не продвигаю продукты Intel по каким-либо финансовым причинам, просто кажется, что они могут соответствовать спецификациям того, что вы ищете.