Я подозреваю, что это не совсем подходящий вопрос для SU, поскольку ответ субъективен.
Я бы предложил следующий ответ - первая спецификация была определена в 1996 году - хотя Mosaic - первый веб-браузер был выпущен в 1993 году. Гипертекст был действительно заменой более простых протоколов, которые не отображали изображения и текст вместе. Для того, чтобы иметь возможность отображать как текст, так и изображения, он должен был / должен иметь возможность получить все элементы страницы, включая изображения.
Протокол HTTP также является очень хорошим протоколом (для чего он был разработан), так как он был проще, например, FTP, и стандартизирован. Поскольку просмотр веб-страниц стал настолько популярным, можно было почти гарантировать, что контент может быть получен с использованием этого протокола, то есть он упростил получение информации через межсетевые экраны.
Также было бы важно, чтобы он имел некоторую гибкость - вы говорите о загрузке изображений, но помните, что jpegs и PNG изначально даже не поддерживались, и авторы, вероятно, не стали бы прыжком для разработки более новой версии. Форматы изображений были бы желательны - огромные изображения в формате TIFF (которые из памяти были поддержаны) не очень подходили для сильно разделяемого соединения 9600 бод (или 14.4k, чтобы быть щедрым) - что не было редкостью, когда протокол был выпущен.
Чтобы преодолеть ограничения статических веб-страниц, технологии, такие как JSON и Javascript, были разработаны - гораздо позже. Использование HTTP для доставки означало, что межсетевые экраны не будут внезапно создавать проблему, и новый протокол не потребуется. Кроме того, Javascript действительно является логическим расширением статической веб-страницы, а JSON - логическим расширением, поэтому имеет смысл использовать существующие технологии.
Я отмечаю, что спецификация HTTP на самом деле довольно проста, поскольку она определяет заголовок и тело. Заголовок описывает тип файла, который может быть произвольным (с использованием типов MIME), поэтому протокол предоставляет альтернативные текстовые форматы.