Я буду хранить длинную строку (45132 символа) в базе данных Postrgres, сохраняя при этом каждый символ (включая действительно редкие).
Postgres может хранить строки до 1 ГБ (см. Здесь).
Что касается максимального размера строки из 45132 символов, каков наихудший сценарий?
По моим (возможно, неуклюжим) расчетам Unicode может занимать до 4 байт на символ, поэтому длина строки в 1 ГБ будет 250 000 000 символов (поэтому мне не о чем беспокоиться), но моя логика / математика верна и существуют ли кодировки, которые потреблять больше памяти, чем Unicode, что мне может понадобиться?
Примечание: я предполагаю, что ASCII составляет 1 байт на символ, а Unicode - до 4 байтов на символ.