У меня есть большой 17 ГБ файл JSON, помещенный в hdfs. Мне нужно прочитать этот файл и преобразовать его в простой массив, который затем передается в алгоритм кластеризации K-Means. Я пробовал много способов, но система замедляется и получает ошибку памяти или ядро умирает.