Кластеризация, Большой набор данных, изучение большого количества лексических слов

Hrid Biswas спросил: 11 июня 2018 в 11:02 в: matlab

Я пытаюсь сделать кластеризацию из большого набора данных dim: rows: 1.4 millioncols: 900

ожидаемое количество кластеров: 10 000 (10 тыс.)

Проблема заключается в следующем: s iize моего набора данных 10Gb, и у меня есть RAM 16Gb. Я пытаюсь реализовать в Matlab. Это будет большой помощью для меня, если кто-то сможет ответить на него.

P.S. До сих пор я пытался с иерархической кластеризацией. в одном документе они предложили перейти на " постоянную предварительную кластеризацию с фиксированным радиусом" . Но я не понял эту процедуру.

Спасибо заранее.


0 ответов