При каких обстоятельствах методы уменьшения размерности на основе ядра имеют более низкую производительность, чем их версии, не основанные на ядре, например. Ядро PCA и PCA, Ядро LDA и LDA?

35
3
1
Лучший ответ
35

Прежде всего вам нужно указать, что вы подразумеваете под «производительностью»: эти методы просто преобразуют ваши данные. Запрос об их производительности эквивалентен запросу о выполнении функции или преобразования. Так что это может быть неверно истолковано как производительность вычислений.

Предполагая, что вы имеете в виду эффективность классификации, то есть вы используете пространство с уменьшенной размерностью для оценки классификатора, необходимо сделать два соображения:

Линейная или нелинейная структура ваших данных

Как выглядят данные после применения преобразования? Вы получаете отличительные кластеры? Кластеры перекрываются? Правильно сформированные кластеры, в которых каждый кластер соответствует классу (тип объекта для идентификации), обеспечат лучшую производительность классификации с использованием линейных классификаторов.

В противном случае ядра могут быть применены с целью преобразования данных в пространство, где они становятся линейно разделимыми. Именно в этом и заключается идея использования радиальных базисных функций в машинах опорных векторов. Таким образом, если после применения техники уменьшения размерности вы не можете четко визуализировать группы, вам следует изучить преобразования ядра. Кроме того, вы можете изучить другие методы уменьшения размерности, основанные на идее поддержания локальной топологии (см. Раздел «Обучение коллектору»).

Количество данных, которые у вас есть

Если вы работаете с небольшим образцом, лучше не использовать ядра, даже если ваши данные не полностью линейно разделимы. Преобразования ядра в небольшом наборе данных могут вводить в заблуждение, поскольку реальная структура данных может не быть подтверждена. Кроме того, преобразования ядра имеют параметры, которые требуют независимой настройки, и соответствующая процедура настройки просто невозможна с небольшим набором данных.

Как вы можете подтвердить, эти два соображения представляют собой компромисс между сложностью вашей модели и объемом данных, доступных для представления такой сложности. Эмпирическое правило, которое я использую: если у вас небольшой набор данных, не используйте ядра.

Мы исследовали эти проблемы в этой статье: Страница на sciencedirect.com

Надеюсь, это поможет.

ответил(а) 2020-06-07T19:38:44+03:00 3 месяца, 3 недели назад
Ваш ответ
Введите минимум 50 символов
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема