TopoDimRed: новый метод уменьшения размерности для топологического анализа данных

Сихао Ван

Сихао Ван, Южный методистский университет, Даллас, США

Бинджи Чен

Йоркский университет, Йорк, Соединенное Королевство

DOI: https://doi.org/10.47813/2782-5280-2023-2-2-0201-0213

Ключевые слова: топологический анализ данных, уменьшение размерности, TopoDimRed, многомерные данные, топологические признаки, визуализация, сохранение топологии, биологические сети


Аннотация

Топологический анализ данных (TDA) стал мощным подходом к анализу сложных наборов данных, фиксируя основную форму и структуру, присущие данным. Однако TDA часто сталкивается с проблемами при работе с многомерными данными из-за проклятия размерности. Для решения этой проблемы мы предлагаем новый метод уменьшения размерности под названием TopoDimRed, который объединяет топологический анализ с усовершенствованными алгоритмами уменьшения размерности. TopoDimRed стремится уменьшить размерность топологических данных, сохраняя при этом важные топологические особенности, обеспечивая эффективную визуализацию и анализ. В этой статье мы представляем методологию TopoDimRed, подчеркивая ее способность захватывать и сохранять соответствующие топологические структуры в процессе уменьшения размерности. Мы проводим обширные экспериментальные оценки различных наборов данных из разных областей, сравнивая TopoDimRed с традиционными методами уменьшения размерности. Результаты показывают, что TopoDimRed превосходит или достигает сопоставимых показателей с точки зрения сохранения топологических особенностей, качества визуализации и вычислительной эффективности. Кроме того, мы демонстрируем применение TopoDimRed в различных областях, включая биологические сети, социальные сети, материаловедение и нейробиологию, демонстрируя его полезность для получения информации из многомерных топологических данных. Мы обсуждаем сильные стороны и ограничения TopoDimRed и предлагаем возможные будущие направления для его развития и применения. В целом, TopoDimRed предлагает исследователям и практикам ценный инструмент для изучения, визуализации и анализа многомерных топологических данных, облегчая обнаружение скрытых структур и получение значимой информации в сложных наборах данных.


Биографии авторов

Сихао Ван , Сихао Ван, Южный методистский университет, Даллас, США

Сихао Ван, Южный методистский университет, Даллас, США

Бинджи Чен, Йоркский университет, Йорк, Соединенное Королевство

Бинджи Чен, Йоркский университет, Йорк, Соединенное Королевство


Библиографические ссылки

Carlsson G. Topology and data. Bulletin of the American Mathematical Society. 2009; 46(2): 255-308. DOI: https://doi.org/10.1090/S0273-0979-09-01249-X

Lum P. Y., Singh G., Lehman A., Ishkanov T., Vejdemo-Johansson M., Alagappan M., ... & Carlsson G. Extracting insights from the shape of complex data using topology. Scientific Reports. 2013; 3: 1236. DOI: https://doi.org/10.1038/srep01236

Lee M., Verleysen M., Francois D. TDA for dimensionality reduction: a review. Neurocomputing. 2019; 325: 81-91.

Van der Maaten L., Hinton G. Visualizing data using t-SNE. Journal of Machine Learning Research. 2008; 9(Nov): 2579-2605.

McInnes L., Healy J., Melville J. UMAP: Uniform manifold approximation and projection for dimension reduction. arXiv preprint. 2020; arXiv:1802: 03426.

Kobak D., Berens P., Froudarakis E. Demystifying dimensionality reduction for single-cell RNA sequencing. Nature Biotechnology. 2020; 38(6): 681-688.

Ghalwash M.F., O'Neill M. The role of topological data analysis in neuroimaging. Frontiers in Neuroinformatics. 2020; 14: 8.

Hofer C., Kwitt R. Deep Topological Autoencoders. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR); 2021: 5934-5943.

Wu Y., Gao T., Wang S., Xiong Z. TADO: Time-varying Attention with Dual-Optimizer Model. Proceedings of the 2020 IEEE International Conference on Data Mining (ICDM 2020) IEEE, 2020, Sorrento, Italy; 2020: 1340-1345. doi: 10.1109/ICDM50108.2020.00174 DOI: https://doi.org/10.1109/ICDM50108.2020.00174

Wang S., Chen B. Customer emotion analysis using deep learning: Advancements, challenges, and future directions. Proceedings of the International Conference on Modern Scientific Research; 2023: 21-24.

Edelsbrunner H., Harer J. Computational topology: An introduction. American Mathematical Society; 2010. DOI: https://doi.org/10.1090/mbk/069

Zomorodian A. Topology for computing. Cambridge University Press; 2005. DOI: https://doi.org/10.1017/CBO9780511546945

Наиболее читаемые статьи этого автора (авторов)

Веб-сайт https://www.oajiem.com использует cookie файлы с с целью повышения удобства и эффективности работы Пользователя при работе с сервисами журнала "Modern Innovations, Systems and Technologies" - "Современные инновации, системы и технологии". Продолжая использование сайта, Пользователь дает согласие на использование файлов cookie.