Intro (Ch 1), Visualization Analysis & Design, 2021
Что такое визуализация и зачем она нужна?
Определение визуализации
- Визуализация (или "виз") — это компьютерные системы, которые предоставляют визуальные представления наборов данных, чтобы помочь людям более эффективно выполнять задачи.
- Важно отметить наличие "данных" и "людей" в одном предложении, что подчеркивает необходимость участия человека в процессе анализа данных.
Человеческий фактор в анализе данных
- Визуализация необходима для улучшения возможностей человека, а не для замены его вычислительными методами. Это особенно актуально, когда автоматизированное решение либо отсутствует, либо ему не доверяют.
- Многие аналитические задачи плохо определены: мы часто не знаем заранее, какой вопрос задать. Это создает множество возможных направлений для исследования.
Применение визуализации
- Визуализация может использоваться как для изучения неизвестного (например, в научных исследованиях), так и для объяснения известного (например, в журналистике). Это важно для передачи результатов другим людям или при обучении.
- Иногда визуализация служит промежуточным этапом на пути к созданию автоматизированного решения или помогает разработчикам алгоритмов уточнять параметры моделей.
Зачем нужны визуальные представления?
- Визуальные представления помогают заменить когнитивные действия перцептивными действиями, освобождая умственные ресурсы для более сложных вопросов. Например, восприятие графиков позволяет быстрее выявлять паттерны по сравнению с чтением чисел из таблицы.
Как визуализация зависит от зрения?
Визуальная система человека
- Человеческая визуальная система является высокоскоростным каналом восприятия, позволяющим обрабатывать информацию на фоне.
- Мы не видим всё одновременно; наш мозг соединяет небольшие фрагменты информации через сальтаторные движения глаз (саккады).
- В отличие от звука, который воспринимается последовательно, зрение дает ощущение одновременности.
Ограничения других сенсорных модальностей
- Технологии для записи и воспроизведения тактильных ощущений и вкуса пока что недостаточно развиты.
- Современные технологии позволяют эффективно записывать и отображать визуальные явления, в то время как другие модальности остаются менее развитыми.
Зачем представлять все данные?
Полнота информации
- Визуализация помогает увидеть не только обобщенную информацию, но и более детализированные данные.
- Пример: Квартет Анскома — четыре набора данных с одинаковыми статистическими характеристиками, но различиями при графическом отображении.
Значение графического представления
- Графики могут выявить несоответствия в предположениях о линейности данных.
- Сложные наборы данных требуют внимательного анализа подводной части информации за пределами простых статистических агрегатов.
Ограничения ресурсов в визуализации
Компьютерные ограничения
- Дизайнеры визуализации должны учитывать ограничения вычислительных мощностей (время обработки и память).
Ограничения дисплеев
- Пиксели являются ограниченным ресурсом; важно оптимально использовать пространство для передачи информации.
Ограничения человеческого восприятия
Как анализировать визуализации?
Введение в анализ визуализаций
- Обсуждение ограничений человеческой памяти и внимания, которые влияют на восприятие информации. Эти ограничения подчеркивают важность структурирования дизайна визуализаций.
- Анализ существующих визуализаций как способ улучшения процесса проектирования новых. Это позволяет избежать случайного выбора методов визуального кодирования данных.
Примеры систем визуализации
- Сравнение двух систем для визуализации больших деревьев: SpaceTree и TreeJuxtaposer. Оба инструмента предназначены для отображения родственных отношений между видами, но имеют разные подходы к представлению данных.
- В SpaceTree информация кодируется визуально с возможностью навигации по дереву, что позволяет пользователю выбирать интересующие его элементы и фильтровать данные.
Различия в подходах к навигации
- В TreeJuxtaposer используется метод "растяжения и сжатия", который изменяет размеры частей дерева для лучшего отображения пути от листа к корню. Это помогает пользователю лучше ориентироваться в структуре данных.