Как сделать точечную диаграмму в Excel (диаграмма XY)

В Excel есть несколько полезных типов диаграмм, которые можно использовать для построения данных и анализа.

Распространенный сценарий - это когда вы хотите нанести значения X и Y на диаграмму в Excel и показать, как эти два значения связаны.

Это можно сделать с помощью Точечная диаграмма в Excel.

Например, если у вас есть данные о росте (значение X) и весе (значение Y) для 20 студентов, вы можете нанести их на точечную диаграмму, и она покажет вам, как эти данные связаны.

Ниже приведен пример точечной диаграммы в Excel (также называемой диаграммой XY):

В этом уроке я покажу вам, как создать диаграмму рассеяния в Excel, различные типы диаграмм рассеяния и как настроить эти диаграммы.

Что такое точечная диаграмма и когда ее использовать?

Точечные диаграммы используются для понимания корреляции (взаимосвязи) между двумя переменными данных.

На точечной диаграмме есть точки, где каждая точка представляет два значения (значение по оси X и значение по оси Y), и на основе этих значений эти точки располагаются на диаграмме.

Примером из реальной жизни могут быть расходы на маркетинг и выручка группы компаний в определенной отрасли.

Когда мы наносим эти данные (маркетинговые расходы и выручка) на диаграмму рассеяния, мы можем проанализировать, насколько сильно или слабо связаны эти две переменные.

Создание точечной диаграммы в Excel

Предположим, у вас есть набор данных, показанный ниже, и вы хотите создать диаграмму рассеяния, используя эти данные.

Цель этой диаграммы - увидеть, есть ли корреляция между маркетинговым бюджетом и доходом.

Для построения точечной диаграммы важно, чтобы оба значения (двух переменных, которые вы хотите отобразить на точечной диаграмме) в двух отдельных столбцах.

Столбец слева (столбец «Маркетинговые расходы» в нашем примере) будет нанесен на ось X, а доход - на ось Y.

Ниже приведены шаги для вставки диаграммы рассеяния в Excel:

  1. Выберите столбцы с данными (исключая столбец A)
  1. Нажмите кнопку "Вставить"
  1. В группе «Диаграмма» щелкните значок «Вставить точечную диаграмму».
  1. Нажмите на опцию «Точечная диаграмма» на появившихся диаграммах.

Вышеупомянутые шаги позволят вставить диаграмму рассеяния, как показано ниже на рабочем листе.

Столбец слева (столбец «Маркетинговые расходы» в нашем примере) будет нанесен на ось X, а доход - на ось Y. Лучше иметь независимый показатель в левом столбце, а тот, для которого вам нужно найти корреляцию, в столбце справа.

Добавление линии тренда на точечную диаграмму

Хотя я расскажу о других способах настройки диаграммы рассеяния в Excel позже в этом руководстве, одна вещь, которую вы можете сделать сразу после построения графика рассеяния, - это добавить линию тренда.

Это поможет вам быстро понять, коррелированы ли данные положительно или отрицательно, и насколько сильно / слабо они коррелированы.

Ниже приведены шаги по добавлению линии тренда на точечную диаграмму в Excel:

  1. Выберите точечный график (где вы хотите добавить линию тренда)
  2. Щелкните вкладку Конструктор диаграммы. Это контекстная вкладка, которая появляется только при выборе диаграммы.
  1. В группе «Макеты диаграмм» нажмите «Добавить элемент диаграммы».
  1. Перейдите к параметру «Линия тренда» и нажмите «Линейный».

Вышеупомянутые шаги добавят линейную линию тренда к вашей диаграмме разброса.

Просто взглянув на линию тренда и точки данных, нанесенные на точечную диаграмму, вы можете понять, коррелированы ли данные положительно, отрицательно или нет.

В нашем примере мы видим положительный наклон линии тренда, указывающий на положительную корреляцию данных. Это означает, что когда расходы на маркетинг растут, выручка растет, а если расходы на маркетинг снижаются, то выручка падает.

Если данные имеют отрицательную корреляцию, тогда будет обратная связь. В этом случае, если расходы на маркетинг увеличатся, выручка упадет, и наоборот.

И еще есть случай, когда нет корреляции. В этом случае, когда расходы на маркетинг увеличиваются, их выручка может увеличиваться, а может и не увеличиваться.

Обратите внимание, что наклон только говорит нам, положительно или отрицательно коррелированы данные. он не говорит нам, насколько тесно это связано.

Например, в нашем примере, глядя на линию тренда, мы не можем сказать, насколько вырастет доход, когда расходы на маркетинг увеличатся на 100%. Это то, что можно рассчитать с помощью коэффициента корреляции.

Вы можете найти это, используя формулу ниже:

= КОРРЕЛЬ (B2: B11; C2: C11)

Коэффициент корреляции варьируется от -1 до 1, где 1 будет указывать на абсолютно положительную корреляцию, а -1 - на совершенно отрицательную корреляцию.

В нашем примере он возвращает 0,945, указывая на то, что эти две переменные имеют высокую положительную корреляцию.

Идентификация кластеров с помощью точечной диаграммы (практические примеры)

Один из способов, которыми я использовал точечные диаграммы в своей работе в качестве финансового аналитика, заключался в выявлении кластеров точек данных, которые демонстрируют похожее поведение.

Обычно это хорошо работает, когда у вас есть разнообразный набор данных с меньшей общей корреляцией.

Предположим, у вас есть набор данных, показанный ниже, где у меня есть 20 компаний с их показателями выручки и прибыли.

Когда я создаю диаграмму рассеяния для этих данных, я получаю что-то, как показано ниже:

На этой диаграмме вы можете видеть, что точки данных расположены повсюду, и существует очень низкая корреляция.

Хотя эта диаграмма мало что говорит нам, вы можете использовать ее для определения кластеров в четырех квадрантах диаграммы.

Например, точка данных в нижнем левом квадранте - это те компании, где выручка низкая, а маржа чистой прибыли низкая, а компании в правом нижнем квадранте - это компании, где выручка высока, но чистая прибыль низкая.

Раньше это была одна из самых обсуждаемых диаграмм на собрании руководства, когда мы использовали для выявления потенциальных клиентов на основе их финансовых данных.

Различные типы точечных диаграмм в Excel

Помимо обычной точечной диаграммы, которую я рассмотрел выше, вы также можете создать в Excel следующие типы точечной диаграммы:

  • Скаттер с плавными линиями
  • Скаттер с плавными линиями и маркерами
  • Скаттер с прямыми линиями
  • Скаттер с прямыми линиями и маркерами

Все эти четыре диаграммы рассеяния подходят, когда у вас меньше точек данных и когда вы строите на диаграмме два ряда.

Например, предположим, что у вас есть данные о маркетинговых расходах и доходах, как показано ниже, и вы хотите построить диаграмму разброса с плавными линиями.

Ниже приведены шаги для этого:

  1. Выберите набор данных (исключая столбец с названием компании)
  2. Щелкните вкладку Вставка
  3. В группе «Диаграммы» выберите параметр «Вставить точечную диаграмму».
  4. Нажмите на Scatter with Smooth Lines and Markers options.

Вы увидите что-то, как показано ниже.

Эта диаграмма может быстро стать нечитаемой, если у вас будет больше точек данных. Вот почему рекомендуется использовать это только с меньшим количеством точек данных.

Я никогда не использовал эту диаграмму в своей работе, так как не думаю, что она дает какое-либо значимое понимание (поскольку мы не можем нанести на нее больше точек данных).

Настройка точечной диаграммы в Excel

Как и любую другую диаграмму в Excel, вы можете легко настроить диаграмму рассеяния.

В этом разделе я расскажу о некоторых настройках, которые вы можете сделать с точечной диаграммой в Excel:

Добавление / удаление элементов диаграммы

Когда вы нажмете на диаграмму рассеяния, вы увидите значок плюса в верхней правой части диаграммы.

Когда вы нажимаете на этот значок плюса, он показывает вам параметры, которые вы можете легко добавить или удалить из диаграммы разброса.

Вот варианты, которые вы получите:

  • Топоры
  • Название оси
  • Заголовок диаграммы
  • Метки данных
  • Полосы ошибок
  • Линии сетки
  • Легенда
  • Линии тренда

Некоторые из этих параметров уже присутствуют в вашей диаграмме, и вы можете удалить эти элементы, установив флажок рядом с параметром (или добавить их, установив флажок, если он еще не установлен).

Например, если я хочу удалить заголовок диаграммы, я могу просто снять этот флажок, и он исчезнет,

Если вам нужно больше контроля, вы можете нажать на маленькую черную стрелку, которая появляется при наведении курсора на любой из параметров.

Нажав на нее, вы получите дополнительные параметры для этого конкретного элемента диаграммы (они открываются в виде панели с правой стороны).

Примечание. Все скриншоты, которые я вам показал, взяты из последней версии Excel (Microsoft 365). Если вы используете старую версию, вы можете получить те же параметры, щелкнув правой кнопкой мыши любой из элементов диаграммы и выбрав параметр «Формат».

Давайте быстро рассмотрим эти элементы и некоторые из замечательных настроек, которые вы можете сделать для разброса диаграмм с его помощью.

Топоры

Оси - это вертикальные и горизонтальные значения, которые вы видите рядом с диаграммой.

Одна из самых полезных настроек, которые вы можете сделать с осями, - это настроить максимальное и минимальное значение, которое они могут отображать.

Чтобы изменить это, щелкните правой кнопкой мыши оси на диаграмме, а затем щелкните Формат осей. Откроется панель «Ось формата».

В опции Axis вы можете установить минимальные и максимальные границы, а также основные и второстепенные единицы.

В большинстве случаев вы можете установить это автоматически, и Excel позаботится об этом на основе набора данных. Но если вам нужны конкретные значения, вы можете изменить их здесь.

Одним из примеров может быть случай, когда вы хотите, чтобы минимальное значение по оси Y было не 0, а другим (скажем, 1000). Изменение нижней границы на 1000 приведет к корректировке диаграммы таким образом, чтобы минимальное значение по вертикальной оси было равно 1000.

Название оси

Заголовок оси - это то, что вы можете использовать, чтобы указать, что представляют собой оси X и Y на диаграмме рассеивания в Excel.

В нашем примере это будет чистый доход по оси X и маркетинговые расходы по оси Y.

Вы можете не отображать заголовки оси, и вы можете удалить их, выбрав диаграмму, щелкнув значок плюса, а затем сняв флажок для заголовка оси.

Чтобы изменить текст в заголовке оси, просто дважды щелкните по нему, а затем введите все, что хотите, в качестве заголовка оси.

Вы также можете связать значение заголовка оси с ячейкой.

Например, если вы хотите, чтобы значение в ячейке B1 отображалось в заголовке вертикальной оси, щелкните поле заголовка оси и затем введите = B1 в строке формул. Это покажет значение в ячейке B1 в заголовке оси.

Вы можете сделать то же самое для заголовка горизонтальной оси и связать его с определенной ячейкой. Это делает эти заголовки динамическими, и если значение ячейки изменится, заголовки осей также изменятся.

Если вам нужно больше контроля над форматированием заголовков осей, щелкните любую ось, щелкните правой кнопкой мыши, а затем щелкните Форматировать заголовок оси.

С помощью этих параметров вы можете изменить заливку и границу заголовка, изменить цвет текста, выравнивание и поворот.

Заголовок диаграммы

Как и заголовки осей, вы также можете отформатировать заголовок диаграммы в точечной диаграмме в Excel.

Заголовок диаграммы обычно используется для описания того, о чем идет речь. Например, я могу использовать в качестве заголовка диаграммы «Маркетинговые расходы против доходов».

Если вам не нужен заголовок диаграммы, вы можете нажать на него и удалить. А если у вас его нет, выберите диаграмму, нажмите значок плюса и установите флажок «Заголовок диаграммы».

Чтобы отредактировать текст в заголовке диаграммы, дважды щелкните поле и вручную введите нужный текст. А если вы хотите сделать заголовок диаграммы динамическим, вы можете щелкнуть поле заголовка, а затем ввести ссылку на ячейку или формулу в строке формул.

Чтобы отформатировать заголовок диаграммы, щелкните правой кнопкой мыши заголовок диаграммы, а затем выберите параметр «Форматировать заголовок диаграммы». Это покажет панель заголовка диаграммы формата справа.

С помощью этих параметров вы можете изменить заливку и границу заголовка, изменить цвет текста, выравнивание и поворот.

Метки данных

По умолчанию метки данных не отображаются при создании диаграммы рассеяния в Excel.

Но вы можете легко добавить и отформатировать их.

Добавьте метки данных в точечную диаграмму, выберите диаграмму, щелкните значок плюса справа, а затем отметьте параметр меток данных.

Это добавит метки данных, которые будут отображать значение оси Y для каждой точки данных на точечной диаграмме.

Чтобы отформатировать метки данных, щелкните правой кнопкой мыши любую метку данных, а затем выберите параметр «Форматировать метки данных».

Это откроет панель бывших меток данных справа, и вы можете настроить их, используя различные параметры, перечисленные на панели.

Помимо обычного форматирования, такого как заливка, граница, цвет текста и выравнивание, вы также получаете некоторые дополнительные параметры меток, которые вы можете использовать.

В параметрах «Метка содержит» вы можете выбрать отображение значений по оси X и оси Y, а не только по оси Y.

Вы также можете выбрать вариант «Значение из ячеек». который позволит вам иметь метки данных, которые находятся в столбце на листе (при выборе этого параметра открывается диалоговое окно, и вы можете выбрать диапазон ячеек, значения которых будут отображаться в метках данных. В нашем примере, Я могу использовать это, чтобы отображать названия компаний в метках данных

Вы также можете настроить положение метки и формат ее отображения.

Полосы ошибок

Хотя я не видел, чтобы полосы ошибок использовались в точечных диаграммах, в Excel есть опция, позволяющая добавлять эти полосы ошибок для каждой точки данных на точечной диаграмме в Excel.

Чтобы добавить полосы погрешностей, выберите диаграмму, щелкните значок плюса, а затем установите флажок «Полосы ошибок».

И если вы хотите дополнительно настроить эти полосы ошибок, щелкните правой кнопкой мыши любую из этих полос ошибок, а затем выберите параметр «Форматировать полосы ошибок».

Это откроет панель «Форматирование полос ошибок» справа, где вы можете настроить такие параметры, как цвет, направление и стиль полос ошибок.

Линии сетки

Линии сетки полезны, когда у вас много точек данных на диаграмме, поскольку они позволяют читателю быстро понять положение точки данных.

Когда вы создаете диаграмму рассеяния в Excel, линии сетки включены по умолчанию.

Вы можете отформатировать эти линии сетки, щелкнув правой кнопкой мыши любую из линий сетки и выбрав параметр «Форматировать линии сетки».

Это откроет панель Форматирования линий сетки, и вы сможете изменить форматирование, такое как цвет, толщину линии сетки.

Помимо основных линий сетки, которые уже видны при создании диаграммы рассеяния, вы также можете добавить второстепенные линии сетки.

Между двумя основными линиями сетки у вас может быть несколько второстепенных линий сетки, которые еще больше улучшают читаемость диаграммы в случае, если у вас много точек данных.

Чтобы добавить незначительные горизонтальные или вертикальные линии сетки, выберите диаграмму, щелкните значок плюса и наведите курсор на параметр Линии сетки.

Нажмите появившуюся толстую черную стрелку, а затем установите флажок «Первичный второстепенный горизонтальный» или «Первичный второстепенный вертикальный», чтобы добавить второстепенные линии сетки.

Легенда

Если у вас есть несколько серий, нанесенных на точечную диаграмму в Excel, вы можете использовать легенду, которая будет обозначать, какая точка данных относится к какой серии.

По умолчанию при создании точечной диаграммы в Excel нет легенды.

Чтобы добавить легенду к точечной диаграмме, выберите диаграмму, щелкните значок плюса, а затем отметьте опцию легенды.

Чтобы отформатировать легенду, щелкните правой кнопкой мыши появившуюся легенду и выберите опцию «Форматировать легенду».

На открывшейся панели «Формат легенды» вы можете настроить цвет заливки, границу и положение легенды на диаграмме.

Линия тренда

Вы также можете добавить линию тренда на точечную диаграмму, которая покажет, есть ли положительная или отрицательная корреляция в наборе данных.

Я уже рассказывал, как добавить линию тренда на точечную диаграмму в Excel в одном из разделов выше.

Точечная диаграмма 3D в Excel (лучше избегать)

В отличие от линейной диаграммы, гистограммы или диаграммы с областями, в Excel нет встроенной трехмерной точечной диаграммы.

Хотя для этого вы можете использовать надстройки и инструменты сторонних производителей, я не могу придумать каких-либо дополнительных преимуществ, которые вы получите от трехмерной диаграммы разброса по сравнению с обычной двухмерной точечной диаграммой.

Фактически, я рекомендую держаться подальше от любых трехмерных диаграмм, поскольку они могут искажать данные и части диаграммы.

Вот как вы можете создать диаграмму рассеяния в Excel и настроить ее, чтобы она соответствовала вашему бренду и требованиям.

Надеюсь, вы нашли этот урок полезным.

Вы поможете развитию сайта, поделившись страницей с друзьями

wave wave wave wave wave