今回はRで散布図を描く方法を2つ紹介します。
散布図とは
散布図とは、2つの連続変数の関係を点でグラフに表したものです。
2つの変数の相関関係を見るときなどに使用されます。
1. 標準のplot()を使う
Rには標準で図を描くためのplot関数があり、これを用いると散布図を描くことができます。書き方は
plot(x軸のデータ, y軸のデータ) です。
irisデータで花びらの長さ(Petal.Length)と幅(Petal.Width)の散布図を描いてみましょう。
1 |
plot(iris$Petal.Length,iris$Petal.Width) |
オプションを使うとグラフのタイトルなどを追加することができます。
main…グラフのタイトル(上部中央に表示される)
xlab…x軸のラベル
ylab…y軸のラベル
pch…散布図の点の種類(デフォルトでは白丸)
1 2 |
plot(iris$Petal.Length,iris$Petal.Width, xlab = "花びらの長さ", ylab = "花びらの幅", main = "散布図",pch=2) |
pch(点の形)は、数字によって様々な種類に変わりますのでいろいろと試してみてください。
pch=”あ”のように、文字を指定することもできます。
2. ggplotを使う
ggplotで散布図
Rの可視化パッケージであるggplot2を使用する場合は、geom_point()をつけると散布図になります。
グラフのタイトルなどはlabs()の中に記載しましょう。
パイプ処理(%>%)を使うと次のように書きます。
データ %>%
ggplot(aes(x=x軸, y=y軸))+
geom_point()+
labs(x=”x軸のタイトル”, y=”y軸のタイトル”, title=”図全体のタイトル”)
1 2 3 4 5 |
library(tidyverse) iris %>% ggplot(aes(x=Petal.Length,y=Petal.Width))+ geom_point()+ labs(x="花びらの長さ", y="花びらの幅", title="散布図") |
グループごとに色分け
散布図の点にグループごとの色を付けるには、aes()の中にcolorを指定します。
データ %>%
ggplot(aes(x=x軸, y=y軸, color=グループ))+
geom_point()
irisデータの種類(Species)に色を付けてみます。
1 2 3 4 |
iris %>% ggplot(aes(x=Petal.Length,y=Petal.Width, color=Species))+ geom_point()+ labs(x="花びらの長さ", y="花びらの幅", title="散布図") |
コメント