先日に引き続き、相関係数に関する復習。今回は演習問題だけで、復習はない。とはいえ演習問題に対応しながら、次のことが気になった。データフレーム内の値を簡単に集計するには、どうすればよいのか?例えば次のような場合だ。
- データフレーム中に顧客の年齢と買い上げ金額が記録されている。
- 買い上げ金額を年代別(10代、20代、30代...)に集計したい。
日頃、得られたデータフレームを直接関数へ投入しているばかりなので、ほんの少しの手間が必要になると、途端に作業が止まってしまう。Excelならば簡単に対応できるのだが、データ件数が増えたときのことを考えると、ここでRでの対応方法を調べておくのが得策だろう。
今回は、まず演習問題をこなした上で、データフレーム内のデータを集計することを考えたい。
追記、2021年1月24日
データフレーム内の集計について、この投稿で紹介する方法以外に、Tidyverseの方法に則る方法が分かりやすく、効率的だ。Tidyverseについての投稿でも同様の話題に触れている。合わせて参照してほしい。
Rの初歩 - Tidyなやり方 Tidyverse - Technically Impossible
- 演習問題
- データフレーム内のデータ集計
- リファレンス
- 追記、2021年1月24日