日経XTECH、2019年12月号にて「プログラミング言語人気ランキング」という記事が掲載された。技術者440人に対して、主に次の観点でアンケートし、まとめたものだ。
- どのプログラミング言語を学びたいか、学びたくないか
- 業務現場では、どの言語をどのような用途で使用しているか
ここから収集できるデータを用いて、主成分分析とクラスタリングをしてみた。機械学習で言えば、どちらも「教師なし学習」と呼ばれる機械的な判別、分類方法だ。
特に上記1の観点からの分類では、かなり良好な傾向を見出すことができた。同時に上記2の観点からは、言語の判別、分類よりも使用用途に関する相関が垣間見え、そこから実際の利用用途を察することができる結果が示された。
統計処理にはRを用いた。コードの全文は、投稿末尾に掲載すると同時に、GitHubにもアップロードしている。用いたデータも同様にアップロードしている。
- データ収集、整理
- スキル磨きと、利用頻度の関係
- 2グループ
- 4グループ
- 9グループ
- 使用用途
- 参照
- コード全文