2020/01/24 情報福祉マネジメント学科
教員の声:データ分析の研究 第2回 岩田一樹講師
教員の声<不定期更新>
学科の教育や活動について学科教員の視点でまとめて報告します。教員の声 第2回、岩田講師によるデータ分析の第2回です。
前回は、Twitterのつぶやきからコミケ97の数的な特徴を捉えることは可能について分析をしました。今回は、Twitterといえば、「リツイート」と「いいね」ということに着目してみます。
各ツイートに関して、リツイート数といいね数についてヒストグラムにしたのが、図2です。上下の図は、それぞれ、リツイート数、いいね数についてのヒストグラムになっています。なお、頻度の少ないデータを見やすくするために、最大頻度を100にして表示してあります。
図からは、ほとんどのつぶやきはリツイートもいいねもされず、極々少数のつぶやきのみが圧倒的多数のリツイートといいねを得られている事がわかります。
基本統計量としては、リツイート数の平均値が約3.1、中央値が0、いいね数の平均値が約11.1、中央値が0です。つまり、世の中のほとんどのつぶやきというのは、リツイートもされず、いいねもされず、相手にされていないということです。確かに、私のつぶやきも、ほぼほぼ、リツイート数0、いいね数0です。
このリツイートの数やいいねの数の偏った分布はコミケに関するつぶやきだけでなく、つぶやき一般に言えて、このような少強多弱の分布はスケールフリーと呼ばれます[5]。他のスケールフリーに従う例を上げると、所得、聖書に出てくる単語の頻度などで、この分布やそれに近い分布に従う現象は沢山あります。
各ツイートに関して、リツイート数といいね数についてヒストグラムにしたのが、図2です。上下の図は、それぞれ、リツイート数、いいね数についてのヒストグラムになっています。なお、頻度の少ないデータを見やすくするために、最大頻度を100にして表示してあります。
図からは、ほとんどのつぶやきはリツイートもいいねもされず、極々少数のつぶやきのみが圧倒的多数のリツイートといいねを得られている事がわかります。
基本統計量としては、リツイート数の平均値が約3.1、中央値が0、いいね数の平均値が約11.1、中央値が0です。つまり、世の中のほとんどのつぶやきというのは、リツイートもされず、いいねもされず、相手にされていないということです。確かに、私のつぶやきも、ほぼほぼ、リツイート数0、いいね数0です。
このリツイートの数やいいねの数の偏った分布はコミケに関するつぶやきだけでなく、つぶやき一般に言えて、このような少強多弱の分布はスケールフリーと呼ばれます[5]。他のスケールフリーに従う例を上げると、所得、聖書に出てくる単語の頻度などで、この分布やそれに近い分布に従う現象は沢山あります。
では、具体的に誰のつぶやきがリツイートやいいねを稼いだのでしょうか? それを調べるために、リツイート数トップ10のアカウントとリツイート数、いいね数トップ10のアカウントといいね数とをまとめたのが表1、2です。
しばしば話題に上がる人気コスプレイヤーのえなこ氏[6]、また、ゲームの公式で入っている「刀剣乱舞」[7]と「第五人格」[8]の人気の高さが伺えます。また、今回のコミケでは、なかやまきんに君氏[9]の来場が話題になったのですが、本人のつぶやきがランクインしています。
さて、表1、2を眺めると、なんとなく、同じアカウントとつぶやきが重複している気がしてきます。
つまり、たくさんリツイート(いいね)を集めるつぶやきは、同時にたくさんのいいね(リツイート)を得ているのではないかということです。そんなの当たり前じゃないか、と思われる方も多いと思いますが、それを実際にデータで確認してみましょう。
各つぶやきに関して、そのリツイート数を横軸、いいね数を縦軸にとったものが、図3です。
いかがでしょう、原点付近に点が集中し、素晴らしくきれいな比例関係にあることがわかります。図3のように、片方が増えるともう片方も増えるとき、この2つには「正の相関がある」といいます。
しばしば話題に上がる人気コスプレイヤーのえなこ氏[6]、また、ゲームの公式で入っている「刀剣乱舞」[7]と「第五人格」[8]の人気の高さが伺えます。また、今回のコミケでは、なかやまきんに君氏[9]の来場が話題になったのですが、本人のつぶやきがランクインしています。
さて、表1、2を眺めると、なんとなく、同じアカウントとつぶやきが重複している気がしてきます。
つまり、たくさんリツイート(いいね)を集めるつぶやきは、同時にたくさんのいいね(リツイート)を得ているのではないかということです。そんなの当たり前じゃないか、と思われる方も多いと思いますが、それを実際にデータで確認してみましょう。
各つぶやきに関して、そのリツイート数を横軸、いいね数を縦軸にとったものが、図3です。
いかがでしょう、原点付近に点が集中し、素晴らしくきれいな比例関係にあることがわかります。図3のように、片方が増えるともう片方も増えるとき、この2つには「正の相関がある」といいます。
ちなみに、つぶやき数といいね数の相関係数は0.911で、相関係数の上限が1で、1に近いほど相関が強いことから、めちゃめちゃ強い相関をもっていることがわかりました。
このことからは、リツイート押したら、その勢いで、いいねのチェックも押している、または、その逆の可能性が高いことが示唆されます。
私は、確かにその傾向があると自覚していますが、皆さんは如何でしょう。
5. 日経サイエンス, http://www.nikkei-science.com/page/magazine/0309/network.html
6. えなこオフィシャルブログ, https://lineblog.me/enakorin/
7. 刀剣乱舞, http://www.dmm.com/netgame/feature/tohken_html/=/navi=none/?utm_content=200101&utm_source=AdWords&utm_medium=lis&utm_campaign=nml
8. 第五人格, http://www.identityv.jp/
9. なかやまきんに君, https://profile.yoshimoto.co.jp/talent/detail?id=647
(第3回に続く)
このことからは、リツイート押したら、その勢いで、いいねのチェックも押している、または、その逆の可能性が高いことが示唆されます。
私は、確かにその傾向があると自覚していますが、皆さんは如何でしょう。
5. 日経サイエンス, http://www.nikkei-science.com/page/magazine/0309/network.html
6. えなこオフィシャルブログ, https://lineblog.me/enakorin/
7. 刀剣乱舞, http://www.dmm.com/netgame/feature/tohken_html/=/navi=none/?utm_content=200101&utm_source=AdWords&utm_medium=lis&utm_campaign=nml
8. 第五人格, http://www.identityv.jp/
9. なかやまきんに君, https://profile.yoshimoto.co.jp/talent/detail?id=647
(第3回に続く)
この記事に関するお問い合わせ
- 教務部教務課
- 住所:〒981-8522 宮城県仙台市青葉区国見1?8?1
- TEL:022-717-3315
- FAX:022-301-1280
- E-Mail:kyomu@tfu.ac.jp