統計分析で見る、ハッシュタグの使われ方と使い方

福田浩至 | 2020/05/27

統計分析で見る、ハッシュタグの使われ方と使い方

前の記事『データから読み解く「#家にいるだけで世界は救える」の拡散状態』では、ツイート件数の拡散状態を数字で表す手法、「トレンド方式」説明しました。この方式の特徴は、特定のキーワードなどの条件で絞り込んだツイート数の急増を検知し、その勢いを数値化することにあります。

この記事では、トレンド方式で数値化したデータの特徴と活用方法について考えてみたいと思います。今回も、コロナウイルスに関連するハッシュタグのツイート数の推移をもとに、トレンド方式を適用し分析していきます。

 

感染拡大と共に拡散した#StayHomeなどのハッシュタグ

4月8日、Twitter Japanは次のようなツイートをしました。

 

このツイートでは、

#家で過ごそう
#うちで過ごそう
#家にいるだけで世界は救える
#StayAtHome
#StayHome
#StayAtHomeSaveLives

以上6種のハッシュタグを使って、「世界中の医療従事者に、感謝の気持ちを絵文字で伝えよう」と呼びかけています。

 

ハッシュタグの活用傾向を調べる

これらのハッシュタグはどのように使われ拡散されていったのでしょうか。

まずは各ハッシュタグを対象として活用傾向を調べてみました。下の折れ線グラフは、政府の緊急事態宣言(4月8日)の前後1か月の期間、つまり3月8日〜5月7日までの期間で、各ハッシュタグを使ったツイート件数の日次推移です。

なお、今回対象とするデータは、Social insight(Userlocal社)で取得したTwitterデータとします。

ハッシュタグ_件数推移


それぞれのハッシュタグを使ったツイートの日次件数推移の統計情報は下表のようになりました。

ハッシュタグ_統計情報


グラフや表からも分かるように、圧倒的に使われているのが「#StayHome」で、期中の一日平均は約6万件です。次に多いのが「#うちで過ごそう」の約1.8万件です。そして最も少ないのが「#StayAtHomeLives」の232件です。このツイート件数は、「#StayHome」の約0.4%にあたります。これほどにハッシュタグの使われ方には乖離があります。

 

各ハッシュタグの「拡散強度」を比較する

それぞれのハッシュタグが拡散したタイミングを見てみましょう。ここでは、前回の記事でも紹介したトレンド方式に基づき、各ハッシュタグの拡散強度を比較していきます。


前回の記事のおさらいとなりますが、トレンド方式は、その日(観測日)がツイート件数が急増したタイミングかどうかを、観測日前後の特定期間(観測期間)のツイート件数の予測推移から観測日のツイート件数の推定値を求め、実際の値との乖離度を計算し、一定の閾値よりも乖離が大きければ「拡散日」と判定する方法です。


乖離度は、「ツイート件数の乖離(観測日の実際のツイート件数ー観測日の推定ツイート件数)」 ÷ 「観測期間の標準偏差観測期間の標準偏差」によって求めています。


そして拡散強度とは、それぞれの日の実際のツイート件数と予測したツイート件数と比較して、どのくらいギャップがあるかを数値化したものです。

今回は6種のハッシュタグのうち、英語のハッシュタグ3種、#StayAtHome、#StayHome、#StayAtHomeSaveLivesの拡散強度を比較します。


 

#StayHome の拡散状態を見る

下図は最も件数が多かった「#StayHome」のツイート件数と、拡散強度の関係です。グラフの中で棒グラフが濃い青色になっているタイミングが、トレンド方式によって拡散期間と判定した期間を示しています。一方で、棒グラフが薄い青色のタイミングは、トレンド方式によって拡散状態は確認できたが、閾値の設定で拡散期間とは判定されなかった期間を示しています。

※具体的な拡散強度、拡散期間、拡散規模の計算方法は『日本セキュリティ・マネジメント学会誌 Vol.32, No.1, pp.3-15, 2018.5.』を参照ください。

ハッシュタグ_拡散強度StayHome

拡散期間として判定したのは、4月19日、20日の2日間のみ、拡散規模(拡散強度の和)は7.3となりました。4月10日付近もツイート件数が増加していますが、1週間程度をかけて段階的に増加したため、拡散期間と判定されるほどの急増と認められませんでした。

4月19日には、弊社note記事『全国のお菓子メーカーをつないだ「#おかしつなぎ」 チロルチョコ社長インタビュー』でご紹介した「#おかしつなぎ」のキャンペーン投稿が拡散の起点となりました。2.3万件のリツイートが発生しています。

 

また4月20日には、もうせ(@motulo)さんが開発した「密ですゲーム」の投稿に対し、17万件以上のリツイートが発生しています。マスコミなどでも取り上げられ、ずいぶん話題になりましたね。

https://twitter.com/motulo/status/1252024209678745601

 

 

#StayAtHome の拡散状態を見る

次に「#StayAtHome」です。ツイート件数は「#StayHome」の1/10もなく、この記事によると「#StayHome」は米国で、「#StayAtHome」は英国で多く使われる傾向が多いとのことです。

このハッシュタグでは、4月8日~4月10日の3日間が拡散期間として判定されています。拡散規模は8.3となり、「#StayHome」の7.3よりも大きくなっています。

ハッシュタグ_拡散強度StayAtHome


この期間では、人気声優の梶裕貴さんの公式アカウントからの以下のツイートが拡散の原因となりました。なお、このツイートには、「#StayHome」も使われています。

 

#StayAtHomeSaveLives  の拡散状態を見る

最後に、1日あたりのツイート件数が少なかった「#StayAtHomeSaveLives」の拡散強度です。

ハッシュタグ_拡散強度StayAtHomeSaveLives


このグラフでは、3月24日〜3月26日、4月8日~10日、4月21日~23日の3つの拡散期間が検知されました。最初の拡散期間(3月24日〜3月26日)は、該当するハッシュタグのツイート件数が30件程度であったものが、このツイートで1日のうちに800件程度まで急増したためです。

この急増の原因は、ミュージシャンであるYoshikiさんの以下のツイートです。この拡散期間中の拡散規模も85.2となり、3種のハッシュタグの中で最も大きな値を示しました。

 

次に、2回目(4月8日~10日)の拡散は以下のツイートが引き起こしています。LDH JAPAN 広報部の公式アカウントが、3種の英語のハッシュタグをすべて使って投稿しています。

 

また、4月8日には冒頭で紹介したTwitter JAPANのツイートもの拡散期間を生み出した原因の一つです。

そして3回目(4月21日~23日)の拡散は、TVアニメ『ジョジョの奇妙な冒険』シリーズの作画監督、アしや(芦谷)耕平さんの以下のツイートが拡散の原因です。こちらのツイートも3つのハッシュタグをすべて使用しています。

 

 

トレンド方式で検知する拡散期間の特性

3つのハッシュタグの拡散状態をトレンド方式で数値化した結果は以下の表のとおりです。

ハッシュタグ_統計トレンド方式


拡散期間については次のような特性があります。

①短期間に急増した場合のみを拡散期間と評価する

先述した「#StayHome」は、4月10日ごろに5日かけて4倍程度に増加しています。トレンド件数の日次推移グラフでも顕著な増加を確認することができます。このケースでは、拡散強度は1程度と検知しました。

しかしながら、トレンド方式では拡散強度3以上(乖離が観測期間の標準偏差の3倍以上)で拡散日と評価するため、拡散日にはなりません。これはツイート件数の増加が、特定の話題によってけん引されたものではなく、このハッシュタグの認知が広まったことによるものであることを示しています。

一方、拡散強度が最大だったのは「#StayAtHomeSaveLives」の3月24日の38.5です。3月23日のツイート件数が29に対し、3月24日は878件と、30倍に急増しています。その後、3月26日までは200件以上を維持していましたが、3月27日からは4月3日までは20~80件程度に下がりました。

このため、3月24日~3月26日の3日間とした拡散期間の拡散規模は85.20と、3つのハッシュタグの中で最多となりました。この現象を引き起こした主な要因が、様々な方の複数のツイートではなく、Yoshikiさんのただ1件のツイートであったためです。

②ツイート件数の絶対数には比例しない

期中の拡散期間は「#StayAtHomeSaveLives」が3回、「#StayHome」と「#StayAtHome」が1回ずつとなりました。トレンド方式は拡散強度をツイート件数の日次件数と予測値の乖離値を観測期間の標準偏差で割って算定しているため、ツイート件数の推移を相対値として評価します。

ツイート件数の絶対値が大きいから拡散期間と認定されやすくなる指標ではありません。このため、ツイート件数が「#StayHome」の0.4%程度であるにもかかわらず「#StayAtHomeSaveLives」のほうが拡散期間と評価される回数が多くなっています。

以上のように、トレンド方式は特定のキーワードやハッシュタグを含むツイート件数が、通常想定する件数から著しく乖離した値が発生した状態を検知する手法であることが分かります。

 

まとめ

ハッシュタグを使う目的には、一般に以下のようなものが考えられます。

(1)より多くの人にリーチする
(2)特定商品やサービスの認知を高める
(3)キャンペーンや意見募集などの応募ツイートの抽出キーワードとする

トレンド方式では、特定のハッシュタグやキーワードを含むツイート件数が急増した状態を数値化します。

特に(2)特定商品やサービスの認知状況や広告効果を評価する際や、(3)キャンペーンなど他ではほとんど使われていないハッシュタグを含むツイートを対象にした場合の効果測定に活用できると考えます。

いわゆるネット炎上など異常にツイート件数が増大した状態を検知したり、その状態を計測することにも活用できます。

また、トレンド方式は、ツイート件数の絶対数によらず、相対的な件数変化を数値化します。例えば毎日100件のツイートがある話題がある日500件に急増した際の拡散強度と、毎日1万件にツイートがある話題がある日5万件に急増した際の拡散強度はまったく同じになります。

このため世の中にすでに広く認知され日常的にたくさんのツイートが発生している商品と、あまり認知されていない商品で講じた施策の効果を比較することも可能です。

以上のように、トレンド方式はツイート件数の急増に着目したツイートの拡散状態を数値化する手法です。リプライ数、リツイート件数やインプレッション数などの絶対数で計測したネット上に実際に及ぼした影響と併せて分析することで、拡散状態をより詳細に把握することが可能になります。このことについては、後日の記事で説明したいと思います。

「こんなケースには使えないか?」「こんな場合はどうすればよいか?」といったご相談があれば、ぜひ下記までお問い合わせください。

 

 

ループス・コミュニケーションズでは、ソーシャルリスニングの戦略立案から導入、運用サポートまで、ソーシャルリスニングのビジネス活用支援を行っています。まずはお気軽にお問い合わせください。

 

COMMENT

AUTHOR PROFILE

  • 著者:福田浩至

株式会社ループス・コミュニケーションズ副社長、博士(情報管理)

多数の企業にて、ソーシャルメディアの効果的かつ安全な運営を支援しています。 特に、企業のソーシャルメディア活用におけるルール「ソーシャルメディア・ポリシー」策定や啓蒙教育など積極的な守りの仕組みづくりが専門領域です。

  • facebook
記事の一覧を見る

ARCHIVES