Tommyの日記

趣味でデータを集めて分析したり機械学習で予測したりしてます

”日本版Qアノン”はどこから来たのか - 機械学習とElasticsearchを用いたTwitter分析

f:id:tommy_htn:20210318014236p:plain

  • 発端
  • 疑問
  • やったこと
  • 分析結果
    • 全体のタグクラウド
    • グループ化の結果
      • グループ1:トランプ氏に興味を持つグループ
      • グループ2:トランプ氏が興味の中心だが中国にも関心があるグループ
      • グループ3:日米関係目線でトランプ氏に興味を持つグループ
      • グループ4:日中関係目線でトランプ氏に興味を持つグループ
      • グループ5:”ネット保守”的な傾向があるグループ
      • グループ6:より”ネット保守”的な傾向が強いグループ
      • グループ7:中国に特化した”ネット保守”グループ
      • グループ8:虎ノ門グループ
      • グループ9:米中関係に興味があるユーザーのグループ
      • グループ10:スーツ男子
  • 分析
  • 最後に

発端

アメリカ大統領にバイデン氏が就任してからすでに2ヶ月以上が経ちましたが、去年の11月頃は日本語圏でも大統領選挙をめぐっていろんな噂話が持ち上がりました。その中の一つに「ドミニオン疑惑」というものがありました。具体的には、Dominion Voting Systemsという北米企業(以下、ドミニオン社)が作っている投票機においてバイデン氏が有利になるような不正があったのではないか、というものです。

 

続きを読む

"飲み会"ツイート分析で新型コロナ陽性者急増を予測できるか?

発端

先日、以下の記事をはてなブックマークはてブ)で見かけました。

web.archive.org

とても興味深い研究だと思いますが、はてブでは検索ワードの妥当性やグラフの相関性に疑問を抱くコメントが散見され、なかなか厳しい意見が多かったようです。

 実のところ私も似たような分析を行っており、この記事を見つけた直後に以下のようなツイートをしました。

 ※いちおう断っておくと私は東邦大学の研究グループの関係者ではありません。

 後出しで「実は私もやってました」と言うことのダサさは理解していますが、上記記事の研究よりも相関性が高いグラフを描くことができたのでここでちょっとだけ報告させてください。

続きを読む