ドクターイエローで学ぶTwitterから効率よく情報収集する方法

2016年11月12日 0 投稿者: khws4v1

ドクターイエローみたいに不定期に走る列車を見るには速報性の高いTwitterで探すのが手っ取り早い方法です。
しかし、Twitterの検索はとにかくアホでノイズを拾いまくりです。
というわけで、ノイズの項目別に取り除く方法を知っておくと効率よく情報収集ができるわけです。

Twitterがアホなので「Yahoo!リアルタイム検索」を使う

そもそもTwitterの検索機能がアホならば「Yahoo!リアルタイム検索」を使えば大体解決します。
-RTを検索ワードに加えればリツイートも除外できます。

ユーザー名も検索に引っかかってしまう

%e7%af%84%e5%9b%b2%e3%82%92%e9%81%b8%e6%8a%9e_099

本文には「ドクターイエロー」は含まれていないが、ユーザー名に含まれている例。

Twitterの検索はなぜかユーザー名も検索に含めるため、検索ワードがユーザー名に含まれている場合、本文が全く関係ない場合でも検索に引っかかります。
こういったアカウントは個別に除外するしかなく、あまりにも多ければ「Yahoo!リアルタイム検索」を使ったほうが捗ると思います。

個別に除外する場合は

-from:screen_name

を検索ワードに追加します。
screen_nameは@から始まるアカウント名です。
@自体は含めません。

フォロワー稼ぎ

フォロワー稼ぎをするスパムアカウントは「拡散」「RT」「フォロー」といった単語を多用するので、

-拡散 -RT -フォロー

このようにマイナス検索を使えばキレイに消えます。

アフィリエイト

アフィリエイト目的のスパムアカウントは数が多いので消すのがなかなか難しいです。
Twitterの検索はURLの部分一致検索ができなくなってしまっているので、URLで除外することも不可能。
ちなみに

-filter:links

でリンクを含むツイートが全部除外されます。
アフィリエイトのリンクを含むツイートも消えますが、画像を含むツイートも消えます。